6 results on '"Klassifizierung"'
Search Results
2. Vergleich von Plattformen für maschinelles Lernen mit handgefertigten Modellen
- Author
-
Scheibelhofer, Thomas
- Subjects
Machine Learning ,Artificial Intelligence ,Platform ,Künstliche Intelligenz ,Plattform ,Machinelles Lernen ,Klassifizierung ,Classification - Abstract
Künstliche Intelligenz (KI) und maschinelles Lernen (ML) sind heute ständige Begleiter, manchmal offensichtlich, aber meistens treiben sie die Tools im Hintergrund an. Es ist an einem Punkt angelangt, an dem ML zugänglicher denn je ist und ML-Modelle mit nur wenigen Klicks für alltägliche Anwendungsfälle generiert werden können. Darüber hinaus besteht das Publikum jetzt nicht mehr nur aus Data Scientists oder ML-Ingenieuren, sondern aus Entwicklern oder Personen ohne ML-Kenntnisse. Dies wird maßgeblich durch Paradigmenwechsel im letzten Jahrzehnt unterstützt, nämlich die weit verbreitete Nutzung von Cloud-Diensten und die damit verbundenen Pay-Per-Use (PPU)-Möglichkeiten in Form von Machine-Learning-as-a-Service (MLaaS). Diese Arbeit zielte darauf ab, die Idee in Frage zu stellen, ob man heutzutage noch ein tiefes Verständnis von ML haben muss, um dessen Vorteile zu nutzen. Der Autor verglich dazu die Leistung mehrerer bekannter ML-Algorithmen, welche von Hand in benutzerdefinierte Modelle wie neuronale Netze oder Random Forests eingearbeitet wurden, sowie einen Showcase einer eigens erstellten generischen ML-Plattform welche automatisierte ML-Prozesse nutzte, zu einigen der Angebote der Tech Giants. Nämlich Microsoft Automated ML, Google Vertex AI und Amazon Sagemaker Autopilot. Alle Modelle und Plattformen wurden mit demselben Datensatz trainiert, was den Trainingsprozess etwas erschwerte, da dessen Klassen stark unausgewogen waren. Schließlich bewertete und verglich der Autor die Modelle basierend auf Genauigkeit, F1- (gewichteten) und F1- (Makro) Werten. Der Autor kam zu dem Schluss, dass die Zeit, der Aufwand und die Fähigkeiten, die zum Erstellen benutzerdefinierter Modelle erforderlich sind, möglicherweise nicht gerechtfertigt sind, obwohl eines von ihnen die beste Leistung erbracht hat. Darüber hinaus schnitten alle Plattformen, einschließlich der eigens erstellten Plattform, auf einem ziemlich ähnlichen Niveau ab. Die Empfehlung des Autors für Unternehmensumgebungen war, nach Möglichkeit proprietäre ML-Plattformen zu verwenden und nur dann, wenn dies nicht der Fall ist, auf die Erstellung einer eigenen Plattform als Mittel zur Orchestrierung zurückzugreifen oder benutzerdefinierte Modelle zu verwenden. Abschließend kommt der Autor zu dem Schluss, dass in der Wissenschaft der automatisierte ML-Ansatz jedoch zu einschränkend wäre, um neue Erkenntnisse zu gewinnen. Today, Artificial Intelligence (AI) and Machine Learning (ML) are constant companions, sometimes apparent, but mostly they power the tools in the background. It has come to a point, where ML is more accessible than ever and ML models can be generated with only a few clicks for everyday use-cases. Additionally, the audience is now not only Data Scientists or ML engineers, but developers or individuals without ML knowledge. This is largely supported by paradigm shifts happening over the past decade, namely the widespread use of cloud services and the Pay-Per-Use (PPU) possibilities coming with it in the form of Machine-Learning-as-a-Service (MLaaS). This thesis aimed to challenge the idea of having to have a deep understanding of ML in order to reap its benefits. The author was doing so by comparing the performance of several well-known ML algorithms, hand-crafted into customized models such as neural networks or random forests, as well as a show-case of a generic ML platform which leveraged automated ML processes, to several of the offerings of the Tech Giants. Namely Microsoft Automated ML, Google Vertex AI and Amazon Sagemaker Autopilot. All models and platforms were trained on the same data set, which added some difficulty to training process as its classes were heavily imbalanced. Finally, the author evaluated and compared the models based on accuracy, F1 (weighted) and F1 (macro) scores. The author concluded that the time, effort and skills needed to build custom models may not be justified, although one of them performed the best. Furthermore, all the platforms, including the custom platform, performed at a quite similar level. The authors recommendation for corporate environments was to use proprietary ML platforms whenever feasible and only when this is not the case, resort to creating their own platform as a means of orchestration or the use custom models. Lastly, the author concluded that in academia, however, the automated ML approach would be too restricting to gain new knowledge.
- Published
- 2022
3. Machine Learning methods in practice
- Author
-
Jirec, Philipp
- Subjects
K nearest neighbour ,tensorflow ,Medical Dataset ,overfitting ,neural network ,KNN ,attributes ,Machine Learning ,Scikit-learn ,medizinischer Datensatz ,unsupervised ,Scikit ,Series ,keras ,algorithm ,matplotlib ,Dataframe ,Pandas ,Datensatz ,prediction ,algorithmus ,klassifizierung ,classification ,vorhersage ,Numpy ,neurales netzwerk ,linear regression ,lineare regression ,supervised ,Attribute ,Python ,Dataset - Abstract
Diese Bachelorarbeit befasst sich mit der Systematik von Machine Learning Algorithmen und des Weiteren mit der Anwendung ausgewählter Algorithmen: Lineare Regression, K-Nearest Neighbours und neurale Netzwerke. Die Anwendbarkeit der genannten Algorithmen wird anhand eines medizinischen Datensatzes verglichen und bewertet. Bei dem ausgewählten Datensatz handelt es sich um eine Sammlung medizinischer, multivariater Daten, wobei sich dessen 4158 Datenpunkte aus einem Umfang von 14 Attributen, ermittelt an 297 Individuen, ergibt. Diese 14 Attribute setzen sich aus 13 gemessenen medizinischen Werten, sowie einer angiographisch ermittelten Diagnose zusammen, wobei die Diagnose von den genannten Algorithmen vorhergesagt werden soll. Um das Ziel einer Vorhersage verwirklichen zu können wurden unter Python die Bibliotheken scikit-learn und TensorFlow verwendet. Die drei angewandten Algorithmen weisen bei der Vorhersage einer Diagnose eine hohe Genauigkeit auf, wobei sich neurale Netzwerke dabei am effizientesten erweisen. This bachelor thesis deals with the systematics of machine learning algorithms and further with the application of selected algorithms: Linear Regression, K-Nearest Neighbours and neural networks. The applicability of the mentioned algorithms is compared and evaluated using a medical dataset. The selected dataset is a collection of medical multivariate data, with its 4158 data points deriving from a set of 14 attributes determined on 297 individuals. These 14 attributes are composed of 13 measured medical values, as well as an angiographically determined diagnosis, where the diagnosis is to be predicted by the mentioned algorithms. To be able to accomplish the aim of making a prediction, python was used with the additional libraries scikit-learn and TensorFlow. The three applied algorithms show a high accuracy in predicting a diagnosis, whereby neural networks prove to be the most efficient.
- Published
- 2021
4. Intelligent prefetching for a grid-enabled distributed system : improving web access for a distributed grid system by enabling browser downloads combined with machine learning based prefetching and caching techniques
- Author
-
Prenner, Stefan
- Subjects
Machine Learning ,Benutzeroberfl��che ,Verteiltes Datenmanagement ,Prediction model ,Rucio ,Web Prefetching ,User Interface ,ATLAS ,Klassifizierung ,Classification ,Distributed Data Management ,Vorhersagemodell - Abstract
Gro��fl��chige Gridsysteme, wie das CERN Worldwide LHC Computing Grid (WLCG), haben oft mit Problemen zu k��mpfen, die sich aus einer Vielzahl von heterogenen Speichereinheiten ergeben. M��gliche Probleme umfassen unter anderem komplizierte Zugriffsmechanismen wegen unterschiedlicher Protokolle und ineffiziente Nutzung von Speicherressourcen. Im Rahmen dieser Arbeit wird die Frage des Umgangs mit unterschiedlichen Zugriffsprotokollen bei Browser-Downloads f��r Rucio, das verteilte Datenmanagementsystem von ATLAS, untersucht und ein Prototyp f��r Machine Learning-basiertes Prefetching mit Rucio-Daten entwickelt. Simulationsergebnisse zeigen, dass im Vergleich zu statischen Prefetching-Techniken mit einem Random Forest Klassifikator eine Erh��hung der Cache-Trefferrate von bis zu 20% erreicht werden kann., Large-scale grid systems, such as the CERN Worldwide LHC Computing Grid (WLCG), often have to deal with problems arising from a variety of heterogeneous storage units. Potential issues include complicated access due to different protocols, inefficient use of storage resources and many more. In the course of this thesis, the problem of dealing with different access protocols when handling browser downloads is solved for Rucio, the ATLAS distributed data management system, and a proof of concept for machine learning based prefetching is being developed using Rucio data. Simulation results show that, compared to static prefetching techniques, cache hit rate increases of up to 20% can be achieved with a Random Forest classifier.
- Published
- 2019
- Full Text
- View/download PDF
5. Musical Genre Classification of Audio
- Author
-
Pollack, David, Härdle, Wolfgang Karl, and Chen, Cathy
- Subjects
python ,Maschinelles Lernens ,machine learning ,classification ,attention RNN ,330 Wirtschaft ,audio ,ddc:330 ,deep learning ,Klassifizierung ,kunstliches Intelligenz ,ResNet - Abstract
Im Rahmen dieser Masterarbeit habe ich die verschiedenen Methoden und Modelle des Deep Learnings zur Klassifizierung von Musikgattungen erfoscht. Neben den klassischen Methoden basierend auf MFCC und Spektogrammen wurden ebenfalls die neusten Methoden der Deep Learning Forschung benutzt. Diese habe ich auf einen Audio-Datensatz von Google Research angewendet. Der Code für dieses Projekt wurde in der Programmiersprache Python geschrieben und auf Quantlet sowie GitHub veröffentlicht., I researched different preparation methods and models to classify musical genre of audio data. We began with classical preparation methods based on MFCCs and spectrograms and moved to methods on the cutting edge of deep learning such as attention-based RNNs and dilated convolutions. We utilized the Audioset dataset from Google Research and all of our code was written in the Python programming language. A copy of the code used in this project can be found on Quantlet and GitHub.
- Published
- 2018
- Full Text
- View/download PDF
6. Klassifizierung von Gefahrstoffen durch laserinduzierte Fluoreszenz (LIF) in der Ferndetektion
- Author
-
Walter, Arne, Köhntopp, Anja, Kraus, Marian, Gebert, Florian, Fellner, Lea, and Duschek, Frank
- Subjects
Machine Learning ,KI ,LIF ,Atmosphärische Propagation und Wirkung ,Stand-off Detektion ,Klassifizierung ,Ferndetektion ,Fluoreszenz - Published
- 2018
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.