Um ein Modell mit AutoML Vision zu trainieren, können Sie einem schrittweisen Prozess folgen, der Datenvorbereitung, Modelltraining und Bewertung umfasst. AutoML Vision ist ein leistungsstarkes Tool von Google Cloud, das das Training benutzerdefinierter Modelle für maschinelles Lernen für Bilderkennungsaufgaben vereinfacht. Es nutzt Deep-Learning-Algorithmen und automatisiert viele der komplexen Aufgaben beim Modelltraining.
Der erste Schritt beim Trainieren eines Modells mit AutoML Vision besteht darin, Ihre Trainingsdaten zu sammeln und vorzubereiten. Diese Daten sollten aus einer Reihe beschrifteter Bilder bestehen, die die verschiedenen Klassen oder Kategorien darstellen, die Ihr Modell erkennen soll. Es ist wichtig sicherzustellen, dass Ihre Trainingsdaten vielfältig und repräsentativ für die realen Szenarien sind, die Ihr Modell voraussichtlich erleben wird. Je vielfältiger und umfassender Ihre Trainingsdaten sind, desto besser kann Ihr Modell verallgemeinern und genaue Vorhersagen treffen.
Sobald Sie Ihre Trainingsdaten bereit haben, können Sie mit dem nächsten Schritt fortfahren, nämlich der Erstellung eines Datensatzes in der AutoML Vision-Schnittstelle. Dazu müssen Sie Ihre Trainingsbilder hochladen und für jedes Bild die entsprechenden Beschriftungen bereitstellen. AutoML Vision unterstützt verschiedene Bildformate, darunter JPEG und PNG. Darüber hinaus können Sie auch Begrenzungsrahmen für Objekterkennungsaufgaben bereitstellen, was die Fähigkeiten Ihres Modells weiter verbessert.
Nachdem Sie den Datensatz erstellt haben, können Sie mit dem Modelltrainingsprozess beginnen. AutoML Vision verwendet eine Technik namens Transfer Learning, die es Ihnen ermöglicht, vorab trainierte Modelle zu nutzen, die anhand umfangreicher Datensätze trainiert wurden. Dieser Ansatz reduziert die Menge an Trainingsdaten und Rechenressourcen, die zum Erreichen einer guten Leistung erforderlich sind, erheblich. AutoML Vision bietet eine Auswahl vorab trainierter Modelle wie EfficientNet und MobileNet, aus denen Sie je nach Ihren spezifischen Anforderungen auswählen können.
Während des Trainingsprozesses optimiert AutoML Vision das vorab trainierte Modell mithilfe Ihrer gekennzeichneten Trainingsdaten. Es passt die Parameter des Modells automatisch an und optimiert die Architektur des Modells, um seine Leistung für Ihre spezifische Aufgabe zu verbessern. Der Trainingsprozess ist in der Regel iterativ und umfasst mehrere Epochen oder Iterationen, um die Genauigkeit des Modells schrittweise zu verbessern. AutoML Vision führt außerdem Datenerweiterungstechniken wie zufällige Rotationen und Flips durch, um die Generalisierungsfähigkeiten des Modells weiter zu verbessern.
Sobald das Training abgeschlossen ist, stellt Ihnen AutoML Vision Bewertungsmetriken zur Verfügung, mit denen Sie die Leistung Ihres Modells bewerten können. Zu diesen Metriken gehören Präzision, Erinnerung und der F1-Score, der die Fähigkeit des Modells misst, Bilder korrekt zu klassifizieren. Sie können die Vorhersagen des Modells auch in einem Validierungsdatensatz visualisieren, um Einblicke in seine Stärken und Schwächen zu gewinnen. Mit AutoML Vision können Sie Ihr Modell iterieren, indem Sie die Trainingsdaten verfeinern, Hyperparameter anpassen und das Modell neu trainieren, um seine Leistung zu verbessern.
Wenn Sie mit der Leistung Ihres trainierten Modells zufrieden sind, können Sie es einsetzen, um Vorhersagen für neue, noch nie gesehene Bilder zu treffen. AutoML Vision bietet eine REST-API, mit der Sie Ihr Modell in Ihre Anwendungen oder Dienste integrieren können. Sie können Bilddaten an die API senden und diese gibt die vorhergesagten Beschriftungen oder Begrenzungsrahmen basierend auf der Schlussfolgerung des trainierten Modells zurück.
Das Training eines Modells mit AutoML Vision umfasst Datenvorbereitung, Datensatzerstellung, Modelltraining, Bewertung und Bereitstellung. Wenn Sie diesem Prozess folgen, können Sie die Leistungsfähigkeit von AutoML Vision nutzen, um benutzerdefinierte Modelle für maschinelles Lernen für Bilderkennungsaufgaben zu trainieren, ohne dass umfangreiche Kenntnisse über Deep-Learning-Algorithmen oder die Einrichtung der Infrastruktur erforderlich sind.
Weitere aktuelle Fragen und Antworten zu Fortschritte im maschinellen Lernen:
- Inwieweit vereinfacht Kubeflow tatsächlich die Verwaltung von Machine-Learning-Workflows auf Kubernetes, wenn man die zusätzliche Komplexität der Installation, Wartung und den Lernaufwand für multidisziplinäre Teams berücksichtigt?
- Wie kann ein Colab-Experte die Nutzung freier GPU/TPU optimieren, die Datenpersistenz und Abhängigkeiten zwischen Sitzungen verwalten und Reproduzierbarkeit und Zusammenarbeit in groß angelegten Data-Science-Projekten gewährleisten?
- Wie beeinflussen die Ähnlichkeit zwischen Quell- und Zieldatensätzen, Regularisierungstechniken und die Wahl der Lernrate die Effektivität des Transferlernens über TensorFlow Hub?
- Worin unterscheidet sich der Ansatz der Merkmalsextraktion vom Feinabstimmen beim Transferlernen mit TensorFlow Hub, und in welchen Situationen ist welcher Ansatz besser geeignet?
- Was verstehen Sie unter Transferlernen und wie sehen Sie den Zusammenhang zu den vortrainierten Modellen, die von TensorFlow Hub angeboten werden?
- Wenn Ihr Laptop Stunden benötigt, um ein Modell zu trainieren, wie würden Sie eine VM mit GPU und JupyterLab nutzen, um den Prozess zu beschleunigen und Abhängigkeiten zu organisieren, ohne Ihre Umgebung zu beschädigen?
- Wenn ich bereits lokal mit Notebooks arbeite, warum sollte ich JupyterLab auf einer VM mit GPU nutzen? Wie verwalte ich Abhängigkeiten (pip/conda), Daten und Berechtigungen, ohne meine Umgebung zu beschädigen?
- Kann jemand ohne Erfahrung in Python und mit grundlegenden KI-Kenntnissen TensorFlow.js verwenden, um ein aus Keras konvertiertes Modell zu laden, die model.json-Datei und die Shards zu interpretieren und interaktive Echtzeitvorhersagen im Browser zu gewährleisten?
- Wie kann ein Experte für künstliche Intelligenz, der aber ein Anfänger in der Programmierung ist, von TensorFlow.js profitieren?
- Wie sieht der vollständige Arbeitsablauf für die Vorbereitung und das Training eines benutzerdefinierten Bildklassifizierungsmodells mit AutoML Vision aus, von der Datenerfassung bis zur Modellbereitstellung?
Weitere Fragen und Antworten finden Sie unter „Advancing in Machine Learning“.

