Beim Training eines Modells für maschinelles Lernen wird es mit riesigen Datenmengen konfrontiert, damit es Muster lernen und Vorhersagen oder Entscheidungen treffen kann, ohne dass es für jedes Szenario explizit programmiert werden muss. Während der Trainingsphase durchläuft das maschinelle Lernmodell eine Reihe von Iterationen, in denen es seine internen Parameter anpasst, um Fehler zu minimieren und seine Leistung bei der gegebenen Aufgabe zu verbessern.
Die Überwachung während des Trainings bezieht sich auf das Maß an menschlichem Eingreifen, das erforderlich ist, um den Lernprozess des Modells zu steuern. Der Bedarf an Aufsicht kann je nach Art des verwendeten Algorithmus für maschinelles Lernen, der Komplexität der Aufgabe und der Qualität der für das Training bereitgestellten Daten variieren.
Beim überwachten Lernen, einer Form des maschinellen Lernens, bei dem das Modell anhand gekennzeichneter Daten trainiert wird, ist Überwachung unerlässlich. Beschriftete Daten bedeuten, dass jeder Eingabedatenpunkt mit der richtigen Ausgabe gepaart wird, sodass das Modell die Zuordnung zwischen Eingaben und Ausgaben lernen kann. Während des überwachten Trainings ist eine menschliche Aufsicht erforderlich, um die richtigen Bezeichnungen für die Trainingsdaten bereitzustellen, die Vorhersagen des Modells auszuwerten und die Parameter des Modells basierend auf dem Feedback anzupassen.
Wenn beispielsweise bei einer überwachten Bilderkennungsaufgabe das Ziel darin besteht, einem Modell beizubringen, Bilder von Katzen und Hunden zu klassifizieren, müsste ein menschlicher Vorgesetzter jedes Bild entweder als Katze oder als Hund kennzeichnen. Das Modell würde dann aus diesen gekennzeichneten Beispielen lernen, Vorhersagen über neue, unsichtbare Bilder zu treffen. Der Supervisor würde die Vorhersagen des Modells bewerten und Feedback geben, um seine Genauigkeit zu verbessern.
Andererseits erfordern unüberwachte Lernalgorithmen keine gekennzeichneten Daten für das Training. Diese Algorithmen lernen Muster und Strukturen aus den Eingabedaten ohne explizite Anleitung. Unüberwachtes Lernen wird häufig für Aufgaben wie Clustering, Anomalieerkennung und Dimensionsreduzierung eingesetzt. Beim unüberwachten Lernen kann die Maschine selbstständig lernen, ohne dass während des Trainings eine menschliche Aufsicht erforderlich ist.
Halbüberwachtes Lernen ist ein hybrider Ansatz, der Elemente sowohl des überwachten als auch des unüberwachten Lernens kombiniert. Bei diesem Ansatz wird das Modell anhand einer Kombination aus gekennzeichneten und unbeschrifteten Daten trainiert. Die beschrifteten Daten bieten eine gewisse Aufsicht zur Steuerung des Lernprozesses, während die unbeschrifteten Daten es dem Modell ermöglichen, zusätzliche Muster und Beziehungen in den Daten zu entdecken.
Reinforcement Learning ist ein weiteres Paradigma des maschinellen Lernens, bei dem ein Agent lernt, durch Interaktion mit einer Umgebung sequentielle Entscheidungen zu treffen. Beim Reinforcement Learning erhält der Agent auf Grundlage seiner Handlungen Feedback in Form von Belohnungen oder Strafen. Der Agent lernt, seine kumulative Belohnung im Laufe der Zeit durch Versuch und Irrtum zu maximieren. Während Verstärkungslernen keine explizite Aufsicht im herkömmlichen Sinne erfordert, kann eine menschliche Aufsicht erforderlich sein, um die Belohnungsstruktur zu entwerfen, die Lernziele festzulegen oder den Lernprozess zu optimieren.
Der Bedarf an Aufsicht während des maschinellen Lerntrainings hängt vom verwendeten Lernparadigma, der Verfügbarkeit gekennzeichneter Daten und der Komplexität der Aufgabe ab. Überwachtes Lernen erfordert menschliche Aufsicht, um gekennzeichnete Daten bereitzustellen und die Leistung des Modells zu bewerten. Unüberwachtes Lernen erfordert keine Aufsicht, da das Modell unabhängig aus unbeschrifteten Daten lernt. Halbüberwachtes Lernen kombiniert Elemente sowohl des überwachten als auch des unbeaufsichtigten Lernens, während das verstärkende Lernen das Lernen durch Interaktion mit einer Umgebung beinhaltet.
Weitere aktuelle Fragen und Antworten zu EITC/AI/GCML Google Cloud Maschinelles Lernen:
- Was ist Text to Speech (TTS) und wie funktioniert es mit KI?
- Welche Einschränkungen gibt es bei der Arbeit mit großen Datensätzen beim maschinellen Lernen?
- Kann maschinelles Lernen eine dialogische Unterstützung leisten?
- Was ist der TensorFlow-Spielplatz?
- Was bedeutet eigentlich ein größerer Datensatz?
- Was sind einige Beispiele für Hyperparameter von Algorithmen?
- Was ist Ensemble-Lernen?
- Was passiert, wenn ein ausgewählter Algorithmus für maschinelles Lernen nicht geeignet ist und wie kann man sicherstellen, dass man den richtigen Algorithmus auswählt?
- Welche Schlüsselparameter werden in auf neuronalen Netzwerken basierenden Algorithmen verwendet?
- Was ist TensorBoard?
Weitere Fragen und Antworten finden Sie in EITC/AI/GCML Google Cloud Machine Learning