Überwachtes und unüberwachtes Lernen sind zwei grundlegende Arten von Paradigmen des maschinellen Lernens, die je nach Art der Daten und den Zielen der jeweiligen Aufgabe unterschiedliche Zwecke erfüllen. Für die Entwicklung effektiver Modelle für maschinelles Lernen ist es von entscheidender Bedeutung, zu verstehen, wann überwachtes Training im Vergleich zu unbeaufsichtigtem Training sinnvoll ist. Die Wahl zwischen diesen beiden Ansätzen hängt von der Verfügbarkeit der gekennzeichneten Daten, dem gewünschten Ergebnis und der zugrunde liegenden Struktur des Datensatzes ab.
Überwachtes Lernen ist eine Art maschinelles Lernen, bei dem das Modell anhand eines gekennzeichneten Datensatzes trainiert wird. Beim überwachten Lernen lernt der Algorithmus, Eingabedaten der richtigen Ausgabe zuzuordnen, indem ihm Trainingsbeispiele präsentiert werden. Diese Trainingsbeispiele bestehen aus Eingabe-Ausgabe-Paaren, wobei den Eingabedaten der entsprechende korrekte Ausgabe- oder Zielwert beigefügt ist. Das Ziel des überwachten Lernens besteht darin, eine Zuordnungsfunktion von Eingabevariablen zu Ausgabevariablen zu erlernen, die dann verwendet werden kann, um Vorhersagen über unsichtbare Daten zu treffen.
Überwachtes Lernen wird typischerweise verwendet, wenn die gewünschte Ausgabe bekannt ist und das Ziel darin besteht, die Beziehung zwischen den Eingabe- und Ausgabevariablen zu lernen. Es wird häufig bei Aufgaben wie der Klassifizierung angewendet, bei der das Ziel darin besteht, die Klassenbezeichnungen neuer Instanzen vorherzusagen, und bei der Regression, bei der das Ziel darin besteht, einen kontinuierlichen Wert vorherzusagen. Beispielsweise könnten Sie in einem überwachten Lernszenario ein Modell trainieren, um anhand des Inhalts der E-Mail und des als Spam/Nicht-Spam gekennzeichneten Status früherer E-Mails vorherzusagen, ob es sich bei einer E-Mail um Spam handelt oder nicht.
Andererseits ist unüberwachtes Lernen eine Art maschinelles Lernen, bei dem das Modell anhand eines unbeschrifteten Datensatzes trainiert wird. Beim unüberwachten Lernen lernt der Algorithmus Muster und Strukturen aus den Eingabedaten ohne explizite Rückmeldung zur korrekten Ausgabe. Das Ziel des unbeaufsichtigten Lernens besteht darin, die zugrunde liegende Struktur der Daten zu erkunden, verborgene Muster zu entdecken und aussagekräftige Erkenntnisse zu gewinnen, ohne dass beschriftete Daten erforderlich sind.
Unüberwachtes Lernen wird häufig verwendet, wenn das Ziel darin besteht, die Daten zu untersuchen, versteckte Muster zu finden und ähnliche Datenpunkte zu gruppieren. Es wird häufig bei Aufgaben wie dem Clustering angewendet, bei dem das Ziel darin besteht, ähnliche Datenpunkte basierend auf ihren Merkmalen in Clustern zu gruppieren, und bei der Dimensionsreduzierung, bei der das Ziel darin besteht, die Anzahl der Merkmale zu reduzieren und gleichzeitig die wesentlichen Informationen in den Daten beizubehalten. Beispielsweise könnten Sie in einem unüberwachten Lernszenario mithilfe von Clustering Kunden anhand ihres Kaufverhaltens gruppieren, ohne vorher über Kundensegmente Bescheid zu wissen.
Die Wahl zwischen überwachtem und unüberwachtem Lernen hängt von mehreren Faktoren ab. Wenn Sie über einen beschrifteten Datensatz verfügen und bestimmte Ergebnisse vorhersagen möchten, ist überwachtes Lernen die richtige Wahl. Wenn Sie hingegen über einen unbeschrifteten Datensatz verfügen und die Datenstruktur erkunden oder versteckte Muster finden möchten, ist unüberwachtes Lernen besser geeignet. In einigen Fällen kann eine Kombination aus überwachten und unbeaufsichtigten Techniken, das sogenannte halbüberwachte Lernen, verwendet werden, um die Vorteile beider Ansätze zu nutzen.
Die Entscheidung, überwachtes Training gegenüber unbeaufsichtigtem Training beim maschinellen Lernen zu verwenden, hängt von der Verfügbarkeit gekennzeichneter Daten, der Art der Aufgabe und dem gewünschten Ergebnis ab. Das Verständnis der Unterschiede zwischen überwachtem und unüberwachtem Lernen ist für die Entwicklung effektiver Modelle für maschinelles Lernen unerlässlich, die aussagekräftige Erkenntnisse gewinnen und aus Daten genaue Vorhersagen treffen können.
Weitere aktuelle Fragen und Antworten zu EITC/AI/GCML Google Cloud Maschinelles Lernen:
- Was ist Text to Speech (TTS) und wie funktioniert es mit KI?
- Welche Einschränkungen gibt es bei der Arbeit mit großen Datensätzen beim maschinellen Lernen?
- Kann maschinelles Lernen eine dialogische Unterstützung leisten?
- Was ist der TensorFlow-Spielplatz?
- Was bedeutet eigentlich ein größerer Datensatz?
- Was sind einige Beispiele für Hyperparameter von Algorithmen?
- Was ist Ensemble-Lernen?
- Was passiert, wenn ein ausgewählter Algorithmus für maschinelles Lernen nicht geeignet ist und wie kann man sicherstellen, dass man den richtigen Algorithmus auswählt?
- Benötigt ein maschinelles Lernmodell während seines Trainings eine Betreuung?
- Welche Schlüsselparameter werden in auf neuronalen Netzwerken basierenden Algorithmen verwendet?
Weitere Fragen und Antworten finden Sie in EITC/AI/GCML Google Cloud Machine Learning