Woher weiß man, wann man beaufsichtigtes oder unbeaufsichtigtes Training nutzen sollte?

by Patricia Manuelita Izquierdo Sarmiento / Dienstag, 27 Februar 2024 / Veröffentlicht in Artificial Intelligence, EITC/AI/GCML Google Cloud Maschinelles Lernen, Einleitung, Was ist maschinelles Lernen?

Überwachtes und unüberwachtes Lernen sind zwei grundlegende Arten von Paradigmen des maschinellen Lernens, die je nach Art der Daten und den Zielen der jeweiligen Aufgabe unterschiedliche Zwecke erfüllen. Für die Entwicklung effektiver Modelle für maschinelles Lernen ist es von entscheidender Bedeutung, zu verstehen, wann überwachtes Training im Vergleich zu unbeaufsichtigtem Training sinnvoll ist. Die Wahl zwischen diesen beiden Ansätzen hängt von der Verfügbarkeit der gekennzeichneten Daten, dem gewünschten Ergebnis und der zugrunde liegenden Struktur des Datensatzes ab.

Überwachtes Lernen ist eine Art maschinelles Lernen, bei dem das Modell anhand eines gekennzeichneten Datensatzes trainiert wird. Beim überwachten Lernen lernt der Algorithmus, Eingabedaten der richtigen Ausgabe zuzuordnen, indem ihm Trainingsbeispiele präsentiert werden. Diese Trainingsbeispiele bestehen aus Eingabe-Ausgabe-Paaren, wobei den Eingabedaten der entsprechende korrekte Ausgabe- oder Zielwert beigefügt ist. Das Ziel des überwachten Lernens besteht darin, eine Zuordnungsfunktion von Eingabevariablen zu Ausgabevariablen zu erlernen, die dann verwendet werden kann, um Vorhersagen über unsichtbare Daten zu treffen.

Überwachtes Lernen wird typischerweise verwendet, wenn die gewünschte Ausgabe bekannt ist und das Ziel darin besteht, die Beziehung zwischen den Eingabe- und Ausgabevariablen zu lernen. Es wird häufig bei Aufgaben wie der Klassifizierung angewendet, bei der das Ziel darin besteht, die Klassenbezeichnungen neuer Instanzen vorherzusagen, und bei der Regression, bei der das Ziel darin besteht, einen kontinuierlichen Wert vorherzusagen. Beispielsweise könnten Sie in einem überwachten Lernszenario ein Modell trainieren, um anhand des Inhalts der E-Mail und des als Spam/Nicht-Spam gekennzeichneten Status früherer E-Mails vorherzusagen, ob es sich bei einer E-Mail um Spam handelt oder nicht.

Andererseits ist unüberwachtes Lernen eine Art maschinelles Lernen, bei dem das Modell anhand eines unbeschrifteten Datensatzes trainiert wird. Beim unüberwachten Lernen lernt der Algorithmus Muster und Strukturen aus den Eingabedaten ohne explizite Rückmeldung zur korrekten Ausgabe. Das Ziel des unbeaufsichtigten Lernens besteht darin, die zugrunde liegende Struktur der Daten zu erkunden, verborgene Muster zu entdecken und aussagekräftige Erkenntnisse zu gewinnen, ohne dass beschriftete Daten erforderlich sind.

Unüberwachtes Lernen wird häufig verwendet, wenn das Ziel darin besteht, die Daten zu untersuchen, versteckte Muster zu finden und ähnliche Datenpunkte zu gruppieren. Es wird häufig bei Aufgaben wie dem Clustering angewendet, bei dem das Ziel darin besteht, ähnliche Datenpunkte basierend auf ihren Merkmalen in Clustern zu gruppieren, und bei der Dimensionsreduzierung, bei der das Ziel darin besteht, die Anzahl der Merkmale zu reduzieren und gleichzeitig die wesentlichen Informationen in den Daten beizubehalten. Beispielsweise könnten Sie in einem unüberwachten Lernszenario mithilfe von Clustering Kunden anhand ihres Kaufverhaltens gruppieren, ohne vorher über Kundensegmente Bescheid zu wissen.

Die Wahl zwischen überwachtem und unüberwachtem Lernen hängt von mehreren Faktoren ab. Wenn Sie über einen beschrifteten Datensatz verfügen und bestimmte Ergebnisse vorhersagen möchten, ist überwachtes Lernen die richtige Wahl. Wenn Sie hingegen über einen unbeschrifteten Datensatz verfügen und die Datenstruktur erkunden oder versteckte Muster finden möchten, ist unüberwachtes Lernen besser geeignet. In einigen Fällen kann eine Kombination aus überwachten und unbeaufsichtigten Techniken, das sogenannte halbüberwachte Lernen, verwendet werden, um die Vorteile beider Ansätze zu nutzen.

Die Entscheidung, überwachtes Training gegenüber unbeaufsichtigtem Training beim maschinellen Lernen zu verwenden, hängt von der Verfügbarkeit gekennzeichneter Daten, der Art der Aufgabe und dem gewünschten Ergebnis ab. Das Verständnis der Unterschiede zwischen überwachtem und unüberwachtem Lernen ist für die Entwicklung effektiver Modelle für maschinelles Lernen unerlässlich, die aussagekräftige Erkenntnisse gewinnen und aus Daten genaue Vorhersagen treffen können.

Weitere aktuelle Fragen und Antworten zu EITC/AI/GCML Google Cloud Maschinelles Lernen:

Weitere Fragen und Antworten finden Sie in EITC/AI/GCML Google Cloud Machine Learning

Weitere Fragen und Antworten:

Feld: Artificial Intelligence
Programm: EITC/AI/GCML Google Cloud Maschinelles Lernen (Gehen Sie zum Zertifizierungsprogramm)
Lektion: Einleitung (Gehen Sie zur entsprechenden Lektion)
Thema: Was ist maschinelles Lernen? (Gehen Sie zum verwandten Thema)

Tagged unter: Artificial Intelligence, Daten Wissenschaft, Cumolocity, Maschinelles lernen, Überwachtes Lernen, Unbeaufsichtigtes Lernen

EITCA-Akademie

Woher weiß man, wann man beaufsichtigtes oder unbeaufsichtigtes Training nutzen sollte?

Weitere aktuelle Fragen und Antworten zu EITC/AI/GCML Google Cloud Maschinelles Lernen:

Weitere Fragen und Antworten:

Die EITCA Academy ist Teil des europäischen IT-Zertifizierungsrahmens

Berechtigung für die EITCA Academy 80 % EITCI DSJC Subventionsunterstützung

EITCA-Akademie

Melden Sie sich entweder mit Ihrem Benutzernamen oder Ihrer E-Mail-Adresse bei Ihrem Konto an

VERGESSEN SIE IHRE DETAILS?

EIN KONTO ERSTELLEN

Woher weiß man, wann man beaufsichtigtes oder unbeaufsichtigtes Training nutzen sollte?

Weitere aktuelle Fragen und Antworten zu EITC/AI/GCML Google Cloud Maschinelles Lernen:

Weitere Fragen und Antworten:

Berechtigung für die EITCA Academy 80 % EITCI DSJC Subventionsunterstützung