Unterschied zwischen überwachtem und unüberwachtem maschinellem Lernen

Schlüsseldifferenz - überwacht vs Unbeaufsichtigt Maschinelles lernen
 

Überwachtes Lernen und unüberwachtes Lernen sind zwei zentrale Konzepte des maschinellen Lernens. Überwachtes Lernen ist eine Machine Learning-Aufgabe, bei der eine Funktion erlernt wird, die eine Eingabe einer Ausgabe auf der Grundlage der Beispiel-Eingabe-Ausgabe-Paare zuordnet. Unüberwachtes Lernen ist das Maschinelle Lernen, bei dem auf eine Funktion zum Beschreiben verborgener Strukturen aus nicht beschrifteten Daten geschlossen wird. Das Hauptunterschied zwischen beaufsichtigtem und unüberwachtem maschinellem Lernen ist das Das überwachte Lernen verwendet markierte Daten, während das unbeaufsichtigte Lernen nicht markierte Daten verwendet.

Maschinelles Lernen ist ein Bereich der Informatik, der es einem Computersystem ermöglicht, aus Daten zu lernen, ohne explizit programmiert zu werden. Es erlaubt die Daten zu analysieren und Muster darin vorherzusagen. Es gibt viele Anwendungen des maschinellen Lernens. Einige davon sind Gesichtserkennung, Gestenerkennung und Spracherkennung. Es gibt verschiedene Algorithmen für das maschinelle Lernen. Einige von ihnen sind Regression, Klassifizierung und Clustering. Die am häufigsten verwendeten Programmiersprachen für die Entwicklung von auf maschinellem Lernen basierenden Anwendungen sind R und Python. Andere Sprachen wie Java, C ++ und Matlab können ebenfalls verwendet werden.

INHALT

1. Übersicht und Schlüsseldifferenz
2. Was ist überwachtes Lernen?
3. Was ist unbeaufsichtigtes Lernen?
4. Ähnlichkeiten zwischen überwachtem und unüberwachtem maschinellem Lernen
5. Side-by-Side-Vergleich - Überwachtes oder Unüberwachtes Maschinelles Lernen in Tabellenform
6. Zusammenfassung

Was ist überwachtes Lernen??

In auf maschinellem Lernen basierenden Systemen arbeitet das Modell nach einem Algorithmus. Beim beaufsichtigten Lernen wird das Modell überwacht. Zunächst muss das Modell trainiert werden. Mit dem gewonnenen Wissen kann es Antworten für die zukünftigen Instanzen vorhersagen. Das Modell wird mit einem beschrifteten Datensatz trainiert. Wenn dem System Out-of-Sample-Daten übermittelt werden, kann das Ergebnis vorhergesagt werden. Es folgt ein kleiner Auszug aus dem beliebten IRIS-Datensatz.

Gemäß der obigen Tabelle werden Sepal-Länge, Sepal-Breite, Patel-Länge, Patel-Breite und Spezies als Attribute bezeichnet. Die Spalten werden als Features bezeichnet. Eine Zeile enthält Daten für alle Attribute. Daher wird eine Reihe als Beobachtung bezeichnet. Die Daten können entweder numerisch oder kategorisch sein. Das Modell erhält die Beobachtungen mit dem entsprechenden Artennamen als Eingabe. Wenn eine neue Beobachtung erfolgt, sollte das Modell die Art der Art vorhersagen, zu der es gehört.

Beim beaufsichtigten Lernen gibt es Algorithmen zur Klassifizierung und Regression. Klassifizierung ist der Prozess der Klassifizierung der markierten Daten. Das Modell erstellte Grenzen, die die Datenkategorien trennten. Wenn neue Daten für das Modell bereitgestellt werden, kann es basierend auf dem Punkt, an dem der Punkt vorhanden ist, kategorisiert werden. Das K-Nearest Neighbours (KNN) ist ein Klassifizierungsmodell. Abhängig vom k-Wert wird die Kategorie festgelegt. Wenn k beispielsweise 5 ist und ein bestimmter Datenpunkt in der Nähe von acht Datenpunkten in Kategorie A und sechs Datenpunkten in Kategorie B liegt, wird der Datenpunkt als A klassifiziert.

Die Regression ist der Prozess der Vorhersage des Trends der vorherigen Daten, um das Ergebnis der neuen Daten vorherzusagen. Bei der Regression kann die Ausgabe aus einer oder mehreren kontinuierlichen Variablen bestehen. Die Vorhersage erfolgt mit einer Linie, die die meisten Datenpunkte abdeckt. Das einfachste Regressionsmodell ist eine lineare Regression. Es ist schnell und erfordert keine Einstellparameter wie in KNN. Wenn die Daten einen parabolischen Trend zeigen, ist das lineare Regressionsmodell nicht geeignet.

Dies sind einige Beispiele für beaufsichtigte Lernalgorithmen. Im Allgemeinen sind die mit überwachten Lernmethoden generierten Ergebnisse genauer und zuverlässiger, da die Eingabedaten bekannt und gekennzeichnet sind. Daher muss die Maschine nur die verborgenen Muster analysieren.

Was ist unbeaufsichtigtes Lernen??

Beim unbeaufsichtigten Lernen wird das Modell nicht überwacht. Das Modell arbeitet von selbst, um die Ergebnisse vorherzusagen. Es verwendet Machine-Learning-Algorithmen, um Schlussfolgerungen zu nicht markierten Daten zu ziehen. Im Allgemeinen sind die unüberwachten Lernalgorithmen schwieriger als überwachte Lernalgorithmen, da es nur wenige Informationen gibt. Clustering ist eine Art unüberwachtes Lernen. Es kann verwendet werden, um die unbekannten Daten mithilfe von Algorithmen zu gruppieren. Das k-mean und das dichtenbasierte Clustering sind zwei Clusteralgorithmen.

k-mean-Algorithmus, Platziert den K-Schwerpunkt zufällig für jeden Cluster. Dann wird jeder Datenpunkt dem nächstgelegenen Schwerpunkt zugeordnet. Die euklidische Entfernung wird verwendet, um die Entfernung vom Datenpunkt zum Schwerpunkt zu berechnen. Die Datenpunkte sind in Gruppen eingeteilt. Die Positionen für k Zentroide werden erneut berechnet. Die neue Schwerpunktposition wird durch den Mittelwert aller Punkte in der Gruppe bestimmt. Wieder ist jeder Datenpunkt dem nächstgelegenen Schwerpunkt zugeordnet. Dieser Vorgang wird wiederholt, bis sich die Schwerpunkte nicht mehr ändern. k-mean ist ein schneller Clustering-Algorithmus, es gibt jedoch keine spezifizierte Initialisierung von Clustering-Punkten. Es gibt auch große Unterschiede bei den Clustering-Modellen, die auf der Initialisierung der Clusterpunkte beruhen.

Ein weiterer Clustering-Algorithmus ist Dichte-basiertes Clustering. Es wird auch als dichtenbasierte Spatial Clustering-Anwendungen mit Rauschen bezeichnet. Es definiert einen Cluster als den maximalen Satz von mit Dichte verbundenen Punkten. Dies sind zwei Parameter, die für dichtebasiertes Clustering verwendet werden. Sie sind Ɛ (Epsilon) und Mindestpunkte. Ɛ ist der maximale Radius der Nachbarschaft. Die Mindestpunkte sind die Mindestanzahl von Punkten in der Umgebung von Ɛ, um einen Cluster zu definieren. Dies sind einige Beispiele für Clustering, die in unbeaufsichtigtes Lernen fallen.

Im Allgemeinen sind die Ergebnisse, die aus nicht überwachten Lernalgorithmen generiert werden, nicht sehr genau und zuverlässig, da die Maschine die Eingabedaten definieren und kennzeichnen muss, bevor die verborgenen Muster und Funktionen bestimmt werden.

Was ist die Ähnlichkeit zwischen überwachtem und unüberwachtem maschinellem Lernen??

  • Sowohl das überwachte als auch das nicht überwachte Lernen sind maschinelles Lernen.

Was ist der Unterschied zwischen überwachtem und unüberwachtem maschinellem Lernen??

Überwachtes oder unbeaufsichtigtes maschinelles Lernen

Überwachtes Lernen ist die Maschinelle Lernaufgabe, bei der eine Funktion erlernt wird, die eine Eingabe anhand von Beispiel-Eingabe-Ausgabe-Paaren einer Ausgabe zuordnet. Unüberwachtes Lernen ist die Maschinelle Lernaufgabe, bei der auf eine Funktion zur Beschreibung verborgener Strukturen aus nicht beschrifteten Daten geschlossen wird.
 Hauptfunktionalität
Beim überwachten Lernen prognostiziert das Modell das Ergebnis anhand der gekennzeichneten Eingangsdaten. Beim unbeaufsichtigten Lernen prognostiziert das Modell das Ergebnis ohne beschriftete Daten, indem es die Muster selbst identifiziert.
Genauigkeit der Ergebnisse
Die Ergebnisse aus überwachten Lernmethoden sind genauer und zuverlässiger. Die Ergebnisse der unbeaufsichtigten Lernmethoden sind nicht sehr genau und zuverlässig.
Hauptalgorithmen
Es gibt Algorithmen für die Regression und Klassifizierung im beaufsichtigten Lernen. Es gibt Algorithmen für das Clustering beim unbeaufsichtigten Lernen.

Zusammenfassung - überwacht vs Unbeaufsichtigt Maschinelles lernen

Überwachtes Lernen und unüberwachtes Lernen sind zwei Arten des maschinellen Lernens. Überwachtes Lernen ist die Maschinelle Lernaufgabe, bei der eine Funktion erlernt wird, die eine Eingabe anhand von Beispiel-Eingabe-Ausgabe-Paaren einer Ausgabe zuordnet. Unüberwachtes Lernen ist die Maschinelle Lernaufgabe, bei der auf eine Funktion zur Beschreibung verborgener Strukturen aus nicht beschrifteten Daten geschlossen wird. Der Unterschied zwischen überwachtem und unüberwachtem maschinellem Lernen besteht darin, dass überwachtes Lernen markierte Daten verwendet, während für unbeaufsichtigtes Lernen unbenannte Daten verwendet werden.

Referenz:

1.TheBigDataUniversity. Maschinelles Lernen - Überwachtes VS Unüberwachtes Lernen, kognitive Klasse, 13. März 2017. Hier verfügbar 
2. „Unbeaufsichtigtes Lernen“. Wikipedia, Wikimedia Foundation, 20. März 2018. Hier verfügbar 
3. „Überwachtes Lernen“. Wikipedia, Wikimedia Foundation, 15. März 2018. Hier verfügbar

Bildhöflichkeit:

1.'2729781 'von GDJ (Public Domain) über Pixabay