Unsupervised Learning (Unüberwachtes Lernen)

Ein Typ des maschinellen Lernens, bei dem das Modell mit ungelabelten Daten trainiert wird. Das Modell lernt, Muster oder Strukturen in den Daten zu erkennen, ohne dass die richtigen Antworten bekannt...

Unsupervised Learning, auf Deutsch unüberwachtes Lernen, ist ein Verfahren des maschinellen Lernens, bei dem ein Algorithmus eigenständig Strukturen in Daten erkennt, ohne dass diese vorher mit Antworten oder Kategorien versehen wurden. Im Gegensatz zum überwachten Lernen, bei dem das System anhand markierter Beispiele trainiert wird, bekommt das Modell hier nur die Rohdaten und muss selbst herausfinden, welche Zusammenhänge darin stecken.

In der Praxis kommen vor allem zwei Ansätze zum Einsatz. Beim Clustering werden ähnliche Datenpunkte zu Gruppen zusammengefasst, etwa Kundinnen und Kunden mit vergleichbarem Kaufverhalten. Bei der Dimensionsreduktion werden grosse, komplexe Datenmengen auf die wesentlichen Merkmale verdichtet, um sie verständlicher oder besser auswertbar zu machen. Weitere Anwendungsfelder sind die Anomalieerkennung, also das Aufspüren von Auffälligkeiten, sowie die Assoziationsanalyse, mit der typische Kombinationen von Produkten oder Ereignissen erkannt werden.

Für kleine und mittlere Unternehmen ist unüberwachtes Lernen oft dort interessant, wo viele Daten vorliegen, aber niemand die Zeit hat, sie manuell zu sortieren. Ein Onlinehändler kann damit Kundengruppen identifizieren, ohne vorher festzulegen, welche Gruppen es überhaupt geben soll. Ein Handwerksbetrieb mit digitaler Buchhaltung kann ungewöhnliche Buchungen automatisch aufspüren lassen. Auch in der Wartung von Maschinen lassen sich auf diese Weise Abweichungen vom Normalbetrieb erkennen, bevor es zu einem Ausfall kommt. Viele moderne Empfehlungssysteme und Werkzeuge zur Kundensegmentierung beruhen ebenfalls auf solchen Verfahren.

Die Stärke des Ansatzes liegt darin, dass keine aufwendig vorbereiteten Trainingsdaten nötig sind. Die Grenze besteht darin, dass die gefundenen Muster nicht immer geschäftlich sinnvoll sind und eine menschliche Interpretation brauchen. Verwandte Begriffe sind das überwachte Lernen, das bestärkende Lernen und das halbüberwachte Lernen, das beide Welten kombiniert.

Verwandte Begriffe