Classification

Im Bereich der künstlichen Intelligenz (KI) bezieht sich Klassifikation auf eine Art des überwachten Lernens, bei dem ein Algorithmus lernt, die Klasse oder Kategorie einer gegebenen Eingabe aus einer...

Classification, auf Deutsch Klassifikation, bezeichnet eine Methode des maschinellen Lernens, bei der ein Algorithmus lernt, Eingabedaten einer von mehreren vorher festgelegten Kategorien zuzuordnen. Es handelt sich um eine Form des ueberwachten Lernens, das heisst: Das Modell wird mit Beispielen trainiert, bei denen die richtige Antwort bereits bekannt ist. Ziel ist, dass das System spaeter auch fuer neue, unbekannte Daten zuverlaessig die passende Klasse vorhersagt.

Im Training bekommt der Algorithmus eine grosse Menge beschrifteter Datensaetze. Ein klassisches Beispiel: Tausende E-Mails, die als "Spam" oder "Kein Spam" markiert sind. Aus diesen Daten lernt das Modell die typischen Merkmale jeder Kategorie, etwa bestimmte Worte, Absenderstrukturen oder Formulierungen. Anschliessend kann es eine neue E-Mail einordnen, ohne sie je gesehen zu haben. Klassifikation kann zwei Klassen unterscheiden (binaere Klassifikation, zum Beispiel Kunde springt ab oder nicht) oder viele (Mehrklassen-Klassifikation, etwa die Sortierung von Eingangsrechnungen nach Kostenstellen). Bekannte Algorithmen sind unter anderem Entscheidungsbaeume, logistische Regression, Support Vector Machines und neuronale Netze.

Fuer kleine und mittlere Unternehmen ist Klassifikation eine der praktischsten KI-Anwendungen ueberhaupt. Sie steckt hinter Spamfiltern, hinter der automatischen Erkennung von Dokumenten (Rechnung, Lieferschein, Vertrag), hinter Bonitaetspruefungen, hinter Stimmungsanalysen von Kundenfeedback oder hinter Bilderkennung in der Qualitaetskontrolle. Auch im Marketing kommt sie zum Einsatz, etwa um Kunden in Zielgruppen einzuteilen oder Kaufwahrscheinlichkeiten einzuschaetzen. Wer Standardsoftware wie ein CRM, eine Buchhaltungsloesung oder ein E-Mail-Programm nutzt, profitiert in der Regel bereits von Klassifikationsmodellen, ohne sie selbst entwickeln zu muessen.

Die Qualitaet einer Klassifikation steht und faellt mit den Trainingsdaten: Sind diese unausgewogen oder fehlerhaft beschriftet, liefert das Modell unzuverlaessige Ergebnisse. Verwandt sind Verfahren wie Regression (Vorhersage von Zahlenwerten statt Kategorien) und Clustering, bei dem Gruppen ohne vorgegebene Labels gebildet werden.

Verwandte Begriffe