Diskriminative KI

Diskriminative KI-Modelle lernen, Daten zu unterscheiden und zu klassifizieren. Im Gegensatz zu generativen KI-Modellen, die neue Daten erzeugen, ordnen diskriminative Modelle Eingabedaten ihnen bekan...

Diskriminative KI bezeichnet eine Gruppe von Verfahren des maschinellen Lernens, die darauf trainiert sind, Eingabedaten in vorgegebene Kategorien einzuordnen oder konkrete Werte vorherzusagen. Sie lernt aus Beispielen die Grenzen zwischen Klassen — etwa zwischen "Spam" und "Kein Spam" oder zwischen "zahlungsfaehig" und "ausfallgefaehrdet". Im Gegensatz zur generativen KI, die neue Inhalte wie Texte oder Bilder erzeugt, trifft diskriminative KI Entscheidungen ueber bereits vorhandene Daten.

Technisch lernt ein diskriminatives Modell anhand vieler bezeichneter Beispiele, welche Merkmale fuer welche Kategorie typisch sind. Bei einer E-Mail koennen das bestimmte Worthaeufigkeiten, Absenderadressen oder Linkstrukturen sein. Aus diesen Mustern leitet das Modell eine Entscheidungsregel ab, die anschliessend auf neue, unbekannte Daten angewendet wird. Typische Verfahren sind logistische Regression, Entscheidungsbaeume, Random Forests, Support Vector Machines und viele neuronale Netze, sofern sie auf Klassifikation oder Vorhersage trainiert wurden. Auch Bilderkennung, Spracherkennung und Bonitaetspruefung gehoeren zu diesem Bereich.

Fuer den Mittelstand ist diskriminative KI haeufig der praktischere und unauffaelligere Einstieg in das Thema, auch wenn generative Werkzeuge wie ChatGPT derzeit mehr Aufmerksamkeit bekommen. Sie steckt in Spamfiltern, in der automatischen Sortierung eingehender Rechnungen, in Empfehlungssystemen von Onlineshops oder in der Qualitaetspruefung in der Fertigung, etwa wenn Kameras fehlerhafte Werkstuecke aussortieren. Eine Steuerkanzlei kann damit Belege automatisch Buchungskategorien zuordnen, ein Handwerksbetrieb Kundenanfragen nach Dringlichkeit vorsortieren, ein Onlinehaendler Retouren-Risiken einschaetzen. Der Aufwand ist oft geringer als bei generativen Modellen, weil die Aufgaben klar umrissen sind.

Die Staerke liegt in praezisen, wiederholbaren Entscheidungen bei klar definierten Fragestellungen. Grenzen zeigen sich, wenn die Trainingsdaten unausgewogen oder veraltet sind — dann uebernimmt das Modell vorhandene Verzerrungen. Wer ueber den Einsatz nachdenkt, sollte daher auf saubere Daten und nachvollziehbare Ergebnisse achten und das Modell regelmaessig pruefen.

Verwandte Begriffe