Zero-Shot Learning

Zero-Shot Learning ist eine Technik im maschinellen Lernen, bei der ein Modell Aufgaben lösen kann, für die es nicht explizit trainiert wurde. Das Modell nutzt sein Vorwissen und seine Fähigkeit zur V...

Zero-Shot Learning bezeichnet die Faehigkeit eines KI-Modells, Aufgaben zu loesen, fuer die es nie ausdruecklich trainiert wurde. Statt fuer jedes neue Problem einen eigenen Trainingsdatensatz zu benoetigen, greift das Modell auf bereits gelerntes Allgemeinwissen zurueck und uebertraegt es auf die neue Situation. Der Name leitet sich davon ab, dass null ("zero") Beispiele fuer die konkrete Aufgabe noetig sind.

Moeglich wird dies durch grosse, vortrainierte Modelle wie moderne Sprachmodelle oder Bildmodelle, die auf riesigen Datenmengen aus dem Internet gelernt haben. Wer einem solchen Modell zum Beispiel die Anweisung gibt "Sortiere diese Kundenanfrage als Beschwerde, Lob oder Frage ein", erhaelt eine brauchbare Antwort, obwohl das Modell nie speziell auf die Anfragen des jeweiligen Unternehmens trainiert wurde. Es versteht die Begriffe aus dem Sprachzusammenhang und leitet die richtige Zuordnung ab. Verwandt sind die Begriffe One-Shot Learning (ein Beispiel reicht) und Few-Shot Learning (wenige Beispiele genuegen).

Fuer kleine und mittlere Unternehmen ist Zero-Shot Learning besonders interessant, weil es den groessten Aufwand klassischer KI-Projekte entfallen laesst: das Sammeln und Aufbereiten von Trainingsdaten. Ein Steuerbuero kann eingehende E-Mails durch ein Sprachmodell vorsortieren lassen, ein Onlinehaendler Produktbeschreibungen automatisch kategorisieren, eine Handwerksfirma Angebote anhand des Textinhalts thematisch gruppieren. All das funktioniert mit fertigen Modellen ueber eine Schnittstelle, ohne eigene Trainingslaeufe und ohne spezialisiertes KI-Personal. Damit werden Anwendungen wirtschaftlich, die frueher nur fuer Grossunternehmen mit eigenen Datenwissenschaftlern realisierbar waren.

Die Grenzen liegen dort, wo sehr spezifisches Fachwissen oder firmeneigene Begriffe gefragt sind: Hier liefert Zero-Shot oft solide, aber nicht optimale Ergebnisse. In solchen Faellen lohnt es sich, mit wenigen Beispielen im Prompt (Few-Shot) oder einer gezielten Feinabstimmung des Modells nachzuhelfen.

Verwandte Begriffe