Annotation
Im Kontext der künstlichen Intelligenz (KI) bezieht sich Annotation auf den Prozess, bei dem Daten manuell von Menschen beschriftet oder markiert werden, um sie für maschinelles Lernen vorzubereiten. ...
Annotation bezeichnet das Beschriften, Markieren oder Kategorisieren von Rohdaten, damit ein KI-System aus ihnen lernen kann. Dabei versehen Menschen Bilder, Texte, Audiodateien oder Videos mit zusätzlichen Informationen, die der Maschine verraten, was auf den Daten zu sehen, zu hören oder zu lesen ist. Ohne diese Beschriftungen waeren die meisten Trainingsdaten fuer ein maschinelles Lernverfahren wertlos, weil die Software nicht weiss, was sie eigentlich erkennen soll.
In der Praxis kann eine Annotation viele Formen annehmen. Bei Bildern werden zum Beispiel Rechtecke um Objekte gezogen und mit Begriffen wie "Auto" oder "Fussgaenger" versehen. Bei Texten markiert man einzelne Woerter als Firmenname, Datum oder Produktbezeichnung, oder ordnet ganzen Saetzen eine Stimmung zu, etwa "positiv" oder "negativ". Bei Audioaufnahmen wird gesprochene Sprache transkribiert und mit Sprecherwechseln versehen. Die Qualitaet der Annotation entscheidet massgeblich ueber die spaetere Leistungsfaehigkeit des KI-Modells: Sind die Beschriftungen unvollstaendig, widerspruechlich oder fehlerhaft, lernt das System auch nur Unzulaengliches.
Fuer kleine und mittlere Unternehmen ist Annotation vor allem dann ein Thema, wenn eigene Daten fuer eine Spezialanwendung genutzt werden sollen, etwa eine automatische Pruefung von Bauteilen, eine Sortierung von Kundenanfragen nach Themen oder die Auswertung von Rechnungen und Formularen. Wer Standardloesungen einkauft, kommt mit Annotation selten direkt in Beruehrung, denn die Anbieter haben ihre Modelle bereits auf grossen, beschrifteten Datenmengen trainiert. Sobald jedoch branchenspezifisches Wissen einfliessen soll, etwa interne Fachbegriffe oder firmenspezifische Bildmotive, muss meist annotiert werden. Diese Arbeit erfolgt entweder im eigenen Haus, durch spezialisierte Dienstleister oder zunehmend mit Werkzeugen, die Vorschlaege automatisch erzeugen und nur noch von Menschen geprueft werden.
Annotation gilt als einer der grossen Kostenfaktoren in KI-Projekten und ist haeufig zeitaufwaendiger als die eigentliche Modellentwicklung. Verwandte Begriffe sind Labeling, Tagging und Ground Truth. Neue Ansaetze wie aktives Lernen oder synthetische Daten versuchen, den manuellen Aufwand zu reduzieren, ersetzen das menschliche Urteil bislang jedoch nicht vollstaendig.
Verwandte Begriffe
Classification
Im Bereich der künstlichen Intelligenz (KI) bezieht sich Klassifikation auf eine Art des…
Data Labeling
Maschinelle Lernsysteme benötigen oft menschliche Annotatoren, um Daten zu beschriften oder zu…
Feature Engineering
Feature Engineering ist der Prozess der Auswahl, Transformation und Erstellung von Merkmalen…
Finetuning
Finetuning bezeichnet die Anpassung eines vortrainierten KI-Modells auf eine spezifische Aufgabe…
Hyperparameter
Hyperparameter sind Konfigurationsparameter, die vor dem Training eines maschinellen Lernmodells…