Self-Supervised Learning
Lernverfahren, bei dem ein Modell sich aus unbeschrifteten Daten selbst Trainingssignale erzeugt, etwa durch Vorhersage maskierter Wörter. Grundlage moderner Sprachmodelle.
Self-Supervised Learning (selbstüberwachtes Lernen) löst eines der größten Probleme des klassischen maschinellen Lernens: den Mangel an beschrifteten Trainingsdaten. Statt von Menschen manuell gelabelte Datensätze zu benötigen, erzeugt sich das Modell aus den Rohdaten selbst Aufgaben und damit Trainingssignale.
Bei Sprachmodellen wird etwa ein Wort im Satz verdeckt und das Modell muss es vorhersagen ("Maskierte Sprachmodellierung"). Bei Bildern können Bildteile entfernt und rekonstruiert werden. Aus diesen automatisch generierten Aufgaben lernt das Modell tiefes Verständnis für Struktur und Bedeutung der Daten.
Self-Supervised Learning ist die Schlüsseltechnologie hinter Foundation Models wie BERT, GPT oder den Vision-Transformern. Sie erlaubt es, praktisch unbegrenzte Mengen an Daten aus dem Internet als Trainingsmaterial zu nutzen, ohne aufwändige manuelle Annotation und ist damit ein Hauptgrund für den schnellen Fortschritt großer Sprachmodelle.
Verwandte Begriffe
One-Shot Learning
Lernverfahren, bei dem ein Modell aus nur einem einzigen Beispiel pro Kategorie generalisieren…
Annotation
Im Kontext der künstlichen Intelligenz (KI) bezieht sich Annotation auf den Prozess, bei dem Daten…
Attention-Mechanismus
Technik, die einem neuronalen Netz erlaubt, sich bei der Verarbeitung auf die jeweils relevantesten…
Bestärkendes Lernen
Beim bestärkenden Lernen erhält der Lernalgorithmus gelegentliches Feedback für Interaktionen mit…
Classification
Im Bereich der künstlichen Intelligenz (KI) bezieht sich Klassifikation auf eine Art des…