KL-Divergenz
Mathematisches Maß dafür, wie stark sich zwei Wahrscheinlichkeitsverteilungen unterscheiden. Wichtiges Werkzeug beim Training generativer und probabilistischer Modelle.
Die Kullback-Leibler-Divergenz (KL-Divergenz) ist ein Maß aus der Informationstheorie, das angibt, wie weit eine Wahrscheinlichkeitsverteilung von einer anderen abweicht. Anschaulich: Wie viel Information geht verloren, wenn man eine echte Verteilung durch eine Modellverteilung ersetzt?
Die KL-Divergenz ist nicht symmetrisch, die Abweichung von Verteilung A zu B ist nicht zwangsläufig dieselbe wie von B zu A. Sie ist null, wenn beide Verteilungen identisch sind, und wächst, je stärker sie auseinandergehen. Anders als eine echte Distanz erfüllt sie also nicht die Dreiecksungleichung.
In der KI ist die KL-Divergenz allgegenwärtig: beim Training von Variational Autoencoders, in Reinforcement-Learning-Verfahren wie PPO, beim Knowledge Distillation und beim Alignment großer Sprachmodelle. Sie hilft, ein Modell so anzupassen, dass seine vorhergesagte Verteilung möglichst nah an einer Zielverteilung liegt, etwa an menschlichen Präferenzen oder an einem Referenzmodell.
Verwandte Begriffe
Scaling Laws
Empirische Gesetzmäßigkeiten, die beschreiben, wie KI-Modelle besser werden, wenn Modellgröße,…
AGI
Künstliche allgemeine Intelligenz (AGI) bezieht sich auf eine Form der künstlichen Intelligenz, die…
Annotation
Im Kontext der künstlichen Intelligenz (KI) bezieht sich Annotation auf den Prozess, bei dem Daten…
Artificial General Intelligence (AGI)
Künstliche allgemeine Intelligenz ist eine Stufe der künstlichen Intelligenz, die ähnlich wie ein…
ASI (Künstliche Superintelligenz)
Hypothetische Form künstlicher Intelligenz, die menschliche Intelligenz in sämtlichen Bereichen –…