Scaling Laws
Empirische Gesetzmäßigkeiten, die beschreiben, wie KI-Modelle besser werden, wenn Modellgröße, Datenmenge und Rechenleistung wachsen.
Scaling Laws sind empirische Beobachtungen, die zeigen, wie die Leistung großer KI-Modelle systematisch davon abhängt, wie viele Parameter sie haben, wie viel Trainingsdaten ihnen zur Verfügung stehen und wie viel Rechenleistung in das Training fließt. Sie wurden ab 2020 maßgeblich von Forschungsgruppen bei OpenAI und DeepMind formalisiert.
Eine zentrale Erkenntnis: Die Vorhersagegenauigkeit eines Sprachmodells folgt erstaunlich vorhersagbaren Kurven, wenn man Größe, Daten und Compute zusammen skaliert. Das DeepMind-Paper zu "Chinchilla" (2022) zeigte zudem, dass bei festem Budget Daten und Modellgröße ausgewogen wachsen müssen, viele Modelle waren historisch zu groß für ihre Datenmenge.
Scaling Laws sind ein zentrales Werkzeug der KI-Strategie: Sie erlauben großen Laboren, vor dem Training abzuschätzen, wie viel Verbesserung ein neues, teureres Modell bringen wird. Gleichzeitig sind sie umstritten. Manche Forschende erwarten, dass reines Skalieren irgendwann an Grenzen stößt und andere Hebel (Reasoning, Daten, Architekturen) wichtiger werden.
Verwandte Begriffe
KL-Divergenz
Mathematisches Maß dafür, wie stark sich zwei Wahrscheinlichkeitsverteilungen unterscheiden.…
AGI
Künstliche allgemeine Intelligenz (AGI) bezieht sich auf eine Form der künstlichen Intelligenz, die…
Annotation
Im Kontext der künstlichen Intelligenz (KI) bezieht sich Annotation auf den Prozess, bei dem Daten…
Artificial General Intelligence (AGI)
Künstliche allgemeine Intelligenz ist eine Stufe der künstlichen Intelligenz, die ähnlich wie ein…
ASI (Künstliche Superintelligenz)
Hypothetische Form künstlicher Intelligenz, die menschliche Intelligenz in sämtlichen Bereichen –…