Small Language Models (SLMs)
Kompakte Sprachmodelle mit 1–7 Milliarden Parametern, die effizient auf Endgeräten laufen können und für viele Anwendungsfälle ausreichend leistungsfähig sind.
Small Language Models (SLMs) sind Sprachmodelle, die bewusst kompakt gehalten werden – typischerweise mit 1 bis 7 Milliarden Parametern, im Vergleich zu hunderten Milliarden bei Large Language Models. SLMs sind ein bedeutender Gegentrend zur „Bigger is Better"-Mentalität und werden als Schlüsseltechnologie für den breiten KI-Einsatz angesehen.
Der Vorteil von SLMs liegt in ihrer Effizienz: Sie können direkt auf Endgeräten wie Smartphones, Laptops oder IoT-Geräten laufen (On-Device AI), benötigen keine Cloud-Anbindung und schützen so die Privatsphäre der Nutzer. Gleichzeitig sind die Betriebskosten drastisch geringer – Unternehmen können ihre KI-Kosten um bis zu 75 % senken.
Moderne SLMs erreichen für viele praktische Aufgaben eine Qualität, die mit deutlich größeren Modellen vergleichbar ist. Durch Techniken wie Knowledge Distillation, Quantisierung und domänenspezifisches Fine-Tuning werden SLMs gezielt für bestimmte Einsatzbereiche optimiert. Beispiele sind Microsofts Phi-Serie, Googles Gemini Nano und verschiedene Llama-Varianten. Für agentische KI-Anwendungen sind SLMs besonders interessant, da sie schnelle lokale Entscheidungen ermöglichen.
Verwandte Begriffe
Edge Computing
Verlagerung der Datenverarbeitung an den Ort, an dem die Daten entstehen, etwa auf das Smartphone,…
LoRA (Low-Rank Adaptation)
Effiziente Fine-Tuning-Methode, die nur einen kleinen Teil der Modellparameter anpasst – ideal für…
Mixture of Experts (MoE)
Modellarchitektur, bei der viele spezialisierte Teilnetzwerke („Experten") vorhanden sind, aber pro…
Quantisierung
Technik zur Komprimierung von KI-Modellen, bei der die Rechengenauigkeit reduziert wird – für…
Speculative Decoding
Beschleunigungstechnik für die Token-Generierung in Sprachmodellen: Ein kleines, schnelles Modell…