Alle Begriffe mit dem Tag «Effizienz»
11 Einträge im KI-Lexikon
Flash Attention
Hochoptimierte Implementierung des Attention-Mechanismus, die Sprachmodelle deutlich schneller und speichereffizienter macht, ohne die…
Intelligente Automatisierung
Die Kombination von künstlicher Intelligenz und Automatisierungstechnologien, um komplexe Geschäftsprozesse zu optimieren. Intelligente…
Knowledge Distillation (Wissensdestillation)
Verfahren, bei dem ein kleines „Schüler"-Modell trainiert wird, die Fähigkeiten eines großen „Lehrer"-Modells nachzuahmen – für…
KV-Cache
Speichermechanismus in Sprachmodellen, der schon berechnete Aufmerksamkeits-Werte zwischenspeichert und so die Generierung neuer Tokens…
LoRA (Low-Rank Adaptation)
Effiziente Fine-Tuning-Methode, die nur einen kleinen Teil der Modellparameter anpasst – ideal für kostengünstiges Anpassen großer…
Mixture of Experts (MoE)
Modellarchitektur, bei der viele spezialisierte Teilnetzwerke („Experten") vorhanden sind, aber pro Anfrage nur wenige aktiviert werden –…
Quantisierung
Technik zur Komprimierung von KI-Modellen, bei der die Rechengenauigkeit reduziert wird – für schnellere und speichereffizientere Modelle…
Small Language Models (SLMs)
Kompakte Sprachmodelle mit 1–7 Milliarden Parametern, die effizient auf Endgeräten laufen können und für viele Anwendungsfälle ausreichend…
Speculative Decoding
Beschleunigungstechnik für die Token-Generierung in Sprachmodellen: Ein kleines, schnelles Modell schlägt Tokens vor, das große Modell…
Transfer Learning
Transfer Learning ist eine Technik im maschinellen Lernen, bei der ein Modell, das für eine Aufgabe trainiert wurde, für eine verwandte,…
Zero-Shot Learning
Zero-Shot Learning ist eine Technik im maschinellen Lernen, bei der ein Modell Aufgaben lösen kann, für die es nicht explizit trainiert…