Alle Begriffe mit dem Tag «Modelloptimierung»
6 Einträge im KI-Lexikon
DPO (Direct Preference Optimization)
Trainingsverfahren, mit dem Sprachmodelle direkt aus Präferenzpaaren lernen, eine einfachere Alternative zum klassischen RLHF.
Feature Engineering
Feature Engineering ist der Prozess der Auswahl, Transformation und Erstellung von Merkmalen (Features) aus Rohdaten, um die Leistung von…
Hyperparameter
Hyperparameter sind Konfigurationsparameter, die vor dem Training eines maschinellen Lernmodells festgelegt werden und nicht während des…
Knowledge Distillation (Wissensdestillation)
Verfahren, bei dem ein kleines „Schüler"-Modell trainiert wird, die Fähigkeiten eines großen „Lehrer"-Modells nachzuahmen – für…
PPO (Proximal Policy Optimization)
Reinforcement-Learning-Algorithmus von OpenAI, der besonders stabil große Sprachmodelle nach menschlichem Feedback ausrichtet. Klassiker…
Quantisierung
Technik zur Komprimierung von KI-Modellen, bei der die Rechengenauigkeit reduziert wird – für schnellere und speichereffizientere Modelle…