Tag
Alle Begriffe mit dem Tag «Reinforcement Learning»
2 Einträge im KI-Lexikon
Bestärkendes Lernen
Beim bestärkenden Lernen erhält der Lernalgorithmus gelegentliches Feedback für Interaktionen mit der Umwelt und lernt, die…
KI & MLReinforcement LearningLernen
PPO (Proximal Policy Optimization)
Reinforcement-Learning-Algorithmus von OpenAI, der besonders stabil große Sprachmodelle nach menschlichem Feedback ausrichtet. Klassiker…
TrainingReinforcement LearningModelloptimierung