Reasoning Models

Neue Generation von Sprachmodellen, die vor der Antwort intern strukturiert nachdenken und so komplexe Probleme deutlich zuverlässiger lösen.

Reasoning Models (auch Thinking Models oder Test-Time-Compute-Modelle) sind eine Generation großer Sprachmodelle, die vor der eigentlichen Antwort intern eine Phase strukturierten Nachdenkens durchlaufen. Statt sofort eine Antwort zu generieren, "denken" sie über Zwischenschritte nach, vergleichbar damit, wie ein Mensch ein schwieriges Problem auf Papier durchgeht.

Bekannte Vertreter sind OpenAIs o1- und o3-Reihe, Anthropics Claude mit Extended Thinking, Google Gemini mit Deep-Think-Modus sowie offene Modelle wie DeepSeek-R1. Die Modelle wurden mit Reinforcement Learning trainiert, um lange interne Denkketten ("Chain-of-Thought") zu produzieren, die anschließend in eine prägnante Antwort übersetzt werden.

Reasoning Models sind deutlich besser bei Aufgaben mit komplexem logischem Denken: Mathematik, naturwissenschaftliche Probleme, Programmierung, juristische Analyse und mehrstufige Planung. Im Gegenzug brauchen sie für jede Antwort spürbar mehr Rechenzeit und Tokens. Im Business-Einsatz lohnen sie sich vor allem dort, wo Korrektheit kritischer ist als Geschwindigkeit.

Verwandte Begriffe