Chain-of-Thought (CoT)

Technik, bei der KI-Modelle Probleme schrittweise durchdenken, bevor sie antworten – die Grundlage aller modernen Reasoning-Modelle.

Chain-of-Thought (CoT) ist eine Prompting- und Trainingstechnik, bei der KI-Modelle dazu gebracht werden, Probleme Schritt für Schritt durchzudenken, anstatt direkt eine Antwort zu generieren. Das Modell legt seinen Denkprozess offen, ähnlich wie ein Mensch, der seine Überlegungen aufschreibt.

Die Technik wurde 2022 von Google-Forschern formalisiert und ist seit 2025 die Grundlage aller modernen Reasoning-Modelle wie OpenAIs o1/o3, DeepSeek R1 und Claude mit Extended Thinking. Diese Modelle erzeugen intern oft tausende „Reasoning Tokens" – Denkschritte, die nicht in der finalen Antwort erscheinen, aber die Qualität bei Logik-, Mathematik- und Programmieraufgaben dramatisch verbessern.

CoT kann auf zwei Arten eingesetzt werden: Als Prompting-Strategie, indem man das Modell explizit auffordert „Denke Schritt für Schritt", oder als trainierte Fähigkeit, die fest im Modell verankert ist. Der Paradigmenwechsel besteht darin, dass nicht mehr nur die Modellgröße für bessere Ergebnisse sorgt, sondern auch die Rechenzeit beim Nachdenken (Inference-Time Scaling). Je komplexer die Aufgabe, desto mehr profitiert sie von CoT-Reasoning.

Verwandte Begriffe