RAG (Retrieval-Augmented Generation)

NLP & Sprache Sprachmodelle Wissensmanagement Retrieval

Methode, die KI-Sprachmodelle mit externen Wissensquellen verbindet, um genauere, aktuellere und überprüfbare Antworten zu erzeugen.

RAG (Retrieval-Augmented Generation) ist eine Methode, die die Stärken großer Sprachmodelle (LLMs) mit externem Wissen kombiniert. Statt sich ausschließlich auf das im Training gelernte Wissen zu verlassen, durchsucht ein RAG-System zunächst relevante Datenquellen – etwa Unternehmensdokumente, Datenbanken oder Wissensdatenbanken – und nutzt die gefundenen Informationen als Kontext für die Antwortgenerierung.

Der RAG-Prozess besteht aus zwei Phasen: Im Retrieval-Schritt werden relevante Dokumente oder Textpassagen aus einer Wissensbasis abgerufen, typischerweise über semantische Suche mit Vektordatenbanken. Im Generation-Schritt verarbeitet das Sprachmodell die Benutzeranfrage zusammen mit den gefundenen Kontextinformationen und generiert eine fundierte Antwort.

RAG löst mehrere zentrale Probleme von Sprachmodellen: Es reduziert Halluzinationen, da Antworten auf konkreten Quellen basieren. Es ermöglicht den Zugriff auf aktuelle Informationen, die nach dem Trainingszeitpunkt entstanden sind. Und es erlaubt die Nutzung proprietärer Unternehmensdaten, ohne das Modell selbst neu trainieren zu müssen. RAG ist damit eine Schlüsseltechnologie für den professionellen KI-Einsatz in Unternehmen, etwa für intelligente Dokumentensuche, Kundensupport oder Wissensmanagement.

RAG (Retrieval-Augmented Generation)

Verwandte Begriffe

Reranking

BERT

Chain-of-Thought (CoT)

Halluzination

Hybrid Search