RAG (Retrieval-Augmented Generation)

Methode, die KI-Sprachmodelle mit externen Wissensquellen verbindet, um genauere, aktuellere und überprüfbare Antworten zu erzeugen.

RAG (Retrieval-Augmented Generation) ist eine Methode, die die Stärken großer Sprachmodelle (LLMs) mit externem Wissen kombiniert. Statt sich ausschließlich auf das im Training gelernte Wissen zu verlassen, durchsucht ein RAG-System zunächst relevante Datenquellen – etwa Unternehmensdokumente, Datenbanken oder Wissensdatenbanken – und nutzt die gefundenen Informationen als Kontext für die Antwortgenerierung.

Der RAG-Prozess besteht aus zwei Phasen: Im Retrieval-Schritt werden relevante Dokumente oder Textpassagen aus einer Wissensbasis abgerufen, typischerweise über semantische Suche mit Vektordatenbanken. Im Generation-Schritt verarbeitet das Sprachmodell die Benutzeranfrage zusammen mit den gefundenen Kontextinformationen und generiert eine fundierte Antwort.

RAG löst mehrere zentrale Probleme von Sprachmodellen: Es reduziert Halluzinationen, da Antworten auf konkreten Quellen basieren. Es ermöglicht den Zugriff auf aktuelle Informationen, die nach dem Trainingszeitpunkt entstanden sind. Und es erlaubt die Nutzung proprietärer Unternehmensdaten, ohne das Modell selbst neu trainieren zu müssen. RAG ist damit eine Schlüsseltechnologie für den professionellen KI-Einsatz in Unternehmen, etwa für intelligente Dokumentensuche, Kundensupport oder Wissensmanagement.

Verwandte Begriffe