RAG (Retrieval-Augmented Generation)
Methode, die KI-Sprachmodelle mit externen Wissensquellen verbindet, um genauere, aktuellere und überprüfbare Antworten zu erzeugen.
RAG (Retrieval-Augmented Generation) ist eine Methode, die die Stärken großer Sprachmodelle (LLMs) mit externem Wissen kombiniert. Statt sich ausschließlich auf das im Training gelernte Wissen zu verlassen, durchsucht ein RAG-System zunächst relevante Datenquellen – etwa Unternehmensdokumente, Datenbanken oder Wissensdatenbanken – und nutzt die gefundenen Informationen als Kontext für die Antwortgenerierung.
Der RAG-Prozess besteht aus zwei Phasen: Im Retrieval-Schritt werden relevante Dokumente oder Textpassagen aus einer Wissensbasis abgerufen, typischerweise über semantische Suche mit Vektordatenbanken. Im Generation-Schritt verarbeitet das Sprachmodell die Benutzeranfrage zusammen mit den gefundenen Kontextinformationen und generiert eine fundierte Antwort.
RAG löst mehrere zentrale Probleme von Sprachmodellen: Es reduziert Halluzinationen, da Antworten auf konkreten Quellen basieren. Es ermöglicht den Zugriff auf aktuelle Informationen, die nach dem Trainingszeitpunkt entstanden sind. Und es erlaubt die Nutzung proprietärer Unternehmensdaten, ohne das Modell selbst neu trainieren zu müssen. RAG ist damit eine Schlüsseltechnologie für den professionellen KI-Einsatz in Unternehmen, etwa für intelligente Dokumentensuche, Kundensupport oder Wissensmanagement.
Verwandte Begriffe
Reranking
Zwischenschritt in Such- und RAG-Systemen, bei dem eine grobe Kandidatenliste durch ein zweites,…
BERT
Wegweisendes Sprachmodell von Google (2018), das die Verarbeitung natürlicher Sprache durch…
Chain-of-Thought (CoT)
Technik, bei der KI-Modelle Probleme schrittweise durchdenken, bevor sie antworten – die Grundlage…
Halluzination
Phänomen, bei dem KI-Modelle überzeugend klingende, aber faktisch falsche oder frei erfundene…
Hybrid Search
Suchverfahren, das semantische Vektorsuche und klassische Stichwortsuche kombiniert, um die Stärken…