Reranking

Zwischenschritt in Such- und RAG-Systemen, bei dem eine grobe Kandidatenliste durch ein zweites, präziseres Modell neu sortiert wird.

Reranking ist ein typischer Zwischenschritt in modernen Such- und RAG-Pipelines. In einer ersten Phase liefert ein schnelles Retrieval-Verfahren, meist eine Vektorsuche oder klassische Volltextsuche, viele potenziell relevante Dokumente. In der zweiten Phase bewertet ein präziseres, aber rechenaufwendigeres Modell diese Kandidaten noch einmal und sortiert sie nach tatsächlicher Relevanz neu.

Die zweite Stufe nutzt häufig sogenannte Cross-Encoder-Modelle, die Anfrage und Kandidatendokument gemeinsam verarbeiten und so ein deutlich besseres Verständnis der Relevanz haben als eine reine Vektorähnlichkeit. Bekannte Reranker sind etwa Cohere Rerank, BGE Reranker, ColBERT oder spezielle LLM-basierte Rerankers.

In RAG-Systemen verbessert Reranking spürbar die Antwortqualität: Es sorgt dafür, dass das Sprachmodell wirklich die relevantesten Dokumente als Kontext erhält, nicht nur die ähnlichsten. Das senkt Halluzinationen, reduziert die nötige Kontextlänge und erlaubt es, mit weniger, dafür präziseren Quellen zu arbeiten. Reranking ist in produktiven Enterprise-RAG-Systemen heute weitgehend Standard.

Verwandte Begriffe