Hybrid Search
Suchverfahren, das semantische Vektorsuche und klassische Stichwortsuche kombiniert, um die Stärken beider Ansätze zu nutzen.
Hybrid Search (hybride Suche) kombiniert zwei traditionell getrennte Welten der Informationssuche: die semantische Suche über Vektorembeddings und die klassische Volltext- oder Keyword-Suche, meist mit BM25 als Bewertungsverfahren. Beide Ansätze haben komplementäre Stärken und ihre Kombination liefert in der Regel deutlich bessere Ergebnisse als jeder einzeln.
Vektorsuche ist hervorragend, um sinngemäße Treffer zu finden, auch wenn der Suchbegriff nicht wörtlich vorkommt, sie versteht etwa, dass "Hund" und "Vierbeiner" verwandt sind. Stichwortsuche dagegen ist unschlagbar bei seltenen Eigennamen, Produktcodes oder exakten Fachbegriffen, die in keinem Training breit vorhanden waren.
Hybrid Search funktioniert typischerweise so: Beide Verfahren liefern jeweils Trefferlisten, die dann über Verfahren wie Reciprocal Rank Fusion (RRF) zu einer gemeinsamen Rangliste verschmolzen werden. In RAG-Systemen und Enterprise-Search-Lösungen ist Hybrid Search heute der De-facto-Standard, da sie besonders robust gegenüber unterschiedlichen Anfragetypen ist.
Verwandte Begriffe
RAG (Retrieval-Augmented Generation)
Methode, die KI-Sprachmodelle mit externen Wissensquellen verbindet, um genauere, aktuellere und…
Reranking
Zwischenschritt in Such- und RAG-Systemen, bei dem eine grobe Kandidatenliste durch ein zweites,…
BERT
Wegweisendes Sprachmodell von Google (2018), das die Verarbeitung natürlicher Sprache durch…
BPE (Byte-Pair Encoding)
Verfahren zur Zerlegung von Text in kleine, häufige Bausteine (Subword-Tokens). Grundlage der…
Chain-of-Thought (CoT)
Technik, bei der KI-Modelle Probleme schrittweise durchdenken, bevor sie antworten – die Grundlage…