Hybrid Search

Suchverfahren, das semantische Vektorsuche und klassische Stichwortsuche kombiniert, um die Stärken beider Ansätze zu nutzen.

Hybrid Search (hybride Suche) kombiniert zwei traditionell getrennte Welten der Informationssuche: die semantische Suche über Vektorembeddings und die klassische Volltext- oder Keyword-Suche, meist mit BM25 als Bewertungsverfahren. Beide Ansätze haben komplementäre Stärken und ihre Kombination liefert in der Regel deutlich bessere Ergebnisse als jeder einzeln.

Vektorsuche ist hervorragend, um sinngemäße Treffer zu finden, auch wenn der Suchbegriff nicht wörtlich vorkommt, sie versteht etwa, dass "Hund" und "Vierbeiner" verwandt sind. Stichwortsuche dagegen ist unschlagbar bei seltenen Eigennamen, Produktcodes oder exakten Fachbegriffen, die in keinem Training breit vorhanden waren.

Hybrid Search funktioniert typischerweise so: Beide Verfahren liefern jeweils Trefferlisten, die dann über Verfahren wie Reciprocal Rank Fusion (RRF) zu einer gemeinsamen Rangliste verschmolzen werden. In RAG-Systemen und Enterprise-Search-Lösungen ist Hybrid Search heute der De-facto-Standard, da sie besonders robust gegenüber unterschiedlichen Anfragetypen ist.

Verwandte Begriffe