RoPE (Rotary Positional Embeddings)

Deep Learning Transformer Sprachmodelle Architektur

Technik in Sprachmodellen, die Positionsinformationen von Wörtern im Text durch Rotationsmatrizen kodiert, um Bedeutungszusammenhänge präzise zu erfassen.

RoPE (Rotary Positional Embeddings) ist eine fortgeschrittene Technik in der Architektur moderner Sprachmodelle, die dafür sorgt, dass das Modell die Position und Reihenfolge von Wörtern (Tokens) im Text versteht. Da Transformer-Modelle von sich aus keine Information über die Wortposition haben, ist eine Positionskodierung essenziell für das Sprachverständnis.

RoPE kodiert Positionsinformationen durch Rotationsmatrizen im hochdimensionalen Vektorraum. Der entscheidende Vorteil gegenüber älteren Methoden (wie absoluten oder erlernten Positionskodierungen) liegt darin, dass RoPE relative Positionsbeziehungen zwischen Tokens direkt in den Aufmerksamkeitsmechanismus (Attention) einbettet. Dadurch kann das Modell natürlich erfassen, wie weit zwei Wörter voneinander entfernt sind, unabhängig von ihrer absoluten Position im Text.

RoPE wird in zahlreichen modernen LLMs eingesetzt, darunter LLaMA, PaLM und viele Open-Source-Modelle. Ein besonderer Vorteil ist die Skalierbarkeit: Durch Erweiterungen wie YaRN oder NTK-aware Scaling können RoPE-basierte Modelle auf deutlich längere Texte angewendet werden als ursprünglich trainiert, was die effektive Kontextlänge erheblich erweitert.

RoPE (Rotary Positional Embeddings)

Verwandte Begriffe

Attention-Mechanismus

Mixture of Experts (MoE)

Deep Learning

Graph Neural Networks

Kontextfenster (Context Window)