BERT
Wegweisendes Sprachmodell von Google (2018), das die Verarbeitung natürlicher Sprache durch bidirektionales Kontextverständnis revolutioniert hat.
BERT (Bidirectional Encoder Representations from Transformers) ist ein 2018 von Google vorgestelltes Sprachmodell, das die Verarbeitung natürlicher Sprache grundlegend verändert hat. Es war eines der ersten Modelle, das Wörter konsequent im Kontext sowohl der vorausgehenden als auch der nachfolgenden Wörter interpretiert, daher das "bidirektional" im Namen.
Trainiert wurde BERT unter anderem mit der Aufgabe, in einem Satz maskierte Wörter vorherzusagen (Masked Language Modeling), und mit der Vorhersage, ob zwei Sätze inhaltlich zusammengehören. Aus diesem Pretraining entstand ein universelles Sprachverständnis, das sich durch Finetuning auf zahlreiche Aufgaben übertragen ließ: Klassifikation, Frage-Antwort-Systeme, Named Entity Recognition oder Sentiment-Analyse.
BERT bildete die Grundlage für Googles Suchalgorithmus und löste eine Welle bidirektionaler Encoder-Modelle aus (RoBERTa, ALBERT, DistilBERT, deutsches GermanBERT). Auch wenn heutige generative Modelle wie GPT oder Claude im Rampenlicht stehen, sind BERT und seine Nachfolger in vielen produktiven NLP-Systemen, von Suchmaschinen bis zu Dokumentenklassifikatoren, bis heute im Einsatz.
Verwandte Begriffe
Chain-of-Thought (CoT)
Technik, bei der KI-Modelle Probleme schrittweise durchdenken, bevor sie antworten – die Grundlage…
Halluzination
Phänomen, bei dem KI-Modelle überzeugend klingende, aber faktisch falsche oder frei erfundene…
Large Language Models
Large Language Models (LLMs) sind große maschinelle Lernmodelle, die auf riesigen Textmengen…
RAG (Retrieval-Augmented Generation)
Methode, die KI-Sprachmodelle mit externen Wissensquellen verbindet, um genauere, aktuellere und…
Tokenisierung
Der Prozess, bei dem Text in kleinere Einheiten (Tokens) zerlegt wird, bevor er von einem…