Basismodelle
Basismodelle sind große maschinelle Lernmodelle, die auf Basis einer großen Menge allgemeiner Daten trainiert wurden. Nach diesem Vortraining können die Modelle für eine Vielzahl spezifischer Aufgaben...
Basismodelle, im Englischen Foundation Models genannt, sind besonders umfangreiche KI-Modelle, die auf riesigen Mengen allgemeiner Daten vortrainiert wurden. Sie bilden eine Art universelles Fundament, auf dem sich zahlreiche konkrete Anwendungen aufbauen lassen, ohne dass jedes Mal von Null begonnen werden muss. Bekannte Vertreter sind grosse Sprachmodelle wie GPT, Claude oder Gemini, aber auch Bildmodelle wie Stable Diffusion zaehlen dazu.
Das Prinzip dahinter ist ein zweistufiger Aufbau. In der ersten Phase, dem sogenannten Vortraining, lernt das Modell aus enormen Datenmengen allgemeine Muster, etwa wie Sprache strukturiert ist, welche Begriffe zusammengehoeren oder wie Bilder aufgebaut sind. In einer zweiten Phase wird das Modell dann fuer konkrete Einsatzzwecke angepasst, beispielsweise durch Feinjustierung mit branchenspezifischen Daten oder durch gezielte Anweisungen im laufenden Betrieb. Auf diese Weise entstehen aus einem einzigen Basismodell viele unterschiedliche Anwendungen, von Chatbots ueber Uebersetzungswerkzeuge bis hin zu Bildgeneratoren.
Fuer den Mittelstand sind Basismodelle vor allem deshalb interessant, weil sie den Zugang zu leistungsfaehiger KI deutlich vereinfachen. Frueher mussten Unternehmen eigene Modelle aufwendig trainieren, was Datenmengen, Rechenleistung und Spezialwissen erforderte, die fuer kleine Firmen unerreichbar waren. Heute lassen sich vortrainierte Modelle ueber Programmierschnittstellen oder fertige Werkzeuge nutzen, etwa fuer das Verfassen von Texten, die Auswertung von Kundenanfragen, die Erstellung von Produktbeschreibungen oder die Analyse von Dokumenten. Anbieter wie OpenAI, Anthropic, Google oder europaeische Alternativen wie Mistral und Aleph Alpha stellen solche Modelle bereit, oft im Abonnement oder nach Nutzung abgerechnet.
Zu beachten ist allerdings, dass Basismodelle keine Allzweckloesung sind. Sie spiegeln die Daten wider, mit denen sie trainiert wurden, koennen Fehler oder Verzerrungen enthalten und sind bei sehr spezifischen Fachthemen ohne Anpassung oft ungenau. Fuer sensible Anwendungen lohnt sich daher eine Feinjustierung oder die Kombination mit eigenen Datenquellen, beispielsweise ueber Verfahren wie Retrieval-Augmented Generation.
Verwandte Begriffe
LoRA (Low-Rank Adaptation)
Effiziente Fine-Tuning-Methode, die nur einen kleinen Teil der Modellparameter anpasst – ideal für…
A2A (Agent-to-Agent)
A2A (Agent-to-Agent) ist ein von Google vorgeschlagener offener Standard zur Ermöglichung der…
Adversarial Learning
Beim gegnerischen Lernen wird versucht, ein Modell durch Lernen mit sogenannten gegnerischen…
Agentic AI (Agentische KI)
Autonome KI-Systeme, die eigenständig Ziele verfolgen, Entscheidungen treffen und komplexe Aufgaben…
AGI
Künstliche allgemeine Intelligenz (AGI) bezieht sich auf eine Form der künstlichen Intelligenz, die…