Overfitting (Überanpassung)

Überanpassung bei KI-Modellen beschreibt den Zustand, in dem ein Modell die Trainingsdaten so genau erlernt, dass es deren spezifische Details und Zufälligkeiten "überanpasst". Dadurch verliert es die...

Overfitting, im Deutschen auch Überanpassung genannt, bezeichnet ein typisches Problem beim Training von KI-Modellen: Das Modell lernt die Trainingsdaten zu genau – inklusive aller Eigenheiten, Ausreißer und zufälligen Schwankungen. Statt die zugrunde liegenden Muster zu erfassen, merkt es sich quasi die Beispiele auswendig. Das Ergebnis: Auf den Trainingsdaten liefert das Modell hervorragende Werte, bei neuen, unbekannten Daten versagt es jedoch.

Technisch entsteht Überanpassung meist dann, wenn ein Modell zu komplex für die vorhandene Datenmenge ist oder zu lange trainiert wurde. Um das Problem zu erkennen, teilt man die verfügbaren Daten üblicherweise in Trainings-, Validierungs- und Testdaten auf. Klafft die Genauigkeit zwischen Trainings- und Validierungsdaten weit auseinander, liegt vermutlich Überanpassung vor. Gegenmittel sind unter anderem mehr und vielfältigere Trainingsdaten, einfachere Modelle, das frühzeitige Stoppen des Trainings sowie Verfahren wie Regularisierung oder Kreuzvalidierung. Das Gegenstück ist die Unteranpassung (Underfitting), bei der das Modell zu einfach ist und selbst die Trainingsdaten nicht ausreichend abbildet.

Für kleine und mittlere Unternehmen ist das Thema vor allem dann relevant, wenn eigene KI-Lösungen entwickelt oder eingekauft werden – etwa für Bedarfsprognosen, Bilderkennung in der Qualitätskontrolle, Bonitätsbewertungen oder die automatische Sortierung von Kundenanfragen. Gerade bei kleinen Datenmengen, wie sie im Mittelstand häufig vorkommen, ist das Risiko einer Überanpassung besonders hoch. Wer eine KI-Lösung von einem Dienstleister einkauft, sollte daher gezielt nachfragen, wie das Modell validiert wurde und welche Genauigkeit auf unabhängigen Testdaten erreicht wird. Beeindruckende Zahlen aus dem Training allein sagen wenig über die Praxistauglichkeit aus.

Überanpassung lässt sich nie vollständig vermeiden, aber durch sauberes Vorgehen kontrollieren. Wer KI im Unternehmen einsetzt, sollte regelmäßig prüfen, ob ein Modell unter realen Bedingungen weiterhin verlässliche Ergebnisse liefert – denn auch veränderte Geschäftsbedingungen können dazu führen, dass ein zuvor gutes Modell an Genauigkeit verliert.

Verwandte Begriffe