Überanpassung ist ein Phänomen und unerwünschtes Verhalten aus den Bereichen Statistik und Künstliche Intelligenz. Es tritt auf, wenn sich ein Modell zu eng an Trainingsdaten anpasst. Die Überanpassung führt zu sehr genauen Vorhersagen für Trainingsdaten, bereitet einem Modell aber Probleme, Gelerntes zu generalisieren und die richtigen Schlussfolgerungen aus anderen Daten abzuleiten.
Der englische Fachbegriff für Überanpassung lautet Overfitting. Beim Overfitting handelt es sich um ein Phänomen aus dem Bereich der Statistik und der Künstlichen Intelligenz. Es kann zum Beispiel beim Maschinellen Lernen auftreten. Überanpassung bedeutet, dass sich das Modell zu eng an die Trainingsdaten anpasst. Es lernt die Muster und Merkmale der Trainingsdaten zu genau und hat Schwierigkeiten, das Gelernte zu verallgemeinern. Das Modell kann zwar exakte Vorhersagen für die Trainingsdaten liefern, hat aber Probleme, die richtigen Schlussfolgerungen aus neuen, bisher ungesehenen Daten abzuleiten.
Overfitting ist ein unerwünschtes Verhalten. Trotz der hohen Modellgüte für Trainingsdaten und der guten Trainingsergebnisse hat das Modell eine schlechte Vorhersagegenauigkeit. Das Modell hat die Trainingsdaten quasi „auswendig gelernt“, kann aber sein „Wissen“ nicht auf andere Daten übertragen. Im ungünstigsten Fall führt eine massive Überanpassung zu einem vollständig unbrauchbaren Vorhersagemodell. Die Überanpassung von KI-Modellen gilt es daher zu vermeiden.
Ursachen für eine Überanpassung beim Maschinellen Lernen
Machine-Learning-Modelle werden zunächst mit bekannten Daten trainiert. Basierend auf den in den Trainingsdatensätzen erkannten Mustern und Merkmalen sind sie anschließend in der Lage, Vorhersagen für neue Datensätze zu treffen oder sinnvolle Schlussfolgerungen aus diesen abzuleiten. Ist das KI-Modell aber zu komplex, erfasst es unter Umständen zu feine Muster oder Merkmale, die keine wirkliche Bedeutung haben. Eine unzureichende Diversität der Trainingsdaten kann dazu führen, dass falsche Muster, subtile Merkmale oder zufälliges Rauschen als relevant interpretiert werden. Zufälligen oder irrelevanten Mustern und Merkmalen wird zu viel Bedeutung zugemessen.
Ursachen für ein solches Verhalten sind, dass das Modell entweder zu viele Parameter im Vergleich zur Trainingsdatenmenge und Trainingsdatendiversität hat, es zu lange mit den gleichen Daten trainiert wurde, die Menge der Trainingsdaten zu klein ist oder die Trainingsdatensätze zu viele irrelevante Informationen beinhalten. Eine weitere Ursache für Overfitting kann auch sein, dass ein Modell ein zu großes „Gedächtnis“ hat und es Merkmale und Muster der Trainingsdaten auswendig lernt, anstatt daraus auf Daten anwendbare Regeln abzuleiten.
Beispiele für Überanpassung
Zur Verdeutlichung des Phänomens der Überanpassung im Folgenden einige einfache Beispiele:
Ein Modell soll Fotos von verschiedenen Tieren richtig klassifizieren. In den Trainingsdaten sind die Tiere in unterschiedlichen Umgebungen und Landschaften zu sehen. Unter Umständen passt sich das Modell zu eng an die Hintergründe der Tierbilder anstatt an die Tierabbildungen selbst an. Es findet irrelevante Zusammenhänge zwischen Hintergründen und Tieren und folgert daraus, um welches Tier es sich handelt. Bei Fotos von Tieren in anderen Umgebungen nimmt das Modell unter Umständen falsche Klassifizierungen vor.
Ein Modell soll handgeschriebene Ziffern erkennen. Es wird aber zu lange mit Trainingsdaten handgeschriebener Ziffern bestimmter Personen trainiert, weshalb es sich zu stark an die besondere Schreibweise der Personen anpasst, anstatt die tatsächlich relevanten Formen für die jeweilige Ziffer zu erlernen. Es erkennt anschließend zwar die von einer bestimmten Person geschriebenen Ziffern perfekt, hat aber Probleme, Ziffern anderer Handschriften richtig zuzuordnen.
Ein Modell soll Prüfungsfragen eines bestimmten Fachgebiets richtig beantworten. Es wird mit Prüfungsaufgaben aus der Vergangenheit trainiert und kann diese nach dem Training alle richtig lösen. Wird es aber mit neuen Prüfungsfragen konfrontiert, scheitert es. Das Modell hat die Lösungen für die Prüfungsaufgaben im Training mehr oder weniger auswendig gelernt, aber keine tatsächlichen Regeln zum Lösen neuer Aufgaben abgeleitet. Es ist nicht in der Lage, sein Wissen zu generalisieren.
Abgrenzung zur Unteranpassung
Ein weiteres beim Machine Learning auftretendes Phänomen ist die Unteranpassung (Underfitting). Eine Unteranpassung tritt auf, wenn relevante Muster und Merkmale der Trainingsdaten außer Acht gelassen werden. Ein unterangepasstes Machine-Learning-Modell erzielt weder bei den Trainingsdaten noch bei neuen Daten gute Vorhersage- oder Klassifizierungsergebnisse. Ursachen für eine Unteranpassung sind beispielsweise nicht genügend Trainingsdaten, Trainingsdaten mit zu wenig signifikanten Merkmalen, ein zu kurzes Training oder ein zu einfaches beziehungsweise ein für die Eingangsdaten nicht geeignetes Modell. Da Over- und Underfitting viele gegenläufige Ursachen haben, wird beim Training von KI-Modellen in der Regel versucht, eine Art von Gleichgewicht zwischen Unter- und Überanpassung zu finden.
Erkennen von Überanpassung
Um KI-Modelle mit guten Klassifizierungs- oder Vorhersageleistungen zu erhalten, ist es wichtig, eine Über- oder Unteranpassung zu erkennen. Grundsätzlich lässt sich eine Überanpassung daran erkennen, dass die Vorhersagen auf Trainingsdaten sehr genau sind, aber bei neuen, bisher ungesehenen Daten versagen. Die Modellgenauigkeit ist beim Trainingsdatensatz hoch, bei neuen Daten aber gering. Da die Überanpassung häufig erst ab einer bestimmten Trainingsdauer auftritt und anschließend immer weiter zunehmen kann, ist es sinnvoll, das Vorhersageverhalten während des Trainings mit Trainingsdaten und mit einem Satz Validierungsdaten immer wieder zu überprüfen. Trägt man die Fehlerquote der Vorhersagen für Trainings- und Testdaten in einem Diagramm auf, sinken beide Quoten zunächst. Ab einer bestimmten Trainingsdauer erreicht die Fehlerquote für die Testdaten ein dauerhaft niedriges Niveau, während die Fehlerquote für die Testdaten zu steigen beginnt. Dieses Verhalten deutet auf eine Überanpassung hin. Mithilfe dieser Methode ist es möglich, einen optimalen Zeitpunkt für das Trainingsende zu finden.
Maßnahmen zur Vermeidung von Überanpassung
Überanpassung ist ein unerwünschtes Verhalten und sollte vermieden werden. Maßnahmen zur Vermeidung von Overfitting sind:
Verringerung der Komplexität des Modells (zum Beispiel durch Reduzierung der Parameteranzahl)
Regularisierung (Bewertung und Gewichtung von Merkmalen nach Wichtigkeit)
rechtzeitiges Stoppen des Trainings (Überwachen des Trainings mit Validierungsdaten)
Optimierung und Diversifizierung der Trainingsdaten
Bereitstellung von mehr Trainingsdaten mit relevanten Mustern und Merkmalen
künstliche Erweiterung der Trainingsdaten durch Transformationen (Datenaugmentation)
(ID:49991127)
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.