Bestlage finden

Die zehn schlimmsten Fehler bei der Standortwahl

10.06.2008

6. Überanpassung oder zu viele Variablen

Jeder weiß, dass Umsatzerfolge von zahlreichen komplexen Faktoren abhängen. Aber nicht jeder weiß, dass zu viele Variablen in einem Modell in der Regel mehr schaden als nützen.

Ein Beispiel: Eine Einzelhandelskette besteht aus 70 Geschäften. Für die Umsatzprognosen soll ein Regressionsmodell auf Einzelgeschäftsebene erstellt werden. Es wird also eine Regressionsanalyse durchgeführt und ein Modell mit 22 Variablen erstellt. Aus dem Modell ergibt sich eine Prognose mit einer Genauigkeit von +/-7 %.

Ein sehr gutes Ergebnis, oder? Nicht ganz: Das Überladen eines statistischen Modells mit Variablen ist ein häufig übersehenes Problem. Statistiker halten sich bei der Erstellung von Modellen an das Prinzip der Sparsamkeit. Dieses Prinzip ist ganz einfach: Die besten Modellierer zielen auf maximale Verlässlichkeit ihrer Prognosen bei minimaler Anzahl an Variablen ab.

Auch das folgende Prinzip hängt damit zusammen: Je weniger Beobachtungen in einen Datenbestand eingehen, desto weniger Variablen stehen zur Verfügung, aus denen sich womöglich Korrelationen ableiten lassen, die in Wirklichkeit gar nicht existieren. Ein Modell mit 22 Variablen mag zwar die Daten, auf denen es basiert, scheinbar gut erklären, aber bei einer neuen Situation wird es in der Praxis versagen.

Zur Startseite