Bestlage finden

Die zehn schlimmsten Fehler bei der Standortwahl

10.06.2008

5. Ungeeignete Variablen

Einige Analysten sind hoch erfreut in ihren Daten "echte Nuggets" zu finden. Etwa ein CE-Händler, der aus den Daten herausliest, dass Haushalte mit 5 oder mehr Autos stark mit hohen Umsätzen korrelieren. "Das ist signifikant!" heißt es dann. "Starten wir eine Marketing-Kampagne!" Ein zweiter Blick auf die Daten enthüllt jedoch, dass nur 1,3 % aller Haushalte in den Ländern Europas dieses Merkmal aufweisen.

Was lässt sich daraus schließen? Statistische Methoden wie die Korrelationsanalyse messen - das muss man immer bedenken - die Zusammenhänge zwischen Variablen anhand einer Stichprobe, jedoch keine "Ursache-Wirkungs-Beziehung". Die Korrelation, die dem CE-Händler ins Auge fiel, ist wahrscheinlich nur ein zufälliges Zusammentreffen von Beobachtungen, bei denen Haushalte mit fünf und mehr Autos und gleichzeitig hohen Umsätzen zu einem überdurchschnittlich hohen Prozentsatz vertreten waren.

Variablen, die nur auf einen sehr kleinen Teil der Bevölkerung zutreffen, ergeben mit weitaus höherer Wahrscheinlichkeit falsche Korrelationen als Variablen, die in der Bevölkerung gut repräsentiert sind. Zusätzlich sollten Variablen immer auch mit gesundem Menschenverstand geprüft werden. Wenn eine hohe Korrelation zwischen Rolls- Royce-Besitz und Heimtierhaltung nicht sinnvoll erscheint, dann ist es wahrscheinlich auch nicht ratsam, diese Korrelation in einem Modell zu verwenden.

Zur Startseite