sdi-marktforschungMarktforschung - Trendforschung - Motivforschung

Repräsentativität in der Marktforschung

repräsenativitätEine repräsentative Stichprobe ist die Basis valider Marktforschung. Wie groß muss eine Stichprobe bei einer Umfrage sein, damit sie repräsentativ ist? Worauf muss man bei der Auswahl der befragten Personen achten? Und was bedeutet "repräsentativ" eigentlich?

Der Begriff "repräsentativ" wird oft verwendet, aber selten genau erklärt. Denn ob das Ergebnis einer Messung, Beobachtung, Befragung u.s.w. repräsentativ ist oder nicht, lässt sich nicht einfach mit ja oder nein beantworten, sondern nur mit einem Genauigkeitsmaß. Vergleichbar einer Strecke auf einem Blatt Papier, die man mit dem Lineal abmisst. Die Genauigkeit ist dabei durch die Einteilung des Lineals und unsere Sehschärfe begrenzt. Wenn wir also zum Schluss kommen eine gemessene Strecke ist 12,7 cm lang sind es in Wirklichkeit vielleicht 12,73214...

Sehen wir uns deshalb die wichtigsten Fragen zum Thema Repräsentativität einmal genauer an:

1. Kann die Frage "Ist eine Untersuchung repräsentativ?" mit einem einfachen "ja" oder "nein" beantwortet werden?

Auch wenn das ein wenig enttäuschend klingen mag: die Antwort lautet nein. Korrekt muss es z.B. heißen: das Ergebnis ist mit +/- 2,2% in einem Vertrauensintervall von 95,5% repräsentativ.  Ein Beispiel: Vielleicht fahren Sie täglich mit dem Auto oder mit öffentlichen Verkehrsmitteln zur Arbeit. Das dauert einmal länger, weil viel Verkehr, ein Stau oder gar ein Unfall ist, manchmal aber auch kürzer. Im Allgemeinen benötigen Sie aber (beispielsweise) so ungefähr 35 Minuten, 5 Minuten auf oder ab. Ausgenommen jene Tage, an denen durch einen Unfall oder anderes, die Straßen blockiert sind, aber das sind vielleicht nur 5 von 100, da kann es dann schon deutlich länger dauern.

Genau das war nun ein Beispiel dafür, was Repräsentativität ausmacht. Nämlich genau DREI Maßzahlen:
1. Der "repräsentative" Wert (35 Minuten),
2. die übliche Schwankungsbreite (+/-5 Minuten) und
3. die Wahrscheinlichkeit, dass diese Schwankungsbreite eingehalten wird: das Vertrauensintervall ist 95 von 100 Tagen.

Genau so verhält es sich auch bei einer Umfrage, bei der wir einen kleinen Teil (das Sample, z.B. 500 Personen) einer Gesamtheit (z.B. alle Personen zwischen 16 und 65 Jahre) befragen, vorausgesetzt man wählt die zu befragenden Personen wirklich nach dem Zufallsprinzip - Gottseidank gibt es Computer - aus.

Angenommen wir stellen eine beliebige Frage, z.B. "Mögen Sie Vanilleeis?". Das Ergebnis der Befragung ergibt nun, dass 50% Vanilleeis mögen, die anderen 50% können Vanilleeis nicht ausstehen. Ist das nun repräsentativ? Die Antwort ist ganz einfach:

1. Das "repräsentative" Ergebnis ist 50% ja zu 50% nein,
2. die übliche Schwankungsbreite wäre in diesem Fall 4,5% und
3. das Vertrauensintervall ist 95,5%.

Das heißt: mit 95,5%iger Wahrscheinlichkeit liegt der tatsächliche Wert (also wenn Sie alle ÖsterreicherInnen ab 16 Jahre befragen würden) zwischen 45,5% und 54,5%. Wenn Sie einhundert solcher Fragen an 500 Personen stellen, müssten Sie davon ausgehen, dass bei 4 bis 5 Fragen der tatsächliche Wert entweder unter 45,5% oder über 54,5% liegt - aber soviele Eissorten gibt es glücklicherweise nicht.

2. Wird das Ergebnis repräsentativer wenn mehr Menschen befragt werden?

Ja, und zwar dann, wenn die Grundgesamtheit sehr groß ist. Würde man unsere Frage nach dem Vanilleeis nicht 500 sondern 2.500 Personen stellen, und das Ergebnis wäre wieder 50:50, so ergäbe sich, wenn wir wieder ein Vertrauensintervall von 95,5% haben wollen, für die Schwankungsbreite nur mehr +/-2,0%. Wir müssen also die Anzahl der befragten Personen verfünffachen, um die Schwankungsbreite etwas mehr als zu halbieren.

Übrigens: Wenn Sie einmal lesen, dass ein Ergebnis einer Befragung um +/- irgendeinen Prozentwert schwankt, ohne dass ersichtlich ist, wieviele Personen befragt worden sind, fragen Sie nach dem genauen Vertrauensintervall! Es liegt nämlich in der merkwürdigen Natur der Wahrscheinlichkeitsrechnung (bzw. Statistik), dass, wenn man das Vertrauensintervall herabsetzt, z.B. auf 68,3%, die Schwankungsbreite im Gegenzug klarerweise steigt. Mit 68,3% Vertrauensintervall reichen schon 500 Befragte, um die Schwankungsbreite auf 2,3% zu drücken. Kein Wunder, schließlich sagt man damit, dass rund 1 von 3 Fragen außerhalb dieser Schwankungsbreite liegen. Na, dann doch kein Vanilleeis.

Aufpassen muss man, wenn die Stichprobe gegenüber der Grundgesamtheit sehr groß wird, beispielsweise bei einer Mitarbeiterbefragung. Dann kann es sehr leicht vorkommen, dass die Auswahl nicht mehr zufällig wird und damit das Ergebnis nicht mehr repräsentativ sein kann.

3. Ist die Schwankungsbreite unabhängig vom Ergebnis?

Nein. Je gleichmäßiger die Ergebnisse verteilt sind, umso höher ist die Schwankungsbreite. Also: bei 50:50 ist die Schwankungsbreite des Beispiels mit 500 Befragten und 95,5% Vertrauensintervall +/-4,5%. Aber wenn nur 20% der Befragten sagen, sie mögen Vanilleeis und 80% mögen es nicht, reduziert sich die Schwankungsbreite auf +/-3,6%. Bei 10% zu 90% sinkt die Schwankungsbreite auf +/-2,7%. Das heißt: je eindeutiger ein Ergebnis zugunsten einer Variante ausfällt, desto sicherer ist auch statistisch das Ergebnis.

Als Anhaltspunkt nun ein Tabellenauszug, damit Sie wissen wie viele Personen zu befragen sind, um eine für Sie brauchbare Schwankungsbreite zu erhalten. Vorausgesetzt ist eine sehr große Grundgesamtheit (Grundges. > 100 x Stichprobengröße). Das der Berechnung zugrunde gelegte Vertrauensintervall beträgt 95,5%.

Befragte / Ergebnis 10%:90% 20%:80% 30%:70% 40%:60% 50%:50%
100 Befragte 6,0 8,0 9,2 9,8 10,0
300 Befagte 3,5 4,6 5,3 5,7 5,8
500 Befragte 2,7 3,6 4,1 4,4 4,5
1.000 Befragte 1,9 2,5 2,9 3,1 3,2
2.000 Befragte 1,3 1,8 2,0 2,2 2,2

Die Werte in den weißen Feldern sind die +/- Schwankungsbreiten, die sich je nach Anzahl der Befragten und der Verteilung des Ergebnisses errechnen.

Apropos errechnen: wenn Sie Lust dazu haben, können Sie die Schwankungsbreite für jede beliebige Kombination auch auf Ihrem Computer berechnen - geht auch in Excel wunderbar. Für diejenigen, die es nicht lassen können, hier die erforderliche Formel:


repraesentativitaet

a ..... ist das Ergebnis, also die +/- Schwankungsbreite
t  ..... ist ein vorgegebener Wert für das Vertrauensintervall. Bei 95,5% hat er den Wert 2 (sehr praktisch)
p ..... ist einfach der erste Wert des Ergebnispaares (z.B. 30%)
n ..... ist die Größe der Stichprobe also z.B. 500 (befragte Personen)

Es gibt noch einige Details (z.B. den Endlichkeitsfaktor, durch den das Verhältnis von Grundgesamtheit und Stichprobe miteinberechnet wird), die sich aber in der Praxis nur in der zweiten Stelle hinter dem Komma bemerkbar machen. Aber auch darüber informieren wir Sie gerne...


Systemanalyse

Marktforschung_und SystemanalyseGesellschaft und Wirtschaft sind hochkomplexe, vernetzte Systeme. Die Systemanalyse löst den Umgang mit der Komplexität durch eigens dafür entwickelte Methoden auf. mehr...

Wie Werbung wirkt

WerbungWer nicht wirbt, der stirbt. Doch die Werbeflut führt dazu, dass es immer schwieriger wird das Zielpublikum zu erreichen. Eine Studie von SDI-Research zeigt Wege, wie man trotzdem die Menschen erreicht. mehr...

Quickinfo-Service

Weitere Informationen gewünscht? Schreiben Sie uns eine Nachricht, wir informieren Sie gerne und unverbindlich!
 

SDI-Research
Dr. Villani & Partner KG
Schenkendorfg. 48
1210 Wien, Austria
T: +43 (0)1 272 51 52


Referenzen
© SDI-Research 1997 - 2023 :: mail: office@sdi-research.at   ::   phone +43 / (0)1 / 272 51 52 - 0   ::   skype: sdi-research