Messung und Skalierung – zwei Konzepte der Umfrageforschung | Teil 2
Zur Erinnerung: Um Fragebögen entwickeln und die Antworten mit unterschiedlichen Methoden messen und auswerten zu können, benötigen wir verschiedene Skalen. Im ersten Teil haben wir Ihnen die vier Skalen-Niveaus vorgestellt und ihre Grundlagen erläutert. Jetzt schauen wir uns diese Skalen in der Tiefe an.
Komparative und nicht komparative Skalen
Bei Skalierungstechniken unterscheiden wir grundsätzlich zwischen zwei Arten von Skalen – den komparativen und den nicht komparativen Skalen.
1. Komparative Skalen = Vergleichende Skalen
Diese Skalen ermöglichen den direkten Vergleich von Objekten. Wir können zum Beispiel fragen: „ist Mercedes besser als Audi, ist Android besser als iOS, oder ist rot besser als grün?“ Hier haben wir es immer mit ordinalen Skalen zu tun. Das heisst, wir können zwar Vergleiche anstellen, aber die erhobenen Daten lassen sich nur in ihrer Rangfolge statistisch auswerten.
2. Nicht komparative Skalen = nicht vergleichende Skalen
Bei diesen Skalen findet kein Vergleich statt. Jedes Objekt wird separat von anderen bewertet. Vielleicht haben Sie schon einmal an einer Umfrage teilgenommen, bei der Sie zum Beispiel auf einer Skala von 0 – 5 angeben sollten, wie hoch Ihre Zustimmung zu einer getroffenen Aussage ist. Die Aussagen werden aber dabei von dem Probanden nicht miteinander verglichen oder bewertet.
Beispiel:
Eine Umfrage untersucht die Geschmacksvorlieben in Bezug auf Bier, Wein und Whiskey. Sie werden gebeten, Ihre Präferenz zu jedem einzelnen Objekt anzugeben, von „mag ich gar nicht = 0“ bis „mag ich sehr = 5“. Die Daten, die hier erhoben werden, weisen ein Intervall-Niveau auf.
Welche Art von Skalen bei Umfragen verwendet wird, hängt zum einen von der Beschaffenheit der zu messenden Objekte ab, und zum anderen davon, welche Informationen man durch die Befragung erhalten will. Wenn die „kleinsten und feinsten“ Unterschiede verschiedener Objekte von Interesse sind, werden komparative Skalen als Messinstrument verwendet. Ist hingegen ein Allgemeinverständnis der erhobenen Daten gewünscht, sind nicht komparative Skalen eher geeignet.
Vor- und Nachteile der komparativen Skalen
Der größte Vorteil einer komparativen Skala ist die bereits genannte Fähigkeit, auch die kleinsten Unterschiede zwischen Objekten feststellen zu können. Und zwar dadurch, dass man gezwungen ist, sie im Fragebogen in eine eindeutige Reihenfolge zu bringen und sie miteinander zu vergleichen.
Ein weiterer Vorteil ist, dass wir hier für alle Probanden eindeutige Referenzpunkte haben. Wir haben also eine Konsistenz, was den Bezugspunkt für Vergleiche betrifft, weil wir die Vergleiche selbst formulieren. Somit erhalten wir eindeutige Informationen über die Präferenzen zu bestimmten Objekten/Produkten und eine bessere Interpretationsfähigkeit im Hinblick auf Vorlieben und Einstellungen der Befragten. Durch den direkten Vergleich sind komparative Skalen für den Nutzer sehr einfach zu verstehen. Für die spätere statistische Auswertung und die Methode der Datenerhebung gibt es bei der Anwendung einer komparativen Skala wenig theoretische Bedenken.
Zuletzt sei noch der sogenannte „Carry-over-Effekts“ erwähnt. Unter dem Carry-over-Effekt wird das psychologische Phänomen verstanden, dass sich die Bewertung des einen Objekts auf die Bewertung der nachfolgenden Objekte überträgt und sich entsprechend auf unsere Entscheidungen auswirkt.
Beispiel:
Haben die Befragten in einer Umfrage als erstes die Automarke Mercedes bewertet und sollen als nächstes die Marke Audi bewerten, dann hat der Akt des Bewertens von Mercedes einen Effekt auf die Bewertung von Audi. Der Grund dafür liegt in dem Bezugsrahmen (Frame), den Menschen gedanklich aufstellen. Es kann also passieren, dass Audi in diesem Fall schlechter bewertet wird als es der Fall gewesen wäre, wenn die Marke Audi als erstes genannt worden wäre.
Durch festen Bezugsgrößen, bzw. eindeutige Vergleiche, von denen bei komparative Skalen nicht abgewichen wird, kann dieser Effekt verhindert werden.
Zu den Nachteilen der komparativen Methode gehören die statistischen Eigenschaften. Hier können lediglich ordinale Skalen zur Messung herangezogen werden. Dementsprechend begrenzt sind die Auswertungsmöglichkeiten. Daten müssen im relativen Sinne interpretiert werden.
Der größte Nachteil ist aber die nicht vorhandene Möglichkeit, gewonnene Erkenntnisse zu verallgemeinern und auf Objekte/Produkte auszuweiten, die in einer Umfrage nicht abgefragt wurden. Um beim Beispiel der Automarken zu bleiben, können durch die Auswertung der Befragung zu Mercedes und Audi keinerlei Rückschlüsse auf andere Automarken, wie zum Beispiel Renault gezogen werden. Wenn wir später feststellen, dass Renault ebenfalls bewertet werden sollte, müsste eine neue Umfrage, die alle drei Marken vergleicht, angelegt werden. Es ist nicht möglich, die separate Bewertung in den bereits vorhandenen Vergleich von Mercedes und Audi einzubeziehen. Es gibt eine Reihe von Skalierungstechniken, die bei komparativen Skalen Anwendung finden. Die vier häufigsten sind:
- Paired Comparison = Paarvergleich
- Rank Order Scaling = Rangordnungsskala
- Constant Sum Scaling = Konstantsummen Skala
- Q-Sort and others = andere/weitere Skala
Paired Comparison / Paarvergleich
Hier werden dem Befragten Objekt-Paare vorgestellt, bei denen er beantworten soll, welches Objekt er im Hinblick auf bestimmte Eigenschaften als das Bessere einstuft. Bei Lebensmitteln können als Eigenschaften zum Beispiel Geschmack, Geruch und Qualität festgelegt werden. Es ist außerdem möglich, festzustellen um wieviel besser ein Objekt im Vergleich zum anderen bewertet wird.
Die Vor- und Nachteile des Paarvergleichs auf einen Blick:
1 Blindtests werden häufig für Produkttest im Rahmen der Marktforschung angewandt. Die Probanden bewerten anonymisierte Produkte, d. h. sie wissen nicht, welche Marken sie miteinander vergleichen. So soll vermieden werden, dass die Wahrnehmung einer Marke Einfluss auf die Bewertung hat. Der wohl bekannteste Blindtest ist der Vergleich von Coca Cola und Pepsi Cola. Interessanterweise schneidet Pepsi Cola in Blindtests häufig besser ab, obwohl Coca Cola bei vielen Menschen eigentlich das beliebtere Getränk ist.
² MDS = Multidimensionale Skalierung, Methode zur Erstellung von Wahrnehmungskarten.
³ Wenn man sich einen neuen Computer kaufen möchte, stellt man keinen Paarvergleich zwischen Computer A mit Computer B an. Beim Kauf im Ladengeschäft treffen wir unsere Kaufentscheidung in der Regel anders. Der Paarvergleich hat demnach wenig Ähnlichkeit mit einer tatsächlichen Auswahlsituation.
Rank Order Scaling / Rangordnungsskala
Hierbei handelt es sich ebenfalls um eine Technik, die sich der der Verteilung/Ordnung der Objekte in einer bestimmten Rangordnung bedient. Sie weist, im Gegensatz zum Paarvergleich, eine größere Ähnlichkeit zu einer tatsächlichen Auswahlentscheidung - also einer Realsituation - auf, denn hier müssen weniger Vergleiche angestellt werden. Rangordnungsskalen werden häufig für Onlineumfragen eingesetzt.
Beispiel: Wie wichtig ist Ihnen Markenkleidung?
- sehr wichtig
- wichtig
- nicht so wichtig
- überhaupt nicht wichtig
Die Vor- und Nachteile der Rangordnungsskala auf einen Blick:
³ Die Conjoint Analyse, auch Verbundmessung genannt, ist eine multivariate Analysemethode für die Messung von Präferenzen, bei der die Objekte (z.B. Autos) ganzheitlich verglichen werden. Die Präferenzwerte für die sie bildenden Produkteigenschaften (z.B. Marke, Preis, Comfort, Getriebe-, Treibstoffart, usw.) werden dabei rechnerisch ermittelt.
Constant Sum Scaling / Konstantsummenskala
Diese Möglichkeit der komparativen Skalierung liefert verfeinerte Informationen, weil jedem Attribut eines Objekts eine Punktzahl zugeordnet werden kann, welche die Bedeutung oder Wichtigkeit widerspiegelt, die der Befragte dem Attribut beimisst. Die Summe aller Punkte, die den verschiedenen Attributen zugewiesen wurden, ergeben immer eine feste Größe, i.d.R. 100.
Beispiel: die Teilnehmer einer Umfrage sollen beurteilen, wie wichtig ihnen verschiedene Attribute eines Autos sind. Sie können insgesamt 100 Punkte vergeben. Die Verteilung der Punkte gibt Aufschluss über die Präferenzen der Befragten:
Attribut | Punkte |
---|---|
Geschwindigkeit | 0 |
Komfort | 15 |
Getriebe-Typ (Schaltung oder Automatik) | 5 |
Kraftstoff-Typ (Benzin oder Diesel) | 35 |
Preis | 45 |
Summe | 100 |
Die Auswertung zeigt deutlich auf, dass der Preis den Befragten dreimal wichtiger ist, als der Komfort und der Komfort wiederum dreimal wichtiger als der Getriebe-Typ.
Die Vor- und Nachteile der Konstantsummenskala auf einen Blick:
Q-Sort Scaling
Hier handelt es sich um ein Rangordnungsverfahren, bei dem Objekte auf Grundlage der Ähnlichkeit in Bezug auf ein Kriterium sortiert werden. Diese Technik wird normalerweise verwendet, um schnell zwischen einer (sehr) großen Anzahl verschiedener Möglichkeiten bzw. Alternativen auswählen zu können und eine Priorisierung zu ermöglichen. Besonders, wenn Ressourcen nur eingeschränkt zur Verfügung stehen, ist eine Priorisierung nötig. Dafür wird eine Art Pyramide in verschiedenen Blöcken aufgebaut. Die Anzahl der Blöcke ist identisch mit der Anzahl der zu sortierenden Alternativen. Sie werden so gestapelt, dass die resultierende Figur eine Normalverteilung wiedergibt (siehe Abb.).
Ein Beispiel: Das Gesundheitsministerium hat 25 Vorschläge zur Prävention von Epidemien entwickelt, die in Krankenhäusern implementiert werden sollen. Eingeschränkte Ressourcen in Krankenhäusern gestatten allerdings nicht, dass alle Maßnahmen sofort umgesetzt werden können. Darum wurde das Ministerium gebeten, die Maßnahmen gemäß der Prioritäten zu sortieren, so dass geklärt werden konnte, welche von ihnen zuerst implementiert werden müssen.
Im nächsten Teil erkläre ich Ihnen vertiefend die Bedeutung von “Nicht komparativen Skalen”.