Latente Konstrukte und Multi-Item-Skalen
Viele wissenschaftliche Arbeiten werden auf Grundlage von Umfragen geschrieben. Bei der Entwicklung einer Umfrage kommen jedoch häufig latente Konstrukte, beispielsweise das Image einer Marke, vor. Aber was genau sind überhaupt latente Konstrukte? Und wie können diese in Umfragen richtig eingesetzt und gemessen werden?
Dieser Artikel gibt zunächst Hinweise zu den Grundlagen latenter Konstrukte. Dazu wird auf die Themen „Manifeste versus Latente Variablen“ sowie deren Zusammenspiel eingegangen. Außerdem wird ein kurzer Einblick gewährt, wie ein latentes Konstrukt aufgebaut wird, um dieses messbar zu machen. Abschließend wird geklärt, ob jede Frage zur Messung einer Variablen geeignet ist oder ob manche diese besser abbilden als andere. Hierzu gibt es einen kurzen Überblick über verschiedene Gütekriterien zur Auswahl von Fragen.
Manifeste versus Latente Variablen
Bei manifesten Variablen handelt es sich um Merkmale, die direkt beobachtbar sind. Solche Variablen sind häufig offensichtliche Merkmale, wie beispielsweise Körpergröße, Lebensalter oder Wohnort. Da ihre Ausprägungen direkt feststellbar sind, ist eine Messung in der Regel einfach durchführbar. Die theoretische Bedeutung einer manifesten Variable ist eindeutig und bekannt. In den meisten Fällen reicht es aus, diese nur anhand eines Items bzw. eines Indikators zu ermitteln.
Latente Konstrukte, auch latente Variablen oder latente Merkmale genannt, sind das Gegenteil von manifesten Variablen. Hierbei handelt es sich um Sachverhalte, die nicht direkt beobachtbar und somit nicht direkt messbar sind. Latente Merkmale sind häufig Eigenschaften, Fähigkeiten, Werthaltungen, Kenntnisse oder Einstellungen. Zu diesen Konstrukten zählen beispielsweise Eifersucht, Ehrgeiz, aber auch Kundenzufriedenheit.
Latente Konstrukte spielen in Umfragen eine große Rolle. Dennoch, anders als bei manifesten Variablen ist die theoretische Bedeutung der latenten Merkmale regelmäßig nicht eindeutig und klar. Somit ist es notwendig, dass die Bedeutungen dieser erst erklärt bzw. definiert werden müssen. Die zentrale Frage dabei ist: Was soll genau unter diesem Konstrukt verstanden werden?
Latente Konstrukte sind nicht direkt messbar, können aber mit Hilfe von verschiedenen Items erfasst werden. Bei Items handelt es sich um manifeste Variablen, die in Form von Fragen oder Aufgaben in Tests eingesetzt werden. Sie werden auch als Indikatoren bezeichnet. Durch die Zusammenfassung der entsprechenden Items zu einem Test oder einer Skala soll die Ausprägung des latenten Merkmals „greifbar“ gemacht werden.
Die Verwendung von einzelnen Indikatoren zur Messung eines latenten Konstruktes ist zu unpräzise und deckt nur kleine Bereiche des Konstrukts ab. Um präzisere Ergebnisse zu erhalten, sollten daher mehrere Indikatoren zur Messung verwendet werden.
Von latenten Variablen zu Multi-Item-Skalen
Zunächst sollte der Begriff „Skala“ geklärt werden. Der Begriff bezieht sich in diesem Fall nicht auf das Messinstrument „Skala“, sondern bezeichnet einen Satz von einem oder mehreren Items bzw. Indikatoren, die zur Messung eines latenten Konstrukts dienen.
Es wird unterschieden zwischen den Single-Item-Skalen und den Multi-Item-Skalen. Bei einer Single-Item-Skala wird nur ein einzelner Indikator zur Messung eines Konstrukts verwendet. Latente Konstrukte können über eine Single-Item-Skalen jedoch meistens nicht ausreichend erfasst werden. In diesem Fall wird auf Multi-Item-Skalen zurückgegriffen. Multi-Item-Skalen bestehen aus einem Set von Items, die zur Erfassung der Ausprägung eines latenten Merkmals dienen.
Bei latenten Konstrukten handelt es sich in der Regel um komplexe Konstrukte, die über verschieden Faktoren erfasst werden müssen. Dabei kann erneut differenziert werden, über wie viele Ebenen ein Konstrukt aufgebrochen werden muss.
Können latente Konstrukte direkt über Faktoren abgebildet werden, hat das Konstrukt nur eine einzige Ebene. Hierbei wird von einer Dimension gesprochen. Den Faktoren dieser Dimension werden jeweils mehrere Items zugeordnet. Diese dienen zur Erfassung und Messung des jeweiligen Faktors. Bei den Items handelt es sich, wie bereits erwähnt, um manifeste Variablen. Somit werden die Faktoren, und im Endergebnis das Konstrukt, messbar gemacht.
Zur Verdeutlichung wird ein Beispiel des latenten Konstruktes „Servicezufriedenheit“ vorgestellt:
Servicezufriedenheit lässt sich zwar über die Frage „Wie zufrieden sind Sie mit unserem Service?“ messen, aber das Ergebnis ist anschließend zu unpräzise. Um ein genaueres Ergebnis zu erzielen, kann das Konstrukt beispielsweise in die Faktoren „Freundlichkeit“ und „Fachkompetenz“ unterteilt werden. Zu diesen Faktoren können daraufhin verschiedene Indikatoren entwickelt werden. Für „Fachkompetenz“ ist beispielsweise „Der Verkäufer konnte alle Fragen zufriedenstellend beantworten.“ ein mögliches Item. Alle zu einem Faktor zugeordneten Indikatoren werden als Skala zusammengefasst.
Ein latentes Konstrukt kann allerdings noch komplexer sein. Dies ist der Fall, wenn es auf mehrere Ebenen aufgeteilt werden muss. Trifft dies zu, wird von mehreren Dimensionen gesprochen. Das latente Konstrukt sollte zunächst in unterschiedliche Dimensionen aufgeschlüsselt werden. Diese Dimensionen können direkt über Items messbar sein oder müssen gegebenenfalls noch weiter durch verschiedene Faktoren aufgegliedert werden. Wie bereits anhand eines Beispiels verdeutlicht wurde, werden zu den Faktoren wiederum Indikatoren, in Form manifester Variablen, erstellt. Hierdurch wird eine Messung ermöglicht.
Anhand eines anderen Beispiels wird dies nochmal eindeutiger:
Es soll das latente Konstrukt „Kundenzufriedenheit“ gemessen werden. Dieses lässt sich beispielsweise in die zwei Dimensionen „Produktzufriedenheit“ und „Servicezufriedenheit“ unterteilen. Die Dimension „Servicezufriedenheit“ umfasst wiederum die Faktoren „Freundlichkeit“ und „Fachkompetenz“. Diesen einzelnen Faktoren müssen verschiedene Items zugeordnet werden, damit diese gemessen werden können. Ein Indikator für „Freundlichkeit“ ist beispielsweise „Der Verkäufer war mir sympathisch“. Bei diesem Indikator handelt es sich ebenfalls um eine manifeste Variable, die direkt messbar ist. Alle Items eines Faktors werden anschließend wiederum zu einer Skala zusammengefasst.
Entwicklung einer Multi-Item-Skala
Wie bereits erläutert, gibt es eine Vielzahl von Items/ Indikatoren, die für eine Multi-Item-Skala in Frage kommen. Doch nicht jedes Item eignet sich gleichermaßen zur Erfassung eines latenten Konstrukts. Außerdem würde eine zu große Anzahl von Fragen einige Probanden abschrecken, weshalb es die Möglichkeit gibt bereits erstellte und getestete Skalen zu verwenden. Decken die bestehenden Skalen allerdings die eigentliche Intention bzw. Forschungsfrage nicht richtig ab, sollte eine spezielle Skala entwickelt werden.
Um eine eigene Skala zu entwickeln, sollte zunächst eine Theorieentwicklung stattfinden. Dabei ist es wichtig, das latente Konstrukt genau zu definieren. So können passende Items gefunden werden, welche für die Forschungsfrage von Relevanz sind. Geeignete Items für einen anfänglichen Pool können beispielsweise ebenfalls durch Sekundärdaten ermittelt werden.
Da dieser Anfangspool in den meisten Fällen zu viele Indikatoren enthält, sollte das aktuelle Set reduziert werden. Für diese Reduktion werden FachkennerInnen oder ForscherInnen benötigt.
Nach der Reduzierung wird der aktuelle Satz an Indikatoren getestet. Hierzu sollte einer großen Masse an Probanden der Test zur Beantwortung vorgelegt werden. Die Daten der Stichprobe werden nun durch statistische Tests, wie beispielsweise der Faktoranalyse oder durch Korrelationen, analysiert. Neben den Genannten gibt es noch weitere statistische Testverfahren, die zur Analyse verwendet werden können. Durch diese Tests werden weitere Indikatoren als „nicht geeignet“ festgestellt und aus der Ansammlung entfernt.
Das bereinigte Set sollte anschließend erneut durch TestteilnehmerInnen beantwortet werden, die zuvor noch nicht an dem Test teilgenommen haben. Der nun erhobene Datensatz wird zur Beurteilung verschiedener Qualitäts- und Gütekriterien verwendet. Bei diesen handelt es sich um Reliabilität, Validität und Objektivität der Skala.
Reliabilität (Messgenauigkeit) misst wie zuverlässig (genau) ein Merkmal gemessen wird. Dies bedeutet, dass erneute Messungen mit dem gleichen Messmittel, die gleichen Ergebnisse erzeugen sollten. Wird die Größe eines ausgewachsenen Menschen mit Hilfe eines elektronischen Längenmessgerät gemessen, sollte die Größe stets gleich sein. Reliabilität lässt sich unter anderem durch Retests oder Paralleltests messen.
Durch Validität wird geprüft, ob ein Test bzw. ein Set von Items genau das erfasst, was gemessen werden soll. Das zu messende Merkmal ist beispielsweise das Gewicht eines Menschen. Ein Thermometer ist zwar ein geeignetes Verfahren zur Messung des Merkmals Temperatur, allerdings ist es nicht zur Messung des Gewichtes geeignet. Validität lässt sich durch die drei Kategorien Konstrukt-, Inhalts- und Kriteriumsvalidität abbilden und beurteilen.
Ein Test ist objektiv, wenn alle Befragten mit den gleichen Werte- oder Verhaltenseinstellungen die gleiche Antwort auf einen Indikator abgeben. Einflüsse auf die Objektivität sind zum Beispiel durch den Interviewer, die Befragungssituation, aber auch durch die Reihenfolge der abgefragten Items gegeben. Zudem lässt sich Objektivität in die folgenden drei Kategorien einteilen: Durchführungs-, Auswertungs- und Interpretationsobjektivität.
Wurde die Skala anhand der Gütekriterien bewertet, können weitere Indikatoren entfernt und die finale Skala für den Test abgeleitet werden.
Vor- & Nachteile von Multi-Item-Skalen
Vorteile von Multi-Item-Skalen sind zum einen, dass komplexe Konstrukte erfasst werden können. Zum anderen wird bei der Erfassung oftmals nicht nur ein Konstrukt selbst erfasst, sondern auch inhaltlich verschiedene Facetten/ Faktoren, die zur Messung des latenten Konstrukts dienen. Zudem werden durch die Verwendung einer Vielzahl von Items Messfehler relativiert.
Allerdings haben Multi-Item-Skalen nicht nur Vorteile, sondern auch Nachteile. Die Vielzahl an Indikatoren in einer Multi-Item-Skala bedeutet für die Probanden einen hohen Zeitaufwand. Viele Probanden wollen allerdings nicht so viel Zeit mit der Beantwortung der Fragen verbringen und brechen die Umfrage unter Umständen ab. Darüber hinaus führen zu viele Fragen zu mangelnder Konzentration. Die Folgen sind oftmals indifferente und fehlerhafte Antworten. Ein weiterer Nachteil ist, dass viele und oftmals gleichklingende Items zur Ermüdung und ebenfalls zu mangelnder Konzentration der Umfrageteilnehmer führen. Letztlich ist das Erstellen einer Skala teilweise mit sehr hohen Kosten verbunden.
Schluss
Latente Konstrukte wirken oft abschreckend, da sie auf den ersten Blick kompliziert, komplex und noch dazu nicht direkt messbar sind. Dennoch gibt es Möglichkeiten diese Sachverhalte greifbar und für wissenschaftliche Arbeiten verwendbar zu machen.
Der Artikel gibt einen kleinen Einblick in das Thema „latente Konstrukte“. Die beschriebenen Methoden sollen dabei helfen latente Konstrukte, ihre Bedeutung und richtige Umsetzung in Umfragen besser verständlich zu machen. Latente Konstrukte sind kein Hexenwerk, weshalb sie in Umfragen nicht vermieden werden sollten.
Autor:
Lea Börger
Literaturverzeichnis
Baumgarth, Carsten / Eisend, Martin / Evanschitzky, Heiner (2009): Empirische Mastertechniken – Eine anwendungsorientierte Einführung für die Marketing- und Managementforschung, 1. Auflage, Gabler, Wiesbaden.
Döring, Nicola / Bortz, Jürgen (2016): Forschungsmethoden und Evaluation in den Sozial- und Humanwissenschaften, 5. Auflage, Springer Verlag, Heidelberg / Berlin.
Jacob, Rüdiger / Heinz, Andreas / Décieux, Jean Philippe (2019): Umfrage – Einführung in die Methoden der Umfrageforschung, 4. Auflage, de Gruyter, Berlin / Boston.
Kopp, Johannes / Lois, Daniel (2014): Sozialwissenschaftliche Datenanalyse – Eine Einführung, 2. Auflage, Springer VS, Wiesbaden.
Malhotra, Naresh K. / Birks, David F. (2006): Marketing Research – An Applied Approach, 2. europäische Auflage, Pearson Education Limited, Essex.
Möhring, Wiebke / Schlütz, Daniela (2019): Die Befragung in der Medien- und Kommunikationswissenschaft, 3. Auflage, Springer VS, Wiesbaden.
Schnell, Rainer (2019): SurveyInterviews – Methoden standardisierter Befragungen, 2. Auflage, Springer VS, Wiesbaden.
Schumann, Siegfried (2019): Repräsentative Umfrage – Praxisorientierte Einführung in empirische Methoden und statistische Analyseverfahren, 7. Auflage, de Gruyter, Berlin / Boston.