Aggregation von Multi-Item-(Likert-)Skalen

Wenn Sie in Ihrer Umfrage mehrere Items zur Messung eines Konstrukts verwenden – zum Beispiel zur Erfassung von Zufriedenheit, Vertrauen oder Stress –, stellt sich früher oder später die Frage:

Wie fasse ich die einzelnen Antworten zu einem Gesamtwert zusammen?

Genau darum geht es in diesem Artikel. Sie erfahren:

  • Welche Aggregationsmethoden es gibt (z. B. Mittelwert, Median, Summe)
  • Welche Vor- und Nachteile sie mit sich bringen
  • Und wann welche Methode sinnvoll ist

So erhalten Sie nicht nur einen theoretischen Überblick, sondern auch eine praktische Orientierung für Ihre eigene Erhebung und Auswertung.

Aggregation Likert-Skalen

 

Welche Aggregationsmethoden gibt es?

Um einen Gesamtwert eines latenten Konstrukts (z. B. „Zufriedenheit“) zu ermitteln, werden alle dazugehörigen Items einzeln bewertet und anschließend mithilfe einer Aggregationsregel zusammengefasst. Die gängigsten Methoden sind:

  • Mittelwertbildung
  • Medianbildung
  • Einfache Summe
  • Gewichtete Summe
  • Faktorwerte (auf Basis einer Faktorenanalyse)

Welche Methode sinnvoll ist, hängt unter anderem von Ihren Forschungszielen, der Datenstruktur und der angestrebten Interpretation ab.

 

Mittelwert- und Medianbildung

Der Vorteil dieser beiden Aggregationsmethoden besteht darin, dass der aggregierte Wert im ursprünglichen Skalenniveau verbleibt. Wenn Ihre Likert-Skala beispielsweise von „1 = stimme voll und ganz zu“ bis „5 = stimme überhaupt nicht zu“ reicht, wird auch der aggregierte Wert in diesem Bereich liegen. Dadurch ist der Wert des latenten Konstrukts leicht verständlich und intuitiv interpretierbar, ohne dass weitere Transformationen nötig sind.

Mittelwert:
Der Mittelwert entspricht aus statistischer Sicht der wahrscheinlichsten Bewertung unter der Annahme, dass keine weiteren Informationen vorliegen. Er ist besonders dann sinnvoll, wenn die Items innerhalb der Skala relativ gleichwertig sind und keine extremen Verzerrungen auftreten.

Median:
Der Median hat den Vorteil, dass er robust gegenüber Ausreißern ist und stets die Bewertung widerspiegelt, die von mindestens der Hälfte der Befragten erreicht oder überschritten wurde. Er betont somit die „typische“ Antwort.

Wann was verwenden?
Ob Mittelwert oder Median verwendet wird, ist häufig eine Entscheidung der Präferenz oder hängt von der Verteilung der Daten ab:

  • Mittelwert: Geeignet bei symmetrisch verteilten Daten, geringer Streuung, wenigen Ausreißern.
  • Median: Besonders sinnvoll bei asymmetrischen Verteilungen oder wenn Ausreißer zu erwarten sind.

 

Einfache Summe und gewichtete Summe

Bei der Summenbildung (einfach oder gewichtet) addieren Sie die einzelnen Bewertungen der Items miteinander. Dabei entsteht zwangsläufig eine neue Skala, deren Wertebereich sich nach der Anzahl der bewerteten Items richtet.

Einfache Summe:
Alle Items gehen gleichgewichtig in die Aggregation ein. Der größte Nachteil liegt darin, dass die resultierende Skala neu interpretiert werden muss. Das Maximum hängt von der Anzahl der Items ab:

  • Bei fünf Items auf einer 1–5 Skala liegt das Ergebnis dann zwischen 5 und 25.

Gewichtete Summe:
Hierbei werden einige Items stärker gewichtet als andere, etwa wenn bestimmte Aspekte eines Konstrukts besonders bedeutsam sind. Sinnvoll ist dies beispielsweise dann, wenn Sie wissen, dass einzelne Items stärker mit dem Gesamtkonstrukt korrelieren oder theoretisch wichtiger sind.

Ein Nachteil der Summenbildung ist, dass Werte im mittleren Bereich schwierig zu interpretieren sein können. Denn dieselbe Summe kann durch sehr unterschiedliche Antwortmuster entstehen (z. B. viele mittlere Bewertungen oder eine Mischung aus sehr positiven und sehr negativen Bewertungen).

 

Faktorwerte (Fortgeschrittene Methode)

Eine weitere, fortgeschrittenere Methode zur Aggregation von Multi-Item-Skalen sind Faktorwerte, die auf Basis einer Faktorenanalyse (z. B. Hauptkomponentenanalyse, PCA) gebildet werden. Diese Methode gewichtet Items automatisch anhand ihrer empirischen Relevanz.

Diese Methode ist besonders dann sinnvoll, wenn:

  • Das zu messende Konstrukt komplex ist
  • Sie mit Skalenreduktion, Validierung oder Skalenoptimierung arbeiten
  • Sie möglichst präzise, datengestützte Gesamtwerte brauchen (z. B. in wissenschaftlichen Studien oder anspruchsvollen Modellen)

Hinweis: Diese Methode erfordert statistisches Know-how und die entsprechende Software (z. B. SPSS, R, Python).

 

Fazit zur Aggregation

  • Mittelwert oder Median: Ideal bei standardisierten Skalen, wenn Verständlichkeit und Vergleichbarkeit im Vordergrund stehen.
  • Einfache oder gewichtete Summe: Praktisch bei vielen Items, wenn schnelles Rechnen im Vordergrund steht – erfordert aber neue Skalendefinition.
  • Faktorwerte: Die beste Wahl bei komplexen Modellen oder wissenschaftlich fundierten Konstrukten – aber methodisch anspruchsvoller.

Welche Methode für Sie die richtige ist, hängt von Ihrer konkreten Fragestellung, Ihren Daten und der Tiefe Ihrer Analyse ab. Es gibt keine pauschal „beste“ Lösung – aber eine informierte Entscheidung bringt verlässlichere Ergebnisse.

 

Datum: 10.04.2025
Autor: Dr. Paul Marx
Dieser Text ist urheberrechtlich geschützt. Alle Rechte vorbehalten.

Das könnte Sie auch interessieren: