Der t-Test

Irgendwie kommt es einem so bekannt vor, doch man weiß nicht so richtig was das ist – der t-Test.

Wenn man sich schon einmal mit statistischen Verfahren beschäftigt hat oder in Zukunft beschäftigen möchte, wird man dem Begriff des t-Tests hin und wieder über den Weg laufen.
Der t-Test ist ein Hypothesentest einer t-Verteilung und wird verwendet, um statistisch signifikante Unterschiede von Stichproben zu bestimmen.

In diesem Artikel zeige ich dir die verschieden Arten von t-Tests, wie man den Test durchführt und wie man das Ergebnis deuten kann.

 

Über den t-Test

Grundsätzlich prüft der t-Test, ob der Mittelwert eines Merkmals, der in einer Stichprobe ermittelt wurde, sich von einem theoretischen Wert dieses Merkmals abweicht (z.B. die reale Haltbarkeitsdauer eines Produkts von der gesetzlich vorgeschriebenen) oder ob die Mittelwerte zweier Gruppen sich voneinander unterscheiden (z.B. Präferenz für eine Automarke unter Männern und Frauen).

Diese beiden Herangehensweisen an die Prüfung des Mittelwertunterschiedes begründen zwei grundsätzliche Varianten vom t-Test: Einstichproben t-Test und Zweistichproben t-Test. Im Folgenden erläutere ich diese beiden Varianten in mehr Detail.

 

Einstichproben t-Test

Was ist das?

Der Einstichproben t-Test überprüft, ob der Mittelwert einer Stichprobe signifikant von einem bestimmten Erwartungswert abweicht.

So kann es z.B. geprüft werden, ob der Zuckergehalt eines Produktionsloses eines Erfrischungsgetränks im Mittel der von der Rezeptur vorgesehenen Menge entspricht. Hierzu wird aus der an einem Tag produzierten Menge eine Stichprobe von Flaschen zufällig gezogen und deren Zuckergehalt gemessen. Der Mittelwert von den gemessenen Zuckergehalte wird dann mit dem Wert aus dem Rezept verglichen. Weicht der gemessene Mittelwert vom Rezept ab, so kann der Produktionslos nicht ausgeliefert werden.

 

Wie führe ich den Test durch?

Der Einstichproben t-Test kann Linksseitig, Rechtsseitig oder Zweiseitig sein.

KURZ:
Linksseitig ist ein Testverfahren, wenn die Abweichung der getesteten Größte von dem erwarteten Wert nach unten geprüft wird.

Also lautet in unserem Beispiel die Hypothese, ob es in den entnommenen Flaschen weniger Zucker enthalten ist, als die Rezeptur es vorsieht.

Rechtsseitig ist die Teststatistik hingegen, wenn die Abweichung des uns interessierenden Wertes nach oben geprüft wird.

In unserem Beispiel heißt das, ob wir mehr Zucken in die Flaschen getan haben, als die Rezeptur es fordert.

Der zweiseitige t-Test testet hingegen in keine spezielle Richtung. Er weist nur eine Abweichung vom zu prüfenden Wert nach.

M.a.W. ist es uns nicht wichtig, in welche Richtung der Zuckergehalt abweicht – es ist uns nur wichtig, dass dem vorgeschriebenen Wert entspricht. Jede Abweichung – ob nach oben oder nach unten – ist für unseren Betrieb schädlich. In einem solchen Fall müssen wir eingreifen.

Betrachten wir nun die Durchführung des t-Tests anhand eines anderen Beispiels:

Du betreibst ein Beauty Unternehmen, welches Feuchtigkeitscremes herstellt.
Ein Glas der Feuchtigkeitscreme enthält 100ml. Deine Mitarbeiter machen dich jedoch darauf Aufmerksam, dass es sein könnte, dass die Abfüllmaschine weniger als die versprochenen 100ml abfüllt.

Dies sollte man als Unternehmensleiter natürlich überprüfen, da die Zufriedenheit der Kunden davon abhängen könnte. Dafür kannst du einen t-Test durchführen.

Es wird somit die Hypothese aufgestellt, dass die Füllung des Glases mit der Creme überdurchschnittlich oft unter dem 100 ml Inhalt liegt. Diese muss nun getestet werden.

Die Nullhypothese – so nennt man den Gegenteil der zu prüfenden Hypothese – würde lauten: Die Füllung des Glases der Creme weicht nicht von dem 100 ml Inhalt ab.

Um unsere Haupthypothese zu bestätigen, muss im laufe des t-Tests die Nullhypothese abgelehnt werden. Diese Ablehnung der Nullhypothese würde uns den statistischen Beweis dafür liefern, dass die Füllmenge des Cremes tatsächlich nicht eingehalten wird. In diesem Fall müssen wir eingreifen und die Einstellungen der Füllmaschine korrigieren.

Sobald wir die Hypothesen definiert haben, beginnt die Testphase:

Um den t-Test durchzuführen, müssen wir zunächst den sogenannten t-Wert ermitteln, der sich nach folgender Formel bestimmt wird:

Diese Formel setzt die durchschnittliche Abweichung zwischen dem ermittelten Mittelwert der zu prüfenden Größe (X̅ – durchschnittliche Menge der Creme pro Glas) und seinem theoretischen Wert (µ0 – Soll-Menge pro Glas) in Relation zur Varianz dieser Größe (s2) pro Glas (n).

Ist der Zähler gleich Null, so heißt es, es gibt keinen Unterschied zwischen der tatsächlichen und erwarteten Füllmenge. Unsere Gläser erfüllen demnach den Produktionsstandard. Der t-Wert ist in diesem Fall auch gleich Null.

Weicht der Zähler von Null ab, so heißt es, dass die tatsächlich gefüllte Menge von der erwarteten Menge (100ml) im Durchschnitt abweicht. Die Frage ist nun, wie stark diese Abweichung ist bzw. wie viel Abweichung zwischen der tatsächlichen und erwarteten Füllmenge wir pro Glas beobachten?

Um diese Frage zu beantworten, ziehen wie das Konzept der Varianz (s2) heran, die es zeigt, wie stark der gemessene Wert um den Mittelwert variiert. Da die Varianz jedoch sich auf alle Gläser bezieht und wir an der Abweichung pro Glas interessiert sind, müssen wir die Varianz durch die Anzahl von Gläsern (n) teilen.

Ist der Nenner (Varianz pro Glas) groß, sinkt die Teststatistik (t), da die Crememenge pro Glas stark zu variieren scheint. Ist die Varianz pro glas gering, so heißt es, dass die Crememenge pro Glas ziemlich stabil bleibt, die Teststatistik steigt demzufolge.

Als Daumenregel gilt es, dass die Abweichung von X̅ von µ0 dann als signifikant gilt, wenn der t-Wert über 2 ist. Das Vorzeichen ist dabei irrelevant.

Zuerst wird eine Stichprobe z.B. von 20 Gläsern Creme gezogen. Wir messen die Füllmenge jedes dieser Gläsern und bekommen so den Basis-Datensatz, der uns die Ausgangswerte für den t-Test liefert.

 

Tabelle 1: Füllmenge der Creme pro Glas

n Füllmenge in ml n Füllmenge in ml
1 98 11 92
2 101 12 100
3 95 13 98
4 92 14 100
5 106 15 101
6 99 16 96
7 96 17 93
8 101 18 88
9 102 19 95
10 98 20 102

Auf Grundlage dieser Werte kann nun der Mittelwert bestimmt werden. Dafür werden alle Füllmengen zusammenaddiert und anschließend durch die Anzahl der Gläser geteilt.

Summe der Füllmengen: 98 + 101 + 95 + ….. + 88 + 95 + 102 = 1.953
Mittelwert der Füllmengen: 1.953 / 20 = 97,65

Wenn man nun pro Glas die jeweiligen gemessenen Füllmengen von dem soeben ermittelten Mittelwert subtrahiert, bestimmt man die Abweichungen der Füllmenge Creme pro Glas von dem Mittelwert.

Dies bietet dann eine Grundlage für die Standardabweichung, die wir im weiteren Verlauf benötigen.

I X̅ – X I  => 1:  I 97,65 – 98 I = 0,35

Diese Rechenweise soll auf jeden Wert in der Tabelle angewendet werden.

Tabelle 2: Abweichungen vom Mittelwert

1 0,35 11 5,65
2 3,35 12 2,35
3 2,65 13 0,35
4 5,65 14 2,35
5 8,35 15 3,35
6 1,35 16 1,65
7 1,65 17 4,65
8 3,35 18 9,65
9 4,35 19 2,65
10 0,35 20 4,35

Mit diesen Werten lässt sich nun die Varianz bestimmen. Um die Varianz zu berechnen nimmt man die Abweichungen zum Quadrat und addiert anschließend alle Werte miteinander. Zum Schluss teilt man das Ergebnis noch durch die Anzahl (n) der Werte.

0,35² + 3,35² + … + 2,65² + 4,35² = 352,55
352,55 / 20 = 17,6275

Nun kann auch die Standardabweichung bestimmt werden.
Hierfür zieht man die Wurzel aus der Varianz.

S = √17,6275 = 4,1985

Nun benötigt man Werte die man bereits hat.
Zum einen den Mittelwert zum anderen die Standardabweichung. Außerdem benötigt man die Vergleichsgröße
μ0 von 100 Millilitern und die Stichprobengröße n=20.

Mit folgender Formel erhältst du den t-Wert, welcher die Prüfgröße der Teststatistik bestimmt.

Nun setzen wir unsere  gegebenen Werte in die oben genannte Formel ein.

(97,65 – 100) / (4,1985 / √20 ) = -2,5032

Jetzt haben wir also den T-Wert bestimmt.

Nun musst du den T-Wert mit dem kritischen Wert vergleichen.
Der kritische Wert muss nicht berechnet werden, sondern kann einfach aus der t-Verteilung Tabelle entnommen werden.

Die Tabelle zeigt Werte, die die kritischen Werte darstellen.
Um herauszufinden was unser kritischer Wert ist muss man den Freiheitsgrad und das Signifikanzniveau kennen.

Den Freiheitsgrad bekommst du ganz einfach, wenn du deinen Stichprobenumfang (n) mit 1 subtrahierst.

In unserem Fall wäre der Freiheitsgrad dann also
20 – 1 = 19

Das Signifikanzniveau ist ein vorher festgelegter Wert, in unserem Fall können wir als Beispiel 5% nehmen. Das heißt, dass Alpha gleich 0,05 entspricht.
Um nun das Signifikanzniveau aus der Tabelle abzulesen, musst du Alpha von 1 abziehen.

Den kritischen Wert, den du nun abliest, findest du unter 19 ; 0,95.

Nehmen wir an der kritische Wert liegt bei 1,3208.
Der kritische Wert aus der Tabelle ist jedoch nur bei rechtsseitigen Tests direkt ablesbar.
Um auf den Wert für einen linksseitigen Test ( hier ist das der Fall ) zu kommen, musst du einfach den Kehrwert des abgelesenen kritischen Werts bilden.
In unserem Fall wäre das dann -1,3208.

Nun wird der T-Wert mit dem kritischen Wert verglichen.

T-Wert -2,5032 < kritischer Wert -1,3208

Wie deute ich das Ergebnis?

Das heißt nun für uns, dass unser Ergebnis im kritischen Bereich liegt und unsere Nullhypothese abgelehnt wird.
Gleichzeitig heißt das auch, dass die Hypothese angenommen wird und weitere Maßnahmen getroffen werden müssen.

 

Zweistichproben t-Test

Was ist das?

Der Zweistichproben t-Test zeigt dir, ob sich die Mittelwerte von zwei Stichproben voneinander unterscheiden. Hier vergleichst du also zwei Mittelwerte miteinander.

Bei den Zweistichproben t-Tests unterscheidet man außerdem noch zwischen gepaarten (auch abhängiger t-Test genannt) und ungepaarten (auch unabhängiger t-Test genannt) t-Tests unterschieden.

Wie führe ich den Test durch?

Ich erläutere dies an einem kurzen Beispiel.

Ungepaarter T-Test

Der ungepaarte t-Test wird bei zwei unabhängigen Stichproben angewendet.
Es werden also zwei unterschiedliche Stichproben an Leuten miteinander verglichen.

Hier könnten zum Beispiel zwei unabhängige Menschengruppen auf Ihre Lebensalter im Zusammenhang zur Ernährung getestet werden.

Während die eine Gruppe sich vegan ernährt, ernährt sich die andere Gruppe omnivor (also essen sowohl tierische als auch pflanzliche Lebensmittel).

Nun soll der Zusammenhang zwischen dem Ernährungsstil und der Lebenserwartung erörtert werden.

Nun geht man folgendermaßen vor:

  1. Datensatz für die erreichten Lebensalter bestimmen (sowohl für den veganen als auch für den omnivoren Lebensstil)
  2. Nun muss die Prüfgröße berechnet werden. Dafür werden jeweils die Mittelwerte, die Anzahl der Beobachtungen und die Varianzen benötigt.
  3. Nun setzt man sie erhaltenen Werte in dies oben genannte Formel ein und erhält einen Wert für die Prüfgröße T.
  4. Nun ist es wichtig, dass man die Verteilung der Prüfgröße bestimmt. Dafür addiert man die Anzahl der Beobachtungen miteinander und subtrahiert davon 2. Das Ergebnis zeigt so die Freiheitsgrade.
  5. Nun muss der kritische Bereich ermittelt werden. Dies funktioniert wie beim Einstichproben t-Test einfach indem man die Freiheitsgrade und das Signifikanzniveau bestimmt.
  6. Abschließend muss die Testentscheidung getroffen werden. Auch hier wird der kritische Wert mit der Prüfgröße verglichen. Liegt die Prüfgröße nicht im kritischen Bereich wird die Nullhypothese nicht abgelehnt. Liegt die Prüfgröße jedoch im kritischen Bereich wird die Nullhypothese abgelehnt und die Hypothese angenommen.

 

Gepaarter t-Test

Der gepaarte t-Test hingegen zeigt ein und dieselbe Stichprobengruppe, jedoch zu verschiedenen Zeitpunkten (deswegen sind es theoretisch zwei Stichproben, die man zieht).

Nehmen wir als Beispiel Medikamente, die die Schilddrüsenfunktion verbessern.

Bei dem gepaarten t-Test wird dieses Medikament an die auserwählten Personen verabreicht. Vorher wird deren Schilddrüsenfunktion gemessen und anschließend mit den Werten nach dem Medikament verglichen.

Mit diesen Werten rechnet man dann genau wie beim Einstichproben t-Test.
Man berechnet zunächst die Abweichung und anschließend die Varianz und die Standardabweichung.

Anschließend setzt man alle Werte in die Formel für den T-Wert ein und vergleicht das Ergebnis mit dem kritischen Wert.

 

Fazit

Wie du sehen kannst, gibt es verschiedene Arten den t-Test durchzuführen, die sich in der Vorgehensweise sehr ähneln.
Außerdem ist der t-Test besonders im Alltag relevant, wenn man etwas Vergleichen möchte um dann gewisse Entschlüsse zu treffen.
Ein t-Test kann somit einem Unternehmen einen großen wirtschaftlichen Erfolg einbringen

 

Autor:
Ellen Meier

 

Quellen: