Der t-Test

Irgendwie kommt es einem so bekannt vor, doch man weiß nicht so richtig was das ist – der t-Test.

Wenn man sich schon einmal mit statistischen Verfahren beschäftigt hat oder in Zukunft beschäftigen möchte, wird man dem Begriff des t-Tests hin und wieder über den Weg laufen.
Der t-Test ist ein Hypothesentest einer t-Verteilung und wird verwendet, um statistisch signifikante Unterschiede von Stichproben zu bestimmen.

In diesem Artikel zeige ich dir die verschieden Arten von t-Tests, wie man den Test durchführt und wie man das Ergebnis deuten kann.

In diesem Artikel:

Über den t-Test
Einstichproben t-Test
Zweistichproben t-Test
- Was ist das?
- Wie führe ich den Test durch?
  - Ungepaarter t-Test
  - Gepaarter t-Test
Fazit

Über den t-Test

Grundsätzlich prüft der t-Test, ob der Mittelwert eines Merkmals, der in einer Stichprobe ermittelt wurde, sich von einem theoretischen Wert dieses Merkmals abweicht (z.B. die reale Haltbarkeitsdauer eines Produkts von der gesetzlich vorgeschriebenen) oder ob die Mittelwerte zweier Gruppen sich voneinander unterscheiden (z.B. Präferenz für eine Automarke unter Männern und Frauen).

Diese beiden Herangehensweisen an die Prüfung des Mittelwertunterschiedes begründen zwei grundsätzliche Varianten vom t-Test: Einstichproben t-Test und Zweistichproben t-Test. Im Folgenden erläutere ich diese beiden Varianten in mehr Detail.

Einstichproben t-Test

Was ist das?

Der Einstichproben t-Test überprüft, ob der Mittelwert einer Stichprobe signifikant von einem bestimmten Erwartungswert abweicht.

So kann es z.B. geprüft werden, ob der Zuckergehalt eines Produktionsloses eines Erfrischungsgetränks im Mittel der von der Rezeptur vorgesehenen Menge entspricht. Hierzu wird aus der an einem Tag produzierten Menge eine Stichprobe von Flaschen zufällig gezogen und deren Zuckergehalt gemessen. Der Mittelwert von den gemessenen Zuckergehalte wird dann mit dem Wert aus dem Rezept verglichen. Weicht der gemessene Mittelwert vom Rezept ab, so kann der Produktionslos nicht ausgeliefert werden.

Wie führe ich den Test durch?

Der Einstichproben t-Test kann Linksseitig, Rechtsseitig oder Zweiseitig sein.

KURZ:
Linksseitig ist ein Testverfahren, wenn die Abweichung der getesteten Größte von dem erwarteten Wert nach unten geprüft wird.

Also lautet in unserem Beispiel die Hypothese, ob es in den entnommenen Flaschen weniger Zucker enthalten ist, als die Rezeptur es vorsieht.

Rechtsseitig ist die Teststatistik hingegen, wenn die Abweichung des uns interessierenden Wertes nach oben geprüft wird.

In unserem Beispiel heißt das, ob wir mehr Zucken in die Flaschen getan haben, als die Rezeptur es fordert.

Der zweiseitige t-Test testet hingegen in keine spezielle Richtung. Er weist nur eine Abweichung vom zu prüfenden Wert nach.

M.a.W. ist es uns nicht wichtig, in welche Richtung der Zuckergehalt abweicht – es ist uns nur wichtig, dass dem vorgeschriebenen Wert entspricht. Jede Abweichung – ob nach oben oder nach unten – ist für unseren Betrieb schädlich. In einem solchen Fall müssen wir eingreifen.

Betrachten wir nun die Durchführung des t-Tests anhand eines anderen Beispiels:

Du betreibst ein Beauty Unternehmen, welches Feuchtigkeitscremes herstellt.
Ein Glas der Feuchtigkeitscreme enthält 100ml. Deine Mitarbeiter machen dich jedoch darauf Aufmerksam, dass es sein könnte, dass die Abfüllmaschine weniger als die versprochenen 100ml abfüllt.

Dies sollte man als Unternehmensleiter natürlich überprüfen, da die Zufriedenheit der Kunden davon abhängen könnte. Dafür kannst du einen t-Test durchführen.

Es wird somit die Hypothese aufgestellt, dass die Füllung des Glases mit der Creme überdurchschnittlich oft unter dem 100 ml Inhalt liegt. Diese muss nun getestet werden.

Die Nullhypothese – so nennt man den Gegenteil der zu prüfenden Hypothese – würde lauten: Die Füllung des Glases der Creme weicht nicht von dem 100 ml Inhalt ab.

Um unsere Haupthypothese zu bestätigen, muss im laufe des t-Tests die Nullhypothese abgelehnt werden. Diese Ablehnung der Nullhypothese würde uns den statistischen Beweis dafür liefern, dass die Füllmenge des Cremes tatsächlich nicht eingehalten wird. In diesem Fall müssen wir eingreifen und die Einstellungen der Füllmaschine korrigieren.

Sobald wir die Hypothesen definiert haben, beginnt die Testphase:

Um den t-Test durchzuführen, müssen wir zunächst den sogenannten t-Wert ermitteln, der sich nach folgender Formel bestimmt wird:

Diese Formel setzt die durchschnittliche Abweichung zwischen dem ermittelten Mittelwert der zu prüfenden Größe (X̅ – durchschnittliche Menge der Creme pro Glas) und seinem theoretischen Wert (µ0 – Soll-Menge pro Glas) in Relation zur Varianz dieser Größe (s2) pro Glas (n).

Ist der Zähler gleich Null, so heißt es, es gibt keinen Unterschied zwischen der tatsächlichen und erwarteten Füllmenge. Unsere Gläser erfüllen demnach den Produktionsstandard. Der t-Wert ist in diesem Fall auch gleich Null.

Weicht der Zähler von Null ab, so heißt es, dass die tatsächlich gefüllte Menge von der erwarteten Menge (100ml) im Durchschnitt abweicht. Die Frage ist nun, wie stark diese Abweichung ist bzw. wie viel Abweichung zwischen der tatsächlichen und erwarteten Füllmenge wir pro Glas beobachten?

Um diese Frage zu beantworten, ziehen wie das Konzept der Varianz (s2) heran, die es zeigt, wie stark der gemessene Wert um den Mittelwert variiert. Da die Varianz jedoch sich auf alle Gläser bezieht und wir an der Abweichung pro Glas interessiert sind, müssen wir die Varianz durch die Anzahl von Gläsern (n) teilen.

Ist der Nenner (Varianz pro Glas) groß, sinkt die Teststatistik (t), da die Crememenge pro Glas stark zu variieren scheint. Ist die Varianz pro glas gering, so heißt es, dass die Crememenge pro Glas ziemlich stabil bleibt, die Teststatistik steigt demzufolge.

Als Daumenregel gilt es, dass die Abweichung von X̅ von µ0 dann als signifikant gilt, wenn der t-Wert über 2 ist. Das Vorzeichen ist dabei irrelevant.

Zuerst wird eine Stichprobe z.B. von 20 Gläsern Creme gezogen. Wir messen die Füllmenge jedes dieser Gläsern und bekommen so den Basis-Datensatz, der uns die Ausgangswerte für den t-Test liefert.

Tabelle 1: Füllmenge der Creme pro Glas

n	Füllmenge in ml	n	Füllmenge in ml
1	98	11	92
2	101	12	100
3	95	13	98
4	92	14	100
5	106	15	101
6	99	16	96
7	96	17	93
8	101	18	88
9	102	19	95
10	98	20	102

Auf Grundlage dieser Werte kann nun der Mittelwert bestimmt werden. Dafür werden alle Füllmengen zusammenaddiert und anschließend durch die Anzahl der Gläser geteilt.

Summe der Füllmengen: 98 + 101 + 95 + ….. + 88 + 95 + 102 = 1.953
Mittelwert der Füllmengen: 1.953 / 20 = 97,65

Wenn man nun pro Glas die jeweiligen gemessenen Füllmengen von dem soeben ermittelten Mittelwert subtrahiert, bestimmt man die Abweichungen der Füllmenge Creme pro Glas von dem Mittelwert.

Dies bietet dann eine Grundlage für die Standardabweichung, die wir im weiteren Verlauf benötigen.

I X̅ – X I => 1: I 97,65 – 98 I = 0,35

Diese Rechenweise soll auf jeden Wert in der Tabelle angewendet werden.

Tabelle 2: Abweichungen vom Mittelwert

1	0,35	11	5,65
2	3,35	12	2,35
3	2,65	13	0,35
4	5,65	14	2,35
5	8,35	15	3,35
6	1,35	16	1,65
7	1,65	17	4,65
8	3,35	18	9,65
9	4,35	19	2,65
10	0,35	20	4,35

Mit diesen Werten lässt sich nun die Varianz bestimmen. Um die Varianz zu berechnen nimmt man die Abweichungen zum Quadrat und addiert anschließend alle Werte miteinander. Zum Schluss teilt man das Ergebnis noch durch die Anzahl (n) der Werte.

0,35² + 3,35² + … + 2,65² + 4,35² = 352,55
352,55 / 20 = 17,6275

Nun kann auch die Standardabweichung bestimmt werden.
Hierfür zieht man die Wurzel aus der Varianz.

S = √17,6275 = 4,1985

Nun benötigt man Werte die man bereits hat.
Zum einen den Mittelwert zum anderen die Standardabweichung. Außerdem benötigt man die Vergleichsgröße
μ0 von 100 Millilitern und die Stichprobengröße n=20.

Mit folgender Formel erhältst du den t-Wert, welcher die Prüfgröße der Teststatistik bestimmt.

Nun setzen wir unsere gegebenen Werte in die oben genannte Formel ein.

(97,65 – 100) / (4,1985 / √20 ) = -2,5032

Jetzt haben wir also den T-Wert bestimmt.

Nun musst du den T-Wert mit dem kritischen Wert vergleichen.
Der kritische Wert muss nicht berechnet werden, sondern kann einfach aus der t-Verteilung Tabelle entnommen werden.

Die Tabelle zeigt Werte, die die kritischen Werte darstellen.
Um herauszufinden was unser kritischer Wert ist muss man den Freiheitsgrad und das Signifikanzniveau kennen.

Den Freiheitsgrad bekommst du ganz einfach, wenn du deinen Stichprobenumfang (n) mit 1 subtrahierst.

In unserem Fall wäre der Freiheitsgrad dann also
20 – 1 = 19

Das Signifikanzniveau ist ein vorher festgelegter Wert, in unserem Fall können wir als Beispiel 5% nehmen. Das heißt, dass Alpha gleich 0,05 entspricht.
Um nun das Signifikanzniveau aus der Tabelle abzulesen, musst du Alpha von 1 abziehen.

Den kritischen Wert, den du nun abliest, findest du unter 19 ; 0,95.

Nehmen wir an der kritische Wert liegt bei 1,3208.
Der kritische Wert aus der Tabelle ist jedoch nur bei rechtsseitigen Tests direkt ablesbar.
Um auf den Wert für einen linksseitigen Test ( hier ist das der Fall ) zu kommen, musst du einfach den Kehrwert des abgelesenen kritischen Werts bilden.
In unserem Fall wäre das dann -1,3208.

Nun wird der T-Wert mit dem kritischen Wert verglichen.

T-Wert -2,5032 < kritischer Wert -1,3208

Wie deute ich das Ergebnis?

Das heißt nun für uns, dass unser Ergebnis im kritischen Bereich liegt und unsere Nullhypothese abgelehnt wird.
Gleichzeitig heißt das auch, dass die Hypothese angenommen wird und weitere Maßnahmen getroffen werden müssen.

Zweistichproben t-Test

Was ist das?

Der Zweistichproben t-Test zeigt dir, ob sich die Mittelwerte von zwei Stichproben voneinander unterscheiden. Hier vergleichst du also zwei Mittelwerte miteinander.

Bei den Zweistichproben t-Tests unterscheidet man außerdem noch zwischen gepaarten (auch abhängiger t-Test genannt) und ungepaarten (auch unabhängiger t-Test genannt) t-Tests unterschieden.

Wie führe ich den Test durch?

Ich erläutere dies an einem kurzen Beispiel.

Ungepaarter T-Test

Der ungepaarte t-Test wird bei zwei unabhängigen Stichproben angewendet.
Es werden also zwei unterschiedliche Stichproben an Leuten miteinander verglichen.

Hier könnten zum Beispiel zwei unabhängige Menschengruppen auf Ihre Lebensalter im Zusammenhang zur Ernährung getestet werden.

Während die eine Gruppe sich vegan ernährt, ernährt sich die andere Gruppe omnivor (also essen sowohl tierische als auch pflanzliche Lebensmittel).

Nun soll der Zusammenhang zwischen dem Ernährungsstil und der Lebenserwartung erörtert werden.

Nun geht man folgendermaßen vor:

Datensatz für die erreichten Lebensalter bestimmen (sowohl für den veganen als auch für den omnivoren Lebensstil)
Nun muss die Prüfgröße berechnet werden. Dafür werden jeweils die Mittelwerte, die Anzahl der Beobachtungen und die Varianzen benötigt.
Nun setzt man sie erhaltenen Werte in dies oben genannte Formel ein und erhält einen Wert für die Prüfgröße T.
Nun ist es wichtig, dass man die Verteilung der Prüfgröße bestimmt. Dafür addiert man die Anzahl der Beobachtungen miteinander und subtrahiert davon 2. Das Ergebnis zeigt so die Freiheitsgrade.
Nun muss der kritische Bereich ermittelt werden. Dies funktioniert wie beim Einstichproben t-Test einfach indem man die Freiheitsgrade und das Signifikanzniveau bestimmt.
Abschließend muss die Testentscheidung getroffen werden. Auch hier wird der kritische Wert mit der Prüfgröße verglichen. Liegt die Prüfgröße nicht im kritischen Bereich wird die Nullhypothese nicht abgelehnt. Liegt die Prüfgröße jedoch im kritischen Bereich wird die Nullhypothese abgelehnt und die Hypothese angenommen.

Gepaarter t-Test

Der gepaarte t-Test hingegen zeigt ein und dieselbe Stichprobengruppe, jedoch zu verschiedenen Zeitpunkten (deswegen sind es theoretisch zwei Stichproben, die man zieht).

Nehmen wir als Beispiel Medikamente, die die Schilddrüsenfunktion verbessern.

Bei dem gepaarten t-Test wird dieses Medikament an die auserwählten Personen verabreicht. Vorher wird deren Schilddrüsenfunktion gemessen und anschließend mit den Werten nach dem Medikament verglichen.

Mit diesen Werten rechnet man dann genau wie beim Einstichproben t-Test.
Man berechnet zunächst die Abweichung und anschließend die Varianz und die Standardabweichung.

Anschließend setzt man alle Werte in die Formel für den T-Wert ein und vergleicht das Ergebnis mit dem kritischen Wert.

Fazit

Wie du sehen kannst, gibt es verschiedene Arten den t-Test durchzuführen, die sich in der Vorgehensweise sehr ähneln.
Außerdem ist der t-Test besonders im Alltag relevant, wenn man etwas Vergleichen möchte um dann gewisse Entschlüsse zu treffen.
Ein t-Test kann somit einem Unternehmen einen großen wirtschaftlichen Erfolg einbringen

Autor:
Ellen Meier

Quellen:

Cookie	Duration	Description
cookielawinfo-checkbox-analytics	11 Monate	Dieses Cookie wird vom GDPR Cookie Consent Plugin gesetzt. Das Cookie wird verwendet, um die Zustimmung des Nutzers für die Cookies in der Kategorie "Analytics" zu speichern.
cookielawinfo-checkbox-functional	11 Monate	Das Cookie wird durch die GDPR-Cookie-Zustimmung gesetzt, um die Zustimmung des Benutzers für die Cookies in der Kategorie "Funktional" aufzuzeichnen.
cookielawinfo-checkbox-necessary	11 Monate	Dieses Cookie wird vom GDPR Cookie Consent Plugin gesetzt. Das Cookie wird verwendet, um die Zustimmung des Nutzers für die Cookies der Kategorie "Notwendig" zu speichern.
cookielawinfo-checkbox-others	11 Monate	Dieses Cookie wird vom GDPR Cookie Consent Plugin gesetzt. Das Cookie wird verwendet, um die Zustimmung des Nutzers für die Cookies in der Kategorie "Andere" zu speichern.
cookielawinfo-checkbox-performance	11 Monate	Dieses Cookie wird vom GDPR Cookie Consent Plugin gesetzt. Das Cookie wird verwendet, um die Zustimmung des Nutzers für die Cookies in der Kategorie "Leistung" zu speichern.
viewed_cookie_policy	11 Monate	Das Cookie wird vom GDPR Cookie Consent Plugin gesetzt und wird verwendet, um zu speichern, ob der Nutzer der Verwendung von Cookies zugestimmt hat oder nicht. Es speichert keine persönlichen Daten.

Cookie	Duration	Description
_ym_visorc	30 Minuten	Yandex setzt dieses Cookie, damit das Session Replay der Website korrekt funktioniert.
ymex	1 Jahr	Yandex speichert dieses Cookie im Browser des Benutzers, um den Besucher wiederzuerkennen.
yuidss	1 Jahr	Yandex speichert dieses Cookie im Browser des Benutzers, um den Besucher wiederzuerkennen.

Cookie	Duration	Description
_ga	2 Jahre	Das _ga-Cookie, das von Google Analytics installiert wird, berechnet Besucher-, Sitzungs- und Kampagnendaten und verfolgt auch die Nutzung der Website für den Analysebericht der Website. Das Cookie speichert Informationen anonym und weist eine zufällig generierte Nummer zu, um eindeutige Besucher zu erkennen.
_gat_UA-120478415-1	1 minute	Eine Variante des _gat-Cookies, das von Google Analytics und Google Tag Manager gesetzt wird, um Website-Besitzern zu ermöglichen, das Besucherverhalten zu verfolgen und die Leistung der Website zu messen. Das Musterelement im Namen enthält die eindeutige Identitätsnummer des Kontos oder der Website, auf die es sich bezieht.
_gcl_au	3 Monate	Wird von Google Tag Manager zur Verfügung gestellt, um die Werbeeffizienz von Websites zu testen, die deren Dienste nutzen.
_gid	1 Tag	Das von Google Analytics installierte _gid-Cookie speichert Informationen darüber, wie Besucher eine Website nutzen, und erstellt einen Analysebericht über die Leistung der Website. Zu den gesammelten Daten gehören die Anzahl der Besucher, ihre Quelle und die Seiten, die sie anonym besuchen.
_ym_d	1 Jahr	Yandex setzt dieses Cookie, um das Datum der ersten Sitzung des Benutzers auf der Website zu speichern.
_ym_isad	20 Stunden	Yandex setzt dieses Cookie, um festzustellen, ob ein Besucher Werbeblocker hat.
_ym_uid	1 Jahr	Yandex setzt dieses Cookie, um die Benutzer der Website zu identifizieren.
yabs-sid	Session	Yandex setzt dieses Cookie, um die Sitzungs-ID zu speichern.
yandexuid	1 Jahr	Yandex setzt dieses Cookie, um die Benutzer der Website zu identifizieren.

Cookie	Duration	Description
_fbp	3 Monate	Dieses Cookie wird von Facebook gesetzt, um nach dem Besuch der Website entweder auf Facebook oder auf einer digitalen Plattform, die von Facebook-Werbung unterstützt wird, Werbung anzuzeigen.
i	10 Jahre	Dieses Cookie wird von OpenX gesetzt, um anonymisierte Nutzerdaten wie IP-Adresse, geografischer Standort, besuchte Websites, vom Nutzer angeklickte Anzeigen usw. für relevante Werbung aufzuzeichnen.

Der t-Test

Über den t-Test

Einstichproben t-Test

Was ist das?

Wie führe ich den Test durch?

Wie deute ich das Ergebnis?

Zweistichproben t-Test

Was ist das?

Wie führe ich den Test durch?

Ungepaarter T-Test

Gepaarter t-Test

<img decoding="async" class="alignnone size-full wp-image-2944" src="https://www.questionstar.de/wp-content/uploads/2021/01/1505.png" alt="" width="236" height="153" />

Fazit

Informationen über Cookies