Ein Hypothesentest ist eine Methode, um zu prüfen, ob Stichprobendaten zu stark von einer Ausgangsbehauptung abweichen. Diese Ausgangsbehauptung heißt Nullhypothese und wird als geschrieben.
Die Methode beweist nicht, dass wahr oder falsch ist. Sie stellt eine engere Frage: Wenn wahr wäre, wären Daten, die so extrem sind, ungewöhnlich genug, dass wir daran zweifeln sollten?
Die Grundidee
Jeder Hypothesentest hat zwei konkurrierende Aussagen:
- Die Nullhypothese , also die Standardannahme, die geprüft wird.
- Die Alternativhypothese oder , also das, was du unterstützen würdest, wenn die Daten genug Evidenz gegen liefern.
Dann wählst du vor dem Betrachten des Ergebnisses ein Signifikanzniveau , oft . Das ist der Grenzwert dafür, wie viel Evidenz du brauchst, bevor du verwirfst.
Zwei Ergebnisse sind möglich:
- verwerfen: Die Daten sind mit dem Nullmodell ausreichend unvereinbar.
- nicht verwerfen: Die Daten sind nicht stark genug, um das Nullmodell auszuschließen.
" nicht verwerfen" ist nicht dasselbe wie "als wahr akzeptieren". Es bedeutet nur, dass die Stichprobe nicht genug starke Evidenz gegen geliefert hat.
Die üblichen Schritte
Der Ablauf ist meist:
- Formuliere und klar.
- Wähle und einen Test, der zu den Daten und Annahmen passt.
- Berechne aus der Stichprobe eine Teststatistik.
- Wandle diese Statistik in einen -Wert um oder vergleiche sie mit einem kritischen Wert.
- Triff die Entscheidung und interpretiere sie im Kontext.
Die Teststatistik hängt von der Situation ab. Ein -Test, -Test, Chi-Quadrat-Test und viele andere sind alles Beispiele für Hypothesentests. Es gibt keine einzige Formel für alle Hypothesentests.
Was der -Wert bedeutet
Ein -Wert ist die Wahrscheinlichkeit, unter der Annahme, dass wahr ist und die Testannahmen gelten, ein Ergebnis zu erhalten, das mindestens so extrem ist wie das beobachtete.
Ein kleiner -Wert bedeutet, dass die Daten unter ungewöhnlich wären. Deshalb gelten kleine -Werte als Evidenz gegen die Nullhypothese.
Er bedeutet nicht:
- Die Wahrscheinlichkeit, dass falsch ist.
- Die Wahrscheinlichkeit, dass dein Ergebnis im vagen alltagssprachlichen Sinn "durch Zufall" entstanden ist.
- Die Größe oder Wichtigkeit des Effekts.
Wichtige Arten von Hypothesentests
Es gibt zwei nützliche Arten, Tests zu gruppieren.
Nach Richtung
Ein einseitiger Test sucht nur nach einer Veränderung in eine Richtung.
- Rechtsseitig: Werte, die größer sind als die Behauptung der Nullhypothese, sprechen für .
- Linksseitig: Werte, die kleiner sind als die Behauptung der Nullhypothese, sprechen für .
Ein zweiseitiger Test sucht nach einer Abweichung in beide Richtungen. Wenn "ungleich" ist, verteilt sich der Ablehnungsbereich auf beide Enden.
Nach Datensituation
- Ein -Test wird in manchen Situationen zum Testen von Mittelwerten verwendet, wenn die Standardabweichung der Grundgesamtheit bekannt ist oder eine begründete Näherung für große Stichproben verwendet wird.
- Ein -Test ist bei Mittelwerten üblich, wenn die Standardabweichung der Grundgesamtheit unbekannt ist und die Bedingungen vernünftig sind.
- Ein Chi-Quadrat-Test wird für kategoriale Häufigkeitsdaten verwendet.
Der richtige Test hängt vom Variablentyp, vom Stichprobendesign und von den Annahmen ab. Erst die Formel und dann die Frage zu wählen, ist ein häufiger Fehler.
Durchgerechnetes Beispiel
Angenommen, eine Abfüllmaschine soll im Mittel mL pro Flasche abfüllen. Ein Team der Qualitätskontrolle zieht eine Stichprobe von Flaschen und erhält einen Stichprobenmittelwert von mL.
Nimm für dieses Beispiel an, dass die Standardabweichung der Grundgesamtheit als mL bekannt ist und die Stichprobenbedingungen einen Einstichproben--Test rechtfertigen.
Stelle die Hypothesen auf:
Das ist ein linksseitiger Test, weil die Sorge eine Unterfüllung ist.
Der Standardfehler ist
Also ist die Teststatistik
Wenn für einen linksseitigen -Test gilt, ist der kritische Wert ungefähr . Weil , liegt das Ergebnis im Ablehnungsbereich.
Die Entscheidung ist also, auf dem -Niveau zu verwerfen. Im Kontext liefert die Stichprobe Evidenz dafür, dass die Maschine im Mittel zu wenig abfüllt.
Diese Schlussfolgerung hängt von den Testannahmen ab. Wenn die Annahmen schlecht erfüllt sind, kann die Schlussfolgerung unzuverlässig sein, selbst wenn die Rechnung korrekt ist.
Fehler 1. Art und Fehler 2. Art
Hypothesentests beinhalten immer ein Fehlerrisiko.
Ein Fehler 1. Art bedeutet, zu verwerfen, obwohl sie wahr ist. Seine Wahrscheinlichkeit wird durch gesteuert.
Ein Fehler 2. Art bedeutet, nicht zu verwerfen, obwohl wahr ist. Seine Wahrscheinlichkeit wird meist mit bezeichnet.
Wenn man verringert, werden Fehlalarme unwahrscheinlicher, aber echte Effekte können dann auch schwerer zu erkennen sein, wenn sich sonst nichts ändert. Dieser Zielkonflikt ist ein Grund, warum der Stichprobenumfang wichtig ist.
Häufige Fehler
Ein häufiger Fehler ist zu sagen, ein nicht signifikantes Ergebnis beweise, dass es keinen Effekt gibt. Meist zeigt es nur, dass die Daten nicht stark genug waren, um einen Effekt nachzuweisen.
Ein weiterer Fehler ist, statistische Signifikanz mit praktischer Relevanz gleichzusetzen. Ein winziger Effekt kann in einer sehr großen Stichprobe statistisch signifikant sein.
Tests werden auch falsch verwendet, wenn Annahmen über Unabhängigkeit, Verteilungsform, Varianz oder Datentyp ignoriert werden. Ein sauber aussehender -Wert rettet keinen unpassenden Test.
Wann Hypothesentests verwendet werden
Hypothesentests werden in der Wissenschaft, in der Fertigung, in der Medizin, bei Umfragen, bei A/B-Tests und in der Politikanalyse verwendet. Das Ziel ist meist dasselbe: zu entscheiden, ob die Stichprobe genug Evidenz liefert, um eine Standardannahme infrage zu stellen.
In der Praxis geht es bei guten Tests nicht nur um die Rechnung. Man braucht auch eine sinnvolle Nullhypothese, ein gut begründetes Design und eine Interpretation, die dazu passt, was der Test tatsächlich aussagen kann.
Probiere deine eigene Variante
Nimm dasselbe Beispiel mit den Flaschen, aber ändere den Stichprobenmittelwert auf mL. Berechne die Teststatistik neu und prüfe, ob sich die Entscheidung bei ändert. Das ist eine schnelle Möglichkeit zu sehen, wie Evidenz stärker oder schwächer wird, wenn sich das Stichprobenergebnis dem Nullwert annähert.
Brauchst du Hilfe bei einer Aufgabe?
Lade deine Frage hoch und erhalte in Sekunden eine verifizierte Schritt-für-Schritt-Lösung.
GPAI Solver öffnen →