Mann Whitney U Test
Du weißt noch nicht so ganz, wann du den Mann-Whitney-U-Test verwendest? Hier und in unserem Video zeigen wir dir alles, was du wissen musst!
Inhaltsübersicht
Was ist der Mann Whitney U Test?
Der Mann-Whitney-U-Test prüft, ob es einen signifikanten Unterschied zwischen zwei unabhängigen Stichproben gibt. Der Test verwendet dafür nicht die Originaldaten der beiden Stichproben, sondern ihre Rangsummen.
Den U-Test von Mann-Whitney verwendest du, wenn die Voraussetzungen für den t-Test für unabhängige Stichproben nicht erfüllt sind.
Aber auch wenn der t-Test für unabhängige Stichproben Mittelwertsunterschiede und der Mann-Whitney-U-Test Unterschiede in der zentralen Tendenz untersucht, beantworten sie dennoch dieselben Forschungsfragen.
- Unterscheidet sich die Social Media-Nutzungsdauer von Schülern und Studenten?
- Haben Hintergrundgeräusche einen Einfluss auf die Schlafdauer?
- Hat eine neue Lehrmethode Einfluss auf die Lesekompetenz bei Grundschülern?
Voraussetzungen für den Mann Whitney U Test
Der Mann-Whitney-U-Test hat einen geringeren Anspruch an die Daten als der t-Test für unabhängige Stichproben . Das heißt, dass deine Daten nicht normalverteilt sein müssen und du den Test auch bei kleinen Stichproben oder Ausreißern verwenden kannst.
Dennoch gibt es auch hier ein paar Anforderungen an die Daten, um den Mann-Whitney-U-Test verwenden zu können:
-
Unabhängigkeit der Messungen
Der Messwert aus einer Gruppe darf nicht abhängig von einem Messwert aus einer anderen Gruppe sein. Schließlich ist der U-Test von Mann-Whitney ein Test für unabhängige Stichproben.
-
Nominalskalenniveau
der unabhängigen Variable
Die unabhängige Variable sollte kategorial sein und zwei Ausprägungen besitzen. Die Aufteilung in zwei Gruppen kann natürlichen Ursprungs sein (z.B. Geschlecht) oder künstlich erzeugt werden (z.B. selbst festgelegte Einteilung in Altersgruppen).
-
Ordinalskalenniveau
der abhängigen Variable
Die abhängige Variable hingegen muss mindestens ordinalskaliert sein. Beispiele für ordinale Variablen sind Ranglisten wie Schulnoten oder der Grad der Zufriedenheit mit einer Serviceleistung. Auch intervallskalierte Variablen können als abhängige Variable verwendet werden. Dazu zählen Likert-skalierte Items, Temperatur, Zeit oder Gewicht.
Übrigens: Der Mann Whitney U Test wird auch Wilcoxon-Rangsummentest genannt. Er ist aber nicht zu verwechseln mit dem Vorzeichenrangtest nach Wilcoxon. Dieser ist die voraussetzungsfreie Alternative zum t-Test für abhängige Stichproben. Von einer abhängigen Stichprobe sprichst du, wenn zum Beispiel die Leistung derselben Personengruppe zu zwei Zeitpunkten gemessen wird.
Hypothesen des Mann Whitney U Tests
Da der U-Test von Mann Whitney das Gegenstück zum t-Test ist, hat er auch ähnliche Hypothesen. Während der t-Test einen Unterschied zwischen den Mittelwerten beider Gruppen prüft, testet der Mann-Whitney-U-Test, ob es einen Unterschied in der zentralen Tendenz gibt.
Daraus ergeben sich folgende Hypothesen:
- Nullhypothese H0 = Es gibt keinen Unterschied in der zentralen Tendenz zwischen beiden Gruppen in der Grundgesamtheit.
- Alternativhypothese H1 = Es gibt einen Unterschied in der zentralen Tendenz zwischen beiden Gruppen in der Grundgesamtheit.
Ziel ist es natürlich, die H0 zu verwerfen.
Übrigens: Den t-Test bezeichnet man auch als parametrischen Test, da bei ihm die Daten normalverteilt sind. Dementsprechend ist der Mann-Whitney-U-Test ein nicht-parametrischer Test.
Berechnung der Mann-Whitney-U-Statistik
Beim Mann-Whitney-U-Test wird nicht mit den Messwerten selbst gerechnet. Stattdessen bildest du Rangplätze für die Messwerte und führst mit ihnen den Test durch.
Dafür bringst du die Daten aus beiden Stichproben zuerst in eine gemeinsame Rangreihe und gibst ihnen Rangplätze. Der kleinste Wert erhält dabei den Rangplatz 1, der nächstgrößere den Rangplatz 2 und so weiter.
Treten gleiche Werte in den Daten auf, bildest du aus den dazugehörigen Rangplätzen den Mittelwert. Haben beispielsweise Rang 2, 3 und 4 denselben Wert, würdest du den Mittelwert aus ihnen bilden: (2 + 3 + 4)/3 = 3. Diesen Mittelwert vergibst du als Rangplatz an alle Werte, die in die Durchschnittsbildung mit einbezogen wurden.
In unserem Beispiel wollen wir herausfinden, ob sich das Gewicht von Frauen und Männern signifikant unterscheidet. Dafür haben wir zehn zufällige Personen nach ihrem Gewicht befragt. Die gemeinsame Rangreihe und Zuordnung der Ränge kann zum Beispiel so aussehen:
Nachdem die Ränge vergeben wurden, addierst du jeweils die Rangplätze für die Stichprobe 1 und Stichprobe 2. Der größeren der beiden Rangsummen gibst du die Bezeichnung R1 und der kleineren die Bezeichnung R2.
Um im nächsten Schritt die Teststatistik U für jede Gruppe zu berechnen, benötigst du diese Formel:
mit
n1 = Stichprobengröße der Gruppe mit der höheren Rangsumme
n2 = Stichprobengröße der Gruppe mit der niedrigeren Rangsumme
R = Rangsumme R1 oder R2
Für die beiden Stichproben ergeben sich demnach unterschiedliche U-Werte:
Männlich: Anzahl der Fälle = 6 Rangsumme R1 = 36 |
Weiblich: Anzahl der Fälle = 4 Rangsumme R2 = 19 |
Signifikanz
Für die Berechnung der Signifikanz benötigst du zudem den geschätzten Erwartungswert und Standardfehler von U. Anschließend kannst du mit dem kleineren Wert von U1 und U2 den z-Wert berechnen.
Je nachdem wie groß die Stichprobe ist, wird auf unterschiedliche Weise ermittelt, ob ein signifikanter Unterschied vorliegt:
- Für Stichproben n < 30 kannst du den kritischen Wert aus der Tabelle der Mann-Whitney-U-Statistik ablesen. Gleichzeitig hast du hier die Möglichkeit den z-Wert zu berechnen und den kritischen Wert aus der Tabelle der Normalverteilung als Annäherung zu verwenden.
- Bei Stichproben n ≥ 30 musst du hingegen den z-Wert berechnen und die Tabelle der Normalverteilung verwenden.
In unserem Beispiel, mit n = 10, sind beide Varianten möglich.
Tipp: Die Tabelle für die kritischen Werte der Mann-Whitney-U-Statistik und für die Standardnormalverteilung kannst du dir hier herunterladen.
n < 30: Vergleich U-Wert mit dem kritischen Wert
Für Stichproben mit n < 30 vergleichst du den U-Wert mit dem exakten kritischen Wert aus der Tabelle der Mann-Whitney-U-Statistik. Den U-Wert bestimmst du aus dem Minimum von U1 und U2.
U-Wert:
Aus der Tabelle lässt sich ein exakter kritischer Wert von Ukrit = 2 ablesen. Um schließlich die Nullhypothese zu verwerfen, darf der U-Wert maximal denselben Wert haben wie der kritische Wert. Das ist bei unserem Beispiel jedoch nicht der Fall.
min(U) ≤ Ukrit → 9 > 2
n ≥ 30: Vergleich z-Wert mit dem kritischen Wert
Bei größeren Stichproben (n ≥ 30) benötigst du den z-Wert, den du mit dem geschätzten Erwartungswert und dem Standardfehler von U berechnest. Schließlich vergleichst du den z-Wert mit dem kritischen Wert der Standardnormalverteilung .
Erwartungswert von U:
Standardfehler von U:
z-Wert:
In der Tabelle der Standardnormalverteilung ergibt sich für das zweiseitige Signifikanzniveau von 5 % ein approximativer kritischer Wert von 1,96. Diesen Wert vergleichst du mit deinem berechneten z-Wert. Für einen signifikanten Unterschied muss der Betrag deines z-Wertes größer sein als der kritische Wert. Auch das ist für unser Beispiel nicht der Fall.
|z| > 1,96 → |-0,64| < 1,96
Das bedeutet, dass sich die beiden zentralen Tendenzen nicht signifikant voneinander unterscheiden. H0 kann also nicht verworfen werden.
Den Mann-Whitney-U-Test kannst du auch mit SPSS berechnen. Dafür gehst du wie Folgt vor: Analysieren → Nicht parametrische Tests → Alte Dialogfelder → 2 unabhängige Stichproben. Nachdem du deine abhängige und unabhängige Variable eingegeben hast, setzt du den Haken bei Mann-Whitney-U-test und lässt dir das Ergebnis anzeigen.
Effektstärke
Wie bedeutsam das Ergebnis deines Tests ist, lässt sich anhand der Effektstärke einordnen. Ein signifikantes Ergebnis bedeutet nicht automatisch, dass auch ein starker Effekt vorliegt.
Je nach Forschungsfrage kann die Effektstärke anzeigen, wie effektiv eine Behandlung oder Intervention ist. Bei Unterschiedshypothesen zeigt er an, wie aussagekräftig der berechnete Unterschied ist.
Um die Effektstärke zu bestimmen, berechnest du den Korrelationskoeffizient von Pearson (r) mithilfe des z-Wertes und der Stichprobengröße n.
Wie du einen Effekt einschätzt, lässt sich anhand folgender Kennzahlen ablesen:
- r = .10 = schwacher Effekt
- r = .30 = mittlerer Effekt
- r = .50 = starker Effekt
In unserem Beispiel ergibt sich eine Effektstärke von r = 0,135. Es ist damit ein schwacher Effekt.
Mann Whitney U Test — häufigste Fragen
-
Was sagt der Mann-Whitney-U-Test aus?
Mit dem Mann-Whitney-U-Test kannst du anhand der Rangsummen prüfen, ob es einen Unterschied zwischen zwei Gruppen gibt. Dafür müssen deine Daten nicht normalverteilt sein, weshalb er die nicht-parametrische Alternative zum t-Test ist.
-
Wann ist der Mann-Whitney-U-Test signifikant?
Für die Berechnung der Signifikanz benötigst du den kritischen Wert aus der Tabelle der Mann-Whitney-U-Statistik (für n < 30). Ist er größer als dein U-Wert, ist der Test signifikant. Für n ≥ 30 wird der approximierte z-Wert mit dem kritischen Wert aus der Tabelle der Standardnormalverteilung verglichen. Ist der Betrag des z-Wert größer als der kritische Wert, liegt Signifikanz vor.
ANOVA
Du möchtest wissen, ob sich die Mittelwerte deiner Stichproben signifikant unterscheiden, aber hast mehr als zwei Gruppen? Dann kannst du keinen Mann-Whitney-U-Test anwenden, sondern benötigst eine ANOVA. Was genau das ist und wie du sie anwendest, zeigen wir dir in unserem Video .