Deskriptive Statistik

Spearman Korrelation

Dieser Artikel behandelt die Spearman Korrelation. Nach einer Erklärung der Rangkorrelation nach Spearman erfolgt die Berechnung und die Spearman Korrelation Interpretation.

Bei Rängen denkst du nur an das Treppchen bei einer Siegerehrung? Seh dir unser Video zur Spearman Rangkorrelation an und erfahre welche Rolle der Rang in der Statistik spielt, ohne diesen langen Artikel lesen zu müssen!

Rangkorrelationskoeffizient Spearman

Der Rangkorrelationskoeffizient nach Spearman, welcher auch als Spearmans Rho bezeichnet wird, ist ähnlich wie der Pearson Korrelationskoeffizient eine Methode, um Zusammenhänge zwischen Variablen zu berechnen. Die Korrelation wird anhand zuvor vergebener Ränge berechnet, wobei der genaue Abstand der Datenpunkte nicht relevant ist.

Pearson Korrelation VS. Spearman Korrelation

Ausprägung, Rang, kardinal und ordinal
Unterschiede zwischen Spearman und Pearson

Der Korrelationskoeffizient nach Spearman verfolgt das gleiche Ziel wie der Pearson Koeffizient. Die Interpretation der Ergebnisse unterscheidet sich ebenfalls nicht. Der grundlegende Unterschied ist allerdings: Während wir den Pearson Korrelationskoeffizient auf Basis der Ausprägungen berechnen, beziehen wir uns bei der Spearman Korrelation auf die Ränge der Ausprägungen. Die absoluten Abstände zwischen den Daten sind also nicht relevant. Das heißt, wir können diesen Koeffizienten sowohl für kardinal-, als auch ordinalskalierte Datensätze berechnen.

Berechnung Rangkorrelation nach Spearman

Rang eins geht an den größten Wert, Rang zwei an den Zweitgrößten und so weiter. Prinzipiell ist es aber egal, ob du dem größten Wert die höchste oder die niedrigste Rangziffer zuordnest.

Spearman Korrelation
Definition der Rangziffern

Wichtig ist nur, dass du einheitlich bleibst und später bei der Interpretation deiner Lösung die richtigen Schlüsse ziehst. Erstmal schauen wir aber, wie man die Spearman Korrelation berechnet. 

Wir betrachten die Anzahl der geschobenen Prüfungen von sechs verschiedenen Studenten aus sechs verschiedenen Semestern und wollen herausfinden, ob ein Zusammenhang zwischen der Dauer des Studiums und der Anzahl der nicht geschriebenen Prüfungen besteht. Dazu haben wir folgende Datenreihe:

Spearman korrelation, Rang
Die rohen Daten für die Berechnung

Zuordnung der Rangziffern in der Datenreihe

Wir beginnen mit der letzten Rangziffer, also Rang 6, und vergeben absteigend die Rangziffern für die Semesteranzahl
x_i. Anschließend verfahren wir in gleicher Weise für die Anzahl geschobener Prüfungen y_i. Dieser Schritt ist noch sehr einfach.

Spearman Korrelation
Absteigende Sortierung der Daten

Formel Spearman Korrelation

r_s=1-\frac{6\sum_{i=1}^{n}{(r_{x_i}-r_{y_i})}^2}{(n-1)\ast n\ast (n+1)}\in\ \left[-1;1\right]

Wie du siehst, müssen wir im Zähler die einzelnen Rangdifferenzen berechnen.

Spearman Korrelation
Bilden der Rangdifferenz

Anschließend können wir die Zwischenergebnisse in unsere Formel einsetzen:

r_s=1-\frac{6\ast \left(0^2+1^2+\left(-1\right)^2+1^2+1^2+\left(-2\right)^2\right)}{\left(6-1\right)\ast 6\ast \left(6+1\right)}=0,77

Spearman Korrelation Interpretation

Der Rangkorrelationskoeffitient bei der Spearman Korrelation nimmt im Allgemeinen Werte zwischen -1 im Falle einer negativen Korrelation und +1 im Falle einer positiven Korrelation an, ohne dabei irgendwelche Annahmen über die Verteilungen der Wahrscheinlichkeiten der betrachteten Variablen vorzunehmen. Bei dem Wert 0 liegt keine Korrelation vor. Solltest du also noch nicht wissen, was beispielsweise eine Korrelation von eins bedeutet, empfehlen wir dir das Video Pearson Korrelationskoeffizient anzuschauen.

Sehr gut, aufgrund unserer Berechnungen erhalten wir einen Wert von 0,77. Damit ergibt sich ein stark positiver Zusammenhang zwischen der Dauer des Studiums und der Anzahl der geschobenen Prüfungen!

Aber Achtung, diese Formel für die Spearman Korrelation  funktioniert nur, wenn in deinen Daten keine Bindungen auftreten. Das bedeutet, dass jeder x und y Wert nur einmal vorkommen darf.

Alternative Formel zur Berechnung der Rangkorrelation

Eine Formel, die immer funktioniert, zeigen wir dir jetzt. Allerdings wird sie nicht an jeder Uni gelehrt und ist nicht zwingend relevant für dich.

Hast du zum Beispiel folgende x-Werte und Ränge:

spearman korrelation
Alternative Berechnungsmethode

Wir haben also Rang eins plus Rang zwei durch 2 geteilt, also den Mittelwert berechnet und ihn an beide x-Werte vergeben.

\frac{1+2}{2}

Um nun die Korrelation zu berechnen, benötigen wir eine neue Formel:

r_s=\frac{\sum_{i=1}^{n}{(r_{x_i}-\bar{r_x})(}r_{y_i}-\bar{r_y})}{\sqrt{\sum_{i=1}^{n}{(r_{x_i}-\bar{r_x})}^2}\ast \sqrt{\sum_{i=1}^{n}{(r_{y_i}-\bar{r_y})}^2}}

Aufmerksamen Zuschauern wird die Formel bereits bekannt vorkommen. Na, kommst du drauf? Richtig! Sie ist der Formel des Pearson Korrelationskoeffizienten sehr ähnlich. Nur rechnen wir wieder mit den Rängen unserer Daten. Auch hier empfehlen wir dir nochmal das Video zum Pearson Korrelationskoeffizienten, in dem ein ausführliches Beispiel vorgestellt wird.

Ansonsten war‘s das aber schon! Wenn du immer auf die richtige Vergabe der Ränge achtest und beide Formeln im Kopf hast, sollte es kein Problem mehr sein, auf die korrekte Lösung zu kommen.

Hallo, leider nutzt du einen AdBlocker.

Auf Studyflix bieten wir dir kostenlos hochwertige Bildung an. Dies können wir nur durch die Unterstützung unserer Werbepartner tun.

Schalte bitte deinen Adblocker für Studyflix aus oder füge uns zu deinen Ausnahmen hinzu. Das tut dir nicht weh und hilft uns weiter.

Danke!
Dein Studyflix-Team

Wenn du nicht weißt, wie du deinen Adblocker deaktivierst oder Studyflix zu den Ausnahmen hinzufügst, findest du hier eine kurze Anleitung. Bitte lade anschließend die Seite neu.