Deskriptive Statistik

Spearman Korrelation

Bei Rängen denkst du nur an das Treppchen bei einer Siegerehrung? Aber auch in der Statistik kommen sie zum Einsatz. Wo genau zeigen wir dir jetzt.

Zusammenhangsmaß zweier Datenreihen

Der Spearman Korrelationskoeffizient ist eine Methode, um Zusammenhänge zwischen Variablen zu berechnen. Er macht also das gleiche wie der Pearson-Koeffizient. Die Interpretationen der Ergebnisse unterscheiden sich ebenfalls nicht. Solltest du also noch nicht wissen, was beispielsweise eine Korrelation von eins bedeutet, empfehlen wir dir das Video Pearson-Korrelationskoeffizient anzuschauen.

Ausprägung, Rang, kardinal und ordinal
Unterschiede zwischen Spearman und Pearson

Der grundlegende Unterschied ist allerdings: Während wir den Pearson-Korrelationskoeffizient auf Basis der Ausprägungen berechnen, beziehen wir uns bei der Spearman-Korrelation auf die Ränge der Ausprägungen. Die absoluten Abstände zwischen den Daten sind also nicht relevant. Das heißt, wir können diesen Koeffizienten sowohl für kardinal-, als auch ordinalskalierte Datensätze berechnen.

Vergabe der Rangziffern

Rang eins geht an den größten Wert, Rang zwei an den Zweitgrößten und so weiter. Prinzipiell ist es aber egal, ob du dem größten Wert die höchste oder die niedrigste Rangziffer zuordnest.

Spearman Korrelation
Definition der Rangziffern

Wichtig ist nur, dass du einheitlich bleibst und später bei der Interpretation deiner Lösung die richtigen Schlüsse ziehst.
Erstmal schauen wir aber, wie man die Spearman Korrelation berechnet.

Berechnung der Spearman Korrelation – Beispiel

Wir betrachten die Anzahl der geschobenen Prüfungen von sechs verschiedenen Studenten aus sechs verschiedenen Semestern und wollen herausfinden, ob ein Zusammenhang zwischen der Dauer des Studiums und der Anzahl der nicht geschriebenen Prüfungen besteht. Dazu haben wir folgende Datenreihe:

Spearman korrelation, Rang
Die rohen Daten für die Berechnung

Zuordnung der Rangziffern in der Datenreihe

Wir beginnen mit der letzten Rangziffer, also Rang 6, und vergeben absteigend die Rangziffern für die Semesteranzahl
x_i. Anschließend verfahren wir in gleicher Weise für die Anzahl geschobener Prüfungen y_i. Dieser Schritt ist noch sehr einfach.

Spearman Korrelation
Absteigende Sortierung der Daten

Formel zur Berechnung der Korrelation

r_s=1-\frac{6\sum_{i=1}^{n}{(r_{x_i}-r_{y_i})}^2}{(n-1)\ast n\ast (n+1)}\in\ \left[-1;1\right]

Wie du siehst, müssen wir im Zähler die einzelnen Rangdifferenzen berechnen.

Spearman Korrelation
Bilden der Rangdifferenz

Anschließend können wir die Zwischenergebnisse in unsere Formel einsetzen:

r_s=1-\frac{6\ast \left(0^2+1^2+\left(-1\right)^2+1^2+1^2+\left(-2\right)^2\right)}{\left(6-1\right)\ast 6\ast \left(6+1\right)}=0,77

Sehr gut, wir erhalten einen Wert von 0,77. Damit ergibt sich ein stark positiver Zusammenhang zwischen der Dauer des Studiums und der Anzahl der geschobenen Prüfungen!

Aber Achtung, diese Formel für die Spearman Korrelation  funktioniert nur, wenn in deinen Daten keine Bindungen auftreten. Das bedeutet, dass jeder x und y Wert nur einmal vorkommen darf.

Alternative Formel zur Berechnung der Rangkorrelation

Eine Formel, die immer funktioniert, zeigen wir dir jetzt. Allerdings wird sie nicht an jeder Uni gelehrt und ist nicht zwingend relevant für dich.

Hast du zum Beispiel folgende x-Werte und Ränge:

spearman korrelation
Alternative Berechnungsmethode

Wir haben also Rang eins plus Rang zwei durch 2 geteilt, also den Mittelwert berechnet und ihn an beide x-Werte vergeben.

\frac{1+2}{2}

Um nun die Korrelation zu berechnen, benötigen wir eine neue Formel:

r_s=\frac{\sum_{i=1}^{n}{(r_{x_i}-\bar{r_x})(}r_{y_i}-\bar{r_y})}{\sqrt{\sum_{i=1}^{n}{(r_{x_i}-\bar{r_x})}^2}\ast \sqrt{\sum_{i=1}^{n}{(r_{y_i}-\bar{r_y})}^2}}

Zusammenhang mit dem Pearson-Korrelationskoeffizienten

Aufmerksamen Zuschauern wird die Formel bereits bekannt vorkommen. Na, kommst du drauf? Richtig! Sie ist der Formel des Pearson-Korrelationskoeffizienten sehr ähnlich. Nur rechnen wir wieder mit den Rängen unserer Daten. Auch hier empfehlen wir dir nochmal das Video zum Pearson-Korrelationskoeffizienten, in dem ein ausführliches Beispiel vorgestellt wird.

Ansonsten war‘s das aber schon! Wenn du immer auf die richtige Vergabe der Ränge achtest und beide Formeln im Kopf hast, sollte es kein Problem mehr sein, auf die korrekte Lösung zu kommen.

Hallo, leider nutzt du einen AdBlocker.

Auf Studyflix bieten wir dir kostenlos hochwertige Bildung an. Dies können wir nur durch die Unterstützung unserer Werbepartner tun.

Schalte bitte deinen Adblocker für Studyflix aus oder füge uns zu deinen Ausnahmen hinzu. Das tut dir nicht weh und hilft uns weiter.

Danke!
Dein Studyflix-Team

Wenn du nicht weißt, wie du deinen Adblocker deaktivierst oder Studyflix zu den Ausnahmen hinzufügst, findest du hier eine kurze Anleitung. Bitte lade anschließend die Seite neu.