Deskriptive Statistik

(Pearson-) Korrelationskoeffizient

Der Pearson Korrelationskoeffizient ist eine einfache Möglichkeit, den Zusammenhang zweier Variablen zu bestimmen. Wie genau das funktioniert, erfährst du in diesem Beitrag.

Wie man die Bravais-Pearson Korrelation berechnet

Um den Zusammenhang von Datensätzen zweier Stichproben zu beschreiben, benutzen wir die Korrelation. Der Pearson-Korrelationskoeffizient r  nach Bravais und Pearson ist nur eine von vielen Möglichkeiten, um diese zu berechnen.

Er liegt stets zwischen eins und minus eins, wobei eins einen perfekt positiven und minus eins eine perfekt negative Korrelation impliziert. Man schreibt also:

r\ \in\left[-1;+1\right]

Es gibt also verschiedene Szenarien, auf die wir hier eingehen.

  • r\approx0 : Erhältst du ein Ergebnis von ungefähr null sind die Variablen unkorreliert.
    Das heißt, zwischen ihnen besteht kein linearer Zusammenhang. Ein Beispiel hierfür wäre wenn man versucht einen Zusammenhang zwischen und Autokennzeichen und Körpergröße zu finden.

 

  • r\ >\ 0 : Ist der Wert von r größer als 0, dann nennt man das eine positive Korrelation. Das bedeutet, dass größere Werte von X auch mit größeren Werten von Y einher gehen. Hier könnte man den Zusammenhang zwischen der Körpergröße eines Menschen und der Schuhgröße dieser Person hernehmen.

 

  • r\ <\ 0 :  Zuletzt betrachten wir noch den Fall, dass der Wert von r kleiner als Null ist, es sich also um einen negativen Zusammenhang handelt. Anders als bei der positiven Korrelation fallen hier die Werte von Y mit steigenden X-Werten. Hier könnte man sagen, dass je mehr Kilometer man mit dem Auto zurücklegt, dest weniger Benzin ist im Tank.

Merk‘ dir, dass der Bravais-Pearson-Korrelationskoeffizient nur lineare Zusammenhänge erkennen kann. Sind zwei Variablen also scheinbar unkorreliert, kann immer noch ein nichtlinearer, also beispielsweise ein exponentieller oder quadratischer, Zusammenhang bestehen. Außerdem ist seine Berechnung nur bei kardinal skalierten Daten möglich.

Veranschaulichung in Streudiagrammen

Um den Korrelationskoeffizient zu veranschaulichen, bedient man sich sogenannter Streudiagramme: Das sind Diagramme, in die die verschiedenen Stichprobendaten punktweise eingetragen werden, um den Streuungsverlauf zu beurteilen.

Schauen wir uns nun zu den verschiedenen Szenarien von vorhin solche Streudiagramme an:

Pearson, Korrelation, Korrelationskoeffizient
Beispiel A

In Beispiel A besteht eine stark positive Korrelation. Dein Notenschnitt verbessert sich also mit der Anzahl der geschauten Studyflix Videos.

Pearson, Korrelation, Korrelationskoeffizient
Beispiel B

Der genau umgekehrte Zusammenhang, also eine negative Korrelation besteht in Beispiel B. Je mehr Bier du konsumierst, desto schlechter wird dein Schnitt.

Fall C ist ein Beispiel für einen unkorrelierten Zusammenhang. Im Video siehst du, dass hier die Wert über den gesamten Grafen verstreut sind, denn der Erfolg deines Studiums ist unabhängig von der Menge der verspeisten Nudeln. Alles klar soweit?

Berechnung des Korrelationskoeffizienten

Dann kommen wir jetzt zur Berechnung des Koeffizienten. Dafür gibt es zwei verschiedene Formeln, die ziemlich lang sind und auf den ersten Blick nicht besonders einladend aussehen. Deshalb werden wir sie Schritt für Schritt an einem Beispiel aufdröseln.

r=\frac{\sum_{i=1}^{n}{(x_i-\bar{x})(y_i-\bar{y})}}{\sqrt{\sum_{i=1}^{n}{(x_i-\bar{x})}^2}\ast \sqrt{\sum_{i=1}^{n}{(y_i-\bar{y})}^2}}

r=\frac{\sum_{i=1}^{n}{x_iy_i-n}\bar{x}\bar{y}}{\sqrt{\sum_{i=1}^{n}{{x_i}^2-n}{\bar{x}}^2}\ast \sqrt{\sum_{i=1}^{n}{{y_i}^2-n}{\bar{y}}^2}}

Wir betrachten also die beiden Variablen x und y, mit den drei folgenden Ausprägungen:

Pearson, Koeffizient, Korrelation, Korrelationskoeffizient
Zahlen zum Rechenbeispiel

 Zuerst berechnen wir das arithmetische Mittel von x und y:

\bar{x}\ =\ \frac{9}{3}=3                              \bar{y}=\frac{15}{3}\ =\ 5

Anschließend berechnen wir die einzelnen Quadrate und das Produkt aus x und y:

Pearson, Korrelation, Korrelationskoeffizient
Koeffizient Rechenbeispiel

Zum Schluss setzen wir die berechneten Werte noch ein. In diesem Beispiel werden wir die zweite Formel verwenden. Da wir drei Ausprägungen haben ist n hier 3:

\frac{49\ -\ 3\ast 3\ast 5}{\sqrt{29\ -\ 3\ast 3^2}\ast \sqrt{83\ -\ 3\ast 5^2}}=\ 1

Ein Ergebnis von eins bedeutet, wie vorher schon erklärt, dass die beiden Variablen perfekt positiv korreliert sind.

Hier die wichtigsten Dinge die du beachten musst

  • Überblick behalten
  • Zwischenergebnisse beachten
  • Tabellenschreibweise einhalten

Du siehst, die Berechnung ist eigentlich gar nicht so schwer. Die Kunst ist es, bei vielen Ausprägungen, den Überblick zu behalten und immer mit den richtigen Zwischenergebnissen weiter zu rechnen. Deshalb kann zum Beispiel eine Tabellenschreibweise, wie wir sie gerade verwendet haben sehr hilfreich sein.

Der Zusammenhang mit der Kovarianz

Ein Begriff, den du häufig in Zusammenhang mit der Korrelation hören wirst ist die Kovarianz. Hierbei handelt es sich um die unstandartisierte Version der Korrelation.

Die Formel für die Kovarianz lautet:

Cov\left(x,y\right)=\ \frac{\sum_{i=1}^{N}{(x_i-\bar{x}})(y_i-\bar{y})}{N}

Hier summieren wir das Produkt der Differenzen zwischen den jeweiligen Zufallsvariablen und den Mittelwerten und Teilen durch N-1. N ist die Stichprobengröße.

Das heißt aus dem Wert der Kovarianz lassen sich nur schwer Schlüssen ziehen. Wenn man aber nun diese mit Hilfe der Standartabweichung standardisiert ist dies leichter möglich.
Also kannst du dir merken: Korrelation ist die standardisierte Kovarianz.

Hallo, leider nutzt du einen AdBlocker.

Auf Studyflix bieten wir dir kostenlos hochwertige Bildung an. Dies können wir nur durch die Unterstützung unserer Werbepartner tun.

Schalte bitte deinen Adblocker für Studyflix aus oder füge uns zu deinen Ausnahmen hinzu. Das tut dir nicht weh und hilft uns weiter.

Danke!
Dein Studyflix-Team

Wenn du nicht weißt, wie du deinen Adblocker deaktivierst oder Studyflix zu den Ausnahmen hinzufügst, findest du hier eine kurze Anleitung. Bitte lade anschließend die Seite neu.