Deskriptive Statistik

Pearson Korrelation

Inhaltsübersicht

In diesem Artikel wird die Pearson Korrelation behandelt. Es wird geklärt wie und wann die Korrelation nach Pearson berechnet wird. Im Anschluss erfolgt die Interpretation des Korrelationskoeffizienten, welcher zuvor mit Hilfe der Pearson Korrelation Formel bestimmt wurde.

 

Wie du Berechnungen zur Bravais Pearson Korrelation mit Bravour meistern kannst, erfährst du in unserem verständlichen Video zum Pearson Korrelationskoeffizient!

Korrelation nach Pearson

Der Pearson Korrelation ist eine einfache Möglichkeit, den linearen Zusammenhang zweier Variablen zu bestimmen. Dabei dient der Korrelationskoeffizient nach Pearson als Maßzahl für die Stärke der Korrelation der intervallskalierten Merkmale und nimmt Werte zwischen -1 und 1 an .

Bravais Pearson Korrelation Berechnung

Um den Zusammenhang von Datensätzen zweier Stichproben zu beschreiben, benutzen wir im Allgemeinen die Korrelation. Der Pearson Korrelationskoeffizient r  nach Bravais und Pearson ist nur eine von vielen Möglichkeiten, um diese zu berechnen.

Pearson Korrelation Voraussetzungen

Merk‘ dir, dass der Bravais Pearson Korrelationskoeffizient nur lineare Zusammenhänge erkennen kann. Sind zwei Variablen also scheinbar unkorreliert, kann immer noch ein nichtlinearer, also beispielsweise ein exponentieller oder quadratischer, Zusammenhang bestehen. Außerdem ist seine Berechnung nur bei kardinal skalierten Daten möglich.

Um den Korrelationskoeffizient zu veranschaulichen, bedient man sich sogenannter Streudiagramme: Das sind Diagramme, in die die verschiedenen Stichprobendaten punktweise eingetragen werden, um den Streuungsverlauf zu beurteilen.

 

Pearson, Korrelation, Korrelationskoeffizient
Pearson Korrelation: positive Korrelation

Hier besteht eine stark positive Korrelation. Dein Notenschnitt verbessert sich also mit der Anzahl der geschauten Studyflix Videos.

Pearson, Korrelation, Korrelationskoeffizient
Pearson Korrelation: negative Korrelation

Der genau umgekehrte Zusammenhang, also eine negative Korrelation besteht in Beispiel B. Je mehr Bier du konsumierst, desto schlechter wird dein Schnitt.

Pearson Korrelation Formel

Dann kommen wir jetzt zur Berechnung des Koeffizienten. Dafür gibt es zwei verschiedene Formeln, die ziemlich lang sind und auf den ersten Blick nicht besonders einladend aussehen. Deshalb werden wir sie Schritt für Schritt an einem Beispiel aufdröseln.

r=\frac{\sum_{i=1}^{n}{(x_i-\bar{x})(y_i-\bar{y})}}{\sqrt{\sum_{i=1}^{n}{(x_i-\bar{x})}^2}\ast \sqrt{\sum_{i=1}^{n}{(y_i-\bar{y})}^2}}

r=\frac{\sum_{i=1}^{n}{x_iy_i-n}\bar{x}\bar{y}}{\sqrt{\sum_{i=1}^{n}{{x_i}^2-n}{\bar{x}}^2}\ast \sqrt{\sum_{i=1}^{n}{{y_i}^2-n}{\bar{y}}^2}}

Wir betrachten also die beiden Variablen x und y, mit den drei folgenden Ausprägungen:

Pearson, Koeffizient, Korrelation, Korrelationskoeffizient
Zahlen zum Rechenbeispiel

 Zuerst berechnen wir das arithmetische Mittel von x und y:

\bar{x}\ =\ \frac{9}{3}=3                              \bar{y}=\frac{15}{3}\ =\ 5

Anschließend berechnen wir die einzelnen Quadrate und das Produkt aus x und y:

Pearson, Korrelation, Korrelationskoeffizient
Koeffizient Rechenbeispiel

Zum Schluss setzen wir die berechneten Werte noch ein. In diesem Beispiel werden wir die zweite Formel verwenden. Da wir drei Ausprägungen haben ist n hier 3:

\frac{49\ -\ 3\ast 3\ast 5}{\sqrt{29\ -\ 3\ast 3^2}\ast \sqrt{83\ -\ 3\ast 5^2}}=\ 1

Was dieses Ergebnis von eins bedeutet, wird dir im Folgenden erklärt .

Pearson Korrelation Interpretation

Der Korrelationskoeffizient nach Person liegt stets zwischen eins und minus eins, wobei eins einen perfekt positiven und minus eins eine perfekt negative Korrelation impliziert. Man schreibt also:

r\ \in\left[-1;+1\right]

Es gibt also verschiedene Szenarien, auf die wir hier eingehen.

  • r\approx0 : Erhältst du ein Ergebnis von ungefähr null sind die Variablen unkorreliert.
    Das heißt, zwischen ihnen besteht kein linearer Zusammenhang. Ein Beispiel hierfür wäre wenn man versucht einen Zusammenhang zwischen und Autokennzeichen und Körpergröße zu finden.

 

  • r\ >\ 0 : Ist der Wert von r größer als 0, dann nennt man das eine positive Korrelation. Das bedeutet, dass größere Werte von X auch mit größeren Werten von Y einher gehen. Hier könnte man den Zusammenhang zwischen der Körpergröße eines Menschen und der Schuhgröße dieser Person hernehmen.

 

  • r\ <\ 0 :  Zuletzt betrachten wir noch den Fall, dass der Wert von r kleiner als Null ist, es sich also um einen negativen Zusammenhang handelt. Anders als bei der positiven Korrelation fallen hier die Werte von Y mit steigenden X-Werten. Hier könnte man sagen, dass je mehr Kilometer man mit dem Auto zurücklegt, desto weniger Benzin ist im Tank.

Unser Ergebnis der Berechnung von eins bedeutet also, dass die beiden Variablen perfekt positiv korreliert sind und  sich in die gleiche Richtung entwickeln.

Hier die wichtigsten Dinge die du beachten musst

  • Überblick behalten
  • Zwischenergebnisse beachten
  • Tabellenschreibweise einhalten

Du siehst, die Berechnung ist eigentlich gar nicht so schwer. Die Kunst ist es, bei vielen Ausprägungen, den Überblick zu behalten und immer mit den richtigen Zwischenergebnissen weiter zu rechnen. Deshalb kann zum Beispiel eine Tabellenschreibweise, wie wir sie gerade verwendet haben sehr hilfreich sein.

Der Zusammenhang mit der Kovarianz

Ein Begriff, den du häufig in Zusammenhang mit der Korrelation hören wirst ist die Kovarianz. Hierbei handelt es sich um die unstandartisierte Version der Korrelation.

Die Formel für die Kovarianz lautet:

Cov\left(x,y\right)=\ \frac{\sum_{i=1}^{N}{(x_i-\bar{x}})(y_i-\bar{y})}{N}

Hier summieren wir das Produkt der Differenzen zwischen den jeweiligen Zufallsvariablen und den Mittelwerten und Teilen durch N-1. N ist die Stichprobengröße.

Das heißt aus dem Wert der Kovarianz lassen sich nur schwer Schlüssen ziehen. Wenn man aber nun diese mit Hilfe der Standartabweichung standardisiert ist dies leichter möglich.
Also kannst du dir merken: Korrelation ist die standardisierte Kovarianz.


Andere Nutzer halten diese Inhalte aus dem Bereich „Deskriptive Statistik“ für besonders klaussurrelevant

Hallo, leider nutzt du einen AdBlocker.

Auf Studyflix bieten wir dir kostenlos hochwertige Bildung an. Dies können wir nur durch die Unterstützung unserer Werbepartner tun.

Schalte bitte deinen Adblocker für Studyflix aus oder füge uns zu deinen Ausnahmen hinzu. Das tut dir nicht weh und hilft uns weiter.

Danke!
Dein Studyflix-Team

Wenn du nicht weißt, wie du deinen Adblocker deaktivierst oder Studyflix zu den Ausnahmen hinzufügst, findest du hier eine kurze Anleitung. Bitte lade anschließend die Seite neu.