Deskriptive Statistik

Mehrere Variablen
Chi-Quadrat Koeffizient

Du willst unbedingt herausfinden, wie groß der Zusammenhang zweier Variablen ist? Dann freu dich auf den Chi-Quadrat Koeffizient!

Zusammenhangsmaß zweier Datensätze

Um den Chi–Quadrat Koeffizienten zu verstehen, solltest du dich bereits mit der Kontingenztabelle und der Berechnung von Unabhängigkeiten auskennen. Das haben wir bereits ausführlich in einem eigenen Video erklärt.

Der Chi–Quadratkoeffizient beschreibt den Zusammenhang zwischen zwei verschiedenen Variablen.

Bestimmung der erwarteten Häufigkeiten

Um ihn zu bestimmen, brauchen wir die erwarteten Häufigkeiten unserer Daten. Zur Erinnerung ist hier noch einmal die Formel:

{\widetilde{h}}_{ij}=\frac{h_{i.} * h_{.j}}{n}

Also berechnen wir doch mal die erwarteten Häufigkeiten für unser Beispieltabelle aus dem Video Kontingenztabelle. Zur besseren Übersicht stellen wir die Ergebnisse ebenfalls in einer Tabelle dar:

Kontingenztabelle, Randhäufigkeiten, chi-quadrat-koeffizient
Rohdaten aus dem letzten Beitrag

Nun multiplizieren wir die Randhäufigkeiten h_{i \bullet}  und h_{\bullet j} und teilen sie durch n, in diesem Fall durch 400. So erhalten wir die erwarteten Häufigkeiten.

kontingenztabelle, erwartete Häufigkeiten, chi-quadrat-koeffizient
Berechnen der erwarteten Häufigkeiten

X^2-Koeffizient Formel

Sehr gut! Jetzt können wir auch schon den Koeffizienten mit dieser Formel berechnen.

X^2=\sum_{i=1}^{i}\sum_{j=1}^{j}\frac{{(h_{ij}-{\widetilde{h}}_{ij})}^2}{{\widetilde{h}}_{ij}}

Keine Sorge, du musst nicht alles auf einmal verstehen. Wir werden die Berechnung Schritt für Schritt durchführen.

Zuerst ziehen wir die erwarteten Häufigkeiten von den tatsächlichen Häufigkeiten ab. Für die erste Zelle rechnest du also 80 minus 37.5  ist gleich 42.5.
Das machst du jetzt mit allen anderen Zellen auch. Wenn du dich nicht verrechnest, kommst du auf diese Ergebnisse:

chi-quadrat koeffizient
Berechen der Differenzen

Anschließend quadrierst du jede Zelle und teilst sie durch ihre theoretischen Häufigkeiten:

erwartete häufigkeit, theoretische wahrscheinlicheit, chi-quadrat koeffizienten
Berechnen des chi-quadrat koeffizienten

Puh, ganz schön viel Gerechne, oder? Aber du bist schon so gut wie fertig. Du musst nur noch alle Zellen summieren und erhältst dann einen Chi-Quadrat Koeffizienten von 148,42.

Interpretation des Koeffizienten

Aber wie können wir so ein hohes Ergebnis nun interpretieren? Genau da liegt das Problem! Der Wertebereich des Koeffizienten liegt nämlich zwischen eins und unendlich und wir können nicht unterscheiden, ob der Wert aufgrund von einer sehr hohen Abhängigkeit oder eines großen n’s entsteht.

chi-quadrat koeffizient, Abhängigkeit
Interpretation des Ergebnisses

Die Aussagekraft reduziert sich also darauf, ob unsere Variablen entweder unabhängig (X2 = 0) oder abhängig
(X2 > 2) sind. In unserem Beispiel liegt folglich Abhängigkeit vor.

chi-quadrat koeffizient
Abhängigkeit der Variablen

Du merkst wahrscheinlich selbst, dass der Chi-Quadrat Koeffizient nicht das beste Tool ist, um den Zusammenhang zweier Variablen zu bestimmen. Trotzdem solltest du seine Berechnung beherrschen, denn er ist die Grundlage für den Kontingenzkoeffizienten.

chi-quadrat koeffizient
Aussichten

Solange du aber die Formel immer Schritt für Schritt berechnest, sollte das kein Problem sein.

Glückwunsch! Jetzt weißt du alles Wichtige zum Chi-Quadrat Koeffizient und hast damit ein weiteres Zusammenhangsmaß der deskriptiven Statistik kennengelernt.


Weitere Videos zum Thema Deskriptive Statistik

Hallo, leider nutzt du einen AdBlocker.

Auf Studyflix bieten wir dir kostenlos hochwertige Bildung an. Dies können wir nur durch die Unterstützung unserer Werbepartner tun.

Schalte bitte deinen Adblocker für Studyflix aus oder füge uns zu deinen Ausnahmen hinzu. Das tut dir nicht weh und hilft uns weiter.

Danke!
Dein Studyflix-Team

Wenn du nicht weißt, wie du deinen Adblocker deaktivierst oder Studyflix zu den Ausnahmen hinzufügst, findest du hier eine kurze Anleitung.