Deskriptive Statistik

Kontingenztabelle

Die Kontingenztabelle wird in diesem Artikel behandelt. Zuerst werden wir eine Kontingenztabelle erstellen und klären anhand eines Beispiels wie man mit dieser die Häufigkeit des gemeinsamen Auftretens zweier Merkmale berechnen kann.

Genug gelesen? Lehn dich zurück und lass dir von unserem Video alles erklären, was du zur Kontingenztabelle wissen musst!

Kontingenztabelle Statistik

Die Kontingenztabelle oder auch Kreuztabelle stellt die Häufigkeiten zweier verknüpfter Merkmale X und Y dar. Folglich ist die Kontingenz die Häufigkeit des gemeinsamen Auftretens zweier Merkmale. Diese bestimmten Zusammenhänge zwischen verschiedenen Merkmalsausprägungen werden tabellarisch festgehalten.

Formal sieht die Kontingenztafel dann so aus:

relative, absolute Häufigkeiten, Kontingenztabelle
Kontingenztabelle Statistik

H steht hierbei für die jeweiligen Häufigkeiten. Die erste Zahl im Index, i, gibt die Zeile an und die zweite Zahl, j, die Spalte.

Randhäufigkeiten Kontingenztabelle

Jetzt können wir die Tabelle noch um ihre Randhäufigkeiten ergänzen. Dies tun wir, indem wir die Summe der einzelnen Zeilen beziehungsweise Spalten bilden. Abgekürzt wird das Ganze mit einem Punkt. Er drückt nichts anders als die Summenbildung in der jeweiligen Spalte oder Zeile aus.

Kontingenztabelle, relative Häufigkeiten, absolute Häufigkeiten
Randhäufigkeiten Kontingenztabelle

2×2 Kontingenztabelle

Diese Art von Tabelle mag dir auf den ersten Blick ziemlich kompliziert vorkommen, aber eigentlich kennst du sie schon seit deiner Schulzeit. Richtig gehört! Denn ein Sonderfall der Kontingenztafel ist die Vier-Felder-Tafel. Die einzige Neuerung ist, dass wir nun mehr als zwei verschiedene Ausprägungen darstellen können.

Kontingenztabelle Beispiel

So, dann sehen wir uns doch mal ein Beispiel dazu an: Wir befragen 400 Personen nach ihrem Schulabschluss und ihrem monatlichen Einkommen und erhalten diese Werte.

Einkommen, Schulabschluss, Kontingenztabelle
Kontingenztabelle Beispiel

Hier kann man herauslesen, dass 5 der 400 befragten Personen die einen Hauptschulabschluss haben ein Einkommen haben welches höher als 5000 € ist.

Umwandeln der absoluten in relative Häufigkeiten in der Kontingenztafel

Du kannst die Kontingenztabelle auch mit ihren relativen Häufigkeiten beschriften, indem du jede einzelne Merkmalsausprägung durch n teilst. In diesem Fall teilst du also durch 400:

Kontingenztabelle
Kontingenztabelle relative Häufigkeit

Super, jetzt weißt du schonmal, wie eine Kontingenztafel aussieht. Wir machen aber noch weiter und erklären dir, was es mit den Begriffen Unabhängigkeit und bedingte Häufigkeit auf sich hat.

Unabhängigkeit und bedingte Häufigkeit

Unabhängig ist deine Tabelle, wenn die Höhe des Einkommens nicht mit der Art des Schulabschlusses zusammenhängt. Für die Unabhängigkeit muss folgende Gleichung für jede Zelle aufgehen.

{\widetilde{h}}_{ij}=\frac{h_{i.}\ast h_{.j}}{n}

Anders gesagt: Sobald die Gleichung für eine der Zellen nicht aufgeht, hast du eine Abhängigkeit der betrachteten Merkmale bewiesen. Achte darauf, dass wir hier mit den absoluten Häufigkeiten rechnen. Wenn du eine Tabelle mit relativen Häufigkeiten vorliegen hast, sieht die Formel so aus:

h_{ij}=h_{i.}\ast h_{.j}

Für die erste Zelle in unserem Beispiel hieße das:

0.375\ast 0.25=0.9375\ \neq0.2

Wir brauchen also gar nicht weiterzurechnen. Unsere Gleichung geht nicht auf. Das heißt, die Höhe des Einkommens hängt von der Art des Schulabschlusses ab, was ja auch der Realität entspricht.

Definition der bedingten Häufigkeit

Machen wir deshalb direkt weiter: Die bedingte Häufigkeit drückt die Ausprägung eines Merkmals aus, wobei die Ausprägung des anderen Merkmals bereits gegeben ist. Klingt ziemlich kompliziert, oder? Ist es aber eigentlich gar nicht.

Kontingenztabelle, Ausprägung, Merkmal
Einführung von bedingten Häufigkeiten

Nehmen wir an, du möchtest wissen, wie viel Prozent der Abiturienten mehr als 5000 Euro im Monat verdienen. Genau dafür nutzen wir die bedingte Häufigkeit. Um sie zu berechnen, teilen wir die Werte der Merkmalsausprägungen nicht mehr durch die Gesamtanzahl, sondern durch die Randhäufigkeiten der betrachteten Spalte oder Zeile. Mathematisch drückst du das so aus:

Spalte: f(x_i\left|{\ y}_j)=\ \frac{h_{ij}}{h_{.j}}\ \right.

Zeile: f(y_j\left|\ x_i)=\ \frac{h_{ij}}{h_{i.}}\ \right.

Da wir in unserem Beispiel die Zeile der Gymnasialabsolventen bedingen, rechnen wir mit der zweiten Formel:

f\left(y_j\left|\ x_i\right)=\ \frac{35}{200}=0.175\ \right.

17,5% aller Abiturienten verdienen monatlich mehr als 5000 Euro.

Damit hast du die Kontingenztafel oder auch Kreuztabelle kennengelernt, kannst sie auf Unabhängigkeit prüfen und die bedingten Häufigkeiten berechnen.

Hallo, leider nutzt du einen AdBlocker.

Auf Studyflix bieten wir dir kostenlos hochwertige Bildung an. Dies können wir nur durch die Unterstützung unserer Werbepartner tun.

Schalte bitte deinen Adblocker für Studyflix aus oder füge uns zu deinen Ausnahmen hinzu. Das tut dir nicht weh und hilft uns weiter.

Danke!
Dein Studyflix-Team

Wenn du nicht weißt, wie du deinen Adblocker deaktivierst oder Studyflix zu den Ausnahmen hinzufügst, findest du hier eine kurze Anleitung. Bitte lade anschließend die Seite neu.