Deskriptive Statistik

Empirische Varianz (Stichprobenvarianz)

In diesem Artikel erklären wir dir die empirische Varianz, auch Stichprobenvarianz genannt, und beschreiben den Unterschied zur Varianz. Wir gehen dabei zuerst auf die Formel ein und zeigen dann die Berechnung der empirischen Varianz an einem Beispiel.

Eine kurze, knappe und verständliche Erklärung findest du in unserem Video  dazu.

Inhaltsübersicht

Empirische Varianz berechnen

In der Statistik ist die empirische Varianz, bzw. Stichprobenvarianz, ein wichtiges Streuungsmaß für Stichproben. Diese unterscheidet sich im Vergleich zur Populationsvarianz oder auch nur Varianz durch ihren Nenner. Schau dir deshalb auch unsere Artikel zu Varianz und zum Thema Varianz berechnen an. 

Definition

Die empirische Varianz berechnet die mittlere quadratische Abweichung der gemessenen Werte eines Zufallsexperiments vom empirischen Mittelwert

Die empirische Varianz nutzt du immer dann, wenn du nur einen Teil der Grundgesamtheit oder Population kennst. Das ist meistens der Fall, wenn du große Datenmengen analysierst oder dir nur eine begrenzte empirische Stichprobe zur Verfügung steht. Sie bildet einen unverzerrten (erwartungstreuen) Schätzer der Varianz. 

Willst du die empirische Varianz berechnen, dann folgst du am besten stets diesen drei Schritten:

  1. Empirischen Mittelwert berechnen
  2. Werte in die Formel zur Stichprobenvarianz einsetzen
  3. Stichprobenvarianz berechnen

Bevor wir uns gleich ein Beispiel dazu ansehen, schauen wir uns noch die Formel an.

Empirische Varianz Formel 

Um die Stichprobenvarianz zu berechnen, existieren zwei verschiedene Formeln:

s^2=\frac{1}{n}\sum_{i=1}^{n}{(x_i-\bar{x})}^2

s^2=\frac{1}{n-1}\sum_{i=1}^{n}{(x_i-\bar{x})}^2

  • {{s}^2 ist das Zeichen für die empirische Varianz (bei Stichproben)
  • \bar{x} ist das empirische Mittel
  • x_i ist einer der Stichprobenwerte
  • \frac{1}{n-1}\sum_{i=1}^{n} beschreibt, dass erst eine Summe der Abweichungen berechnet und die Summe dann durch die Anzahl der Freiheitsgrade geteilt wird. Diese Formel berechnet den unverzerrten Schätzer.
  • \frac{1}{n}\sum_{i=1}^{n} verwendest du, wenn du lediglich einen verzerrten Schätzer berechnest. 

Du ziehst von den einzelnen Stichprobenerhebungen den empirischen Mittelwert ab, also den Mittelwert deiner Stichprobe, und quadrierst anschließend das Ganze, damit sich positive und negative Abweichungen nicht ausgleichen. Die Summe davon dividierst du entweder durch die Anzahl der Freiheitsgrade, also n – 1 oder die Anzahl der Messwerte n. Der Unterschied wird im folgenden Beispiel deutlich. Für eine genaue Erklärung, warum n - 1 den Freiheitsgraden entspricht, schau dir unseren Artikel zu Freiheitsgraden an.

Beispiel zur empirischen Varianz

Ok, genug der grauen Theorie. Schauen wir uns ein Beispiel zur Berechnung der empirische Varianz an.  Stell dir vor, du hast folgende Werte für eine Stichprobe gegeben:

17 19 18 15 19 17

Die Stichprobe umfasst folglich 6 Werte.%Wie lässt sich dieser Datensatz besser anzeigen?

1. Empirischer Mittelwert berechnen

Dafür zählst du die einzelnen Daten der Stichprobe zusammen und teilst sie durch die Anzahl der Messwerte:

\bar{x} = \frac{17 + 19 + 18 +15 + 19 + 17}{6}= \frac{105}{6} =  17,5

Dadurch erhältst du ein empirisches Mittel von 17,5.

2. Werte in die Formel zur Stichprobenvarianz einsetzen

Als zweiten Schritt setzt du nun die Werte in die Formel ein und ziehst das empirische Mittel davon ab. Für den Nenner verwendest du die Anzahl der Freiheitsgrade

{s}^2=\frac{{(17 - 17,5)}^2 + {(19 - 17,5)}^2 + {(18 - 17,5)}^2 + {(15 - 17,5)}^2 + {(19 -17,5)}^2 + {(17 - 17,5)}^2} {6-1}

3. Stichprobenvarianz berechnen

Anschließend musst du die Formel auflösen, indem du die Werte in den Klammern subtrahierst, diese dann quadrierst und daraus eine Summe bildest.

{s}^2=\frac{{(-0,5)}^2 + {(1,5)}^2 + {(0,5)}^2 + {(2,5)}^2 + {(1,5)}^2 + {(- 0,5)}^2} {5}

Abschließend teilst du die Summe durch die Anzahl der Freiheitsgrade.

{s}}^2=\frac{0,25 + 2,25 +  0,25 + 6,25 +2,25 + 0,25}{5} = \frac{11,5}{5} = 2,3

Als mittlere quadratische Abweichung vom Stichprobenmittel erhalten wir so einen Wert von 2,3.

Unterschied empirische Varianz zu Varianz

Die Unterschiede sind gering, dürfen aber keinesfalls übersehen werden.  Der Unterschied zwischen der gewöhnlichen Varianz (Populationsvarianz) und der empirischen Varianz liegt zunächst einmal in der Formel. Wir teilen jetzt nicht mehr durch n, sondern durch n minus 1 und tauschen den Erwartungswert \mu gegen das sogenannte Stichprobenmittel, also den Mittelwert der Stichprobe aus. Es ändert sich also der Vorfaktor. 

 Empirische Varianz: s^2=\frac{1}{n-1}\sum_{i=1}^{n}{(x_i-\bar{x})}^2 

 Varianz: {{\sigma}}^2=\frac{1}{n}\sum_{i=1}^{n}{(x_i-\mu)}^2

Doch wann benutzt du welche Formel?

\frac{1}{n-1}: Du benutzt die empirische Varianz für Zufallsstichproben, bei denen der Erwartungswert unbekannt ist. Deshalb musst du mit dem empirischen Mittelwert deiner Stichprobe rechnen.

\frac{1}{n}: Du benutzt die Populationsvarianz, wenn der echte Mittelwert deiner Stichprobe bekannt oder deine Stichprobe eine Vollerhebung ist. 

Du kannst mit Hilfe der empirischen Varianz die empirische Standardabweichung berechnen . Dafür musst du lediglich die Wurzel der empirischen Varianz ziehen. 


Andere Nutzer halten diese Inhalte aus dem Bereich „Deskriptive Statistik“ für besonders klausurrelevant

Hallo, leider nutzt du einen AdBlocker.

Auf Studyflix bieten wir dir kostenlos hochwertige Bildung an. Dies können wir nur durch die Unterstützung unserer Werbepartner tun.

Schalte bitte deinen Adblocker für Studyflix aus oder füge uns zu deinen Ausnahmen hinzu. Das tut dir nicht weh und hilft uns weiter.

Danke!
Dein Studyflix-Team

Wenn du nicht weißt, wie du deinen Adblocker deaktivierst oder Studyflix zu den Ausnahmen hinzufügst, findest du hier eine kurze Anleitung. Bitte lade anschließend die Seite neu.