Empirische Varianz (Stichprobenvarianz)
In diesem Artikel erklären wir dir die empirische Varianz, auch Stichprobenvarianz genannt, und beschreiben den Unterschied zur Varianz. Wir gehen dabei zuerst auf die Formel ein und zeigen dann die Berechnung der empirischen Varianz an einem Beispiel.
Eine kurze, knappe und verständliche Erklärung findest du in unserem Video dazu.
Inhaltsübersicht
Empirische Varianz berechnen
In der Statistik ist die empirische Varianz, bzw. Stichprobenvarianz, ein wichtiges Streuungsmaß für Stichproben. Diese unterscheidet sich im Vergleich zur Populationsvarianz oder auch nur Varianz durch ihren Nenner. Schau dir deshalb auch unsere Artikel zu Varianz und zum Thema Varianz berechnen an.
Die empirische Varianz berechnet die mittlere quadratische Abweichung der gemessenen Werte eines Zufallsexperiments vom empirischen Mittelwert.
Die empirische Varianz nutzt du immer dann, wenn du nur einen Teil der Grundgesamtheit oder Population kennst. Das ist meistens der Fall, wenn du große Datenmengen analysierst oder dir nur eine begrenzte empirische Stichprobe zur Verfügung steht. Sie bildet einen unverzerrten (erwartungstreuen) Schätzer der Varianz.
Willst du die empirische Varianz berechnen, dann folgst du am besten stets diesen drei Schritten:
- Empirischen Mittelwert berechnen
- Werte in die Formel zur Stichprobenvarianz einsetzen
- Stichprobenvarianz berechnen
Bevor wir uns gleich ein Beispiel dazu ansehen, schauen wir uns noch die Formel an.
Empirische Varianz Formel
Um die Stichprobenvarianz zu berechnen, existieren zwei verschiedene Formeln:
- ist das Zeichen für die empirische Varianz (bei Stichproben)
- ist das empirische Mittel
- ist einer der Stichprobenwerte
- beschreibt, dass erst eine Summe der Abweichungen berechnet und die Summe dann durch die Anzahl der Freiheitsgrade geteilt wird. Diese Formel berechnet den unverzerrten Schätzer.
- verwendest du, wenn du lediglich einen verzerrten Schätzer berechnest.
Du ziehst von den einzelnen Stichprobenerhebungen den empirischen Mittelwert ab, also den Mittelwert deiner Stichprobe, und quadrierst anschließend das Ganze, damit sich positive und negative Abweichungen nicht ausgleichen. Die Summe davon dividierst du entweder durch die Anzahl der Freiheitsgrade, also n – 1 oder die Anzahl der Messwerte n. Der Unterschied wird im folgenden Beispiel deutlich. Für eine genaue Erklärung, warum den Freiheitsgraden entspricht, schau dir unseren Artikel zu Freiheitsgraden an.
1. Empirischer Mittelwert berechnen
Dafür zählst du die einzelnen Daten der Stichprobe zusammen und teilst sie durch die Anzahl der Messwerte:
Dadurch erhältst du ein empirisches Mittel von 17,5.
2. Werte in die Formel zur Stichprobenvarianz einsetzen
Als zweiten Schritt setzt du nun die Werte in die Formel ein und ziehst das empirische Mittel davon ab. Für den Nenner verwendest du die Anzahl der Freiheitsgrade.
3. Stichprobenvarianz berechnen
Anschließend musst du die Formel auflösen, indem du die Werte in den Klammern subtrahierst, diese dann quadrierst und daraus eine Summe bildest.
Abschließend teilst du die Summe durch die Anzahl der Freiheitsgrade.
Als mittlere quadratische Abweichung vom Stichprobenmittel erhalten wir so einen Wert von 2,3.
Unterschied empirische Varianz zu Varianz
Die Unterschiede sind gering, dürfen aber keinesfalls übersehen werden. Der Unterschied zwischen der gewöhnlichen Varianz (Populationsvarianz) und der empirischen Varianz liegt zunächst einmal in der Formel. Wir teilen jetzt nicht mehr durch n, sondern durch n minus 1 und tauschen den Erwartungswert gegen das sogenannte Stichprobenmittel, also den Mittelwert der Stichprobe aus. Es ändert sich also der Vorfaktor.
Empirische Varianz:
Varianz:
Doch wann benutzt du welche Formel?
: Du benutzt die empirische Varianz für Zufallsstichproben, bei denen der Erwartungswert unbekannt ist. Deshalb musst du mit dem empirischen Mittelwert deiner Stichprobe rechnen.
: Du benutzt die Populationsvarianz, wenn der echte Mittelwert deiner Stichprobe bekannt oder deine Stichprobe eine Vollerhebung ist.
Du kannst mit Hilfe der empirischen Varianz die empirische Standardabweichung berechnen . Dafür musst du lediglich die Wurzel der empirischen Varianz ziehen.