Freiheitsgrade
Dieser Artikel behandelt Freiheitsgrade und erklärt dir nicht nur was ein Freiheitsgrad per Definition überhaupt ist, sondern auch wie man Freiheitsgrade berechnen und Freiheitsgrade bestimmen kann. Außerdem wird darauf eingegangen, wie in der Statistik Freiheitsgrade anwendungsorientiert eingesetzt werden.
Das ist dir alles noch zu theoretisch und du willst wissen: Was sind Freiheitsgrade und wie kommen diese in der Statistik zum Einsatz? Wie du das schaffst, ohne viele komplizierte Texte zu lesen? Ganz einfach, mit unserem anschaulichen Video zum Thema!
Inhaltsübersicht
Freiheitsgrad Definition
Ein Freiheitsgrad, oftmals auch mit df abgekürzt (aus dem Englischen abgeleitet von number of degrees of freedom), gibt die Anzahl frei wählbarer Werte für einen Parameter an. Die Anzahl der Freiheitsgrade steigt mit zunehmender Stichprobengröße und sinkt mit der Anzahl geschätzter Parameter.
Man kann sich das in der Anwendung so vorstellen: drei Personen sind jeweils 1,80m, 1,85m und 1,90m groß, was einen Mittelwert von 1,85m ergibt. Basierend auf dem Mittelwert könnte man die Werte aber auch anders verteilen, zum Beispiel auf 1,81m, 1,83m und 1,91m. Hier sind dann aber nur die ersten beiden Werte frei wählbar, da der Mittelwert vorher bekannt ist. Daher ergeben sich dann im Falle dieses Beispiels für die Verteilung zwei Freiheitsgrade.
Freiheitsgrade Statistik
Was sind Freiheitsgrade in der Statistik? Sie sind ein Konzept, das auch in vielen anderen Fachrichtungen verwendet wird. In der Statistik werden sie vordergründig herangezogen, um die Anzahl der Werte anzugeben, die frei verändert werden können, ohne dass dabei ein betrachteter Parameter geändert wird. Sie sind besonders wichtig im Zusammenhang mit Verteilungen sowie der Varianz.
Freiheitsgrade berechnen
Wie berechnet man Freiheitsgrade nun eigentlich? Im Allgemeinen stehen sie immer in Abhängigkeit zur Zahl an unabhängigen Beobachtungen. Die Standardformel lautet in Worten: Der Freiheitsgrad ist die Zahl der Beobachtungen n minus die Zahl der berücksichtigten Parameter a.
Erklärung und Herleitung:
Eine allgemeine mathematische Grundgegebenheit besagt: Abweichungen vom Mittelwert müssen aufsummiert immer 0 ergeben.
Ist das arithmetische Mittel bekannt, kann man vom Anfang der Zahlenreihe bis zur vorletzten Zahl die Werte frei wählen; den letzten Wert muss man dann jedoch in Abhängigkeit zu den zuvor gewählten so bestimmen, dass im Endeffekt wieder der bekannte Mittelwert als Ergebnis steht.
Begründen lässt sich diese Überlegung folgendermaßen: Da das Ergebnis dieser Gleichung 0 sein muss und ansonsten alle Werte bereits gewählt wurden, kann man die Gleichung prinzipiell nach x auflösen. Das bedeutet, dass nur noch eine Lösung möglich und richtig sein kann. Der letzte herauszufindende Wert ist also durch die vorhergehenden n-1 Werte vorgegeben und nicht mehr frei wählbar, da sich ansonsten das arithmetische Mittel verändern würde.
Der Zweck der Freiheitsgrade besteht im Wesentlichen darin, für Unverzerrtheit, Anpassung und Kompensation zu sorgen und Erwartungstreue zu gewährleisten. Dies ist besonders wichtig im Hinblick auf statistische Berechnungen, denn diese beziehen sich immer auf eine Population bzw. Grundgesamtheit, die oftmals nicht in ihrer Gesamtheit zu untersuchen ist.
Freiheitsgrade bestimmen
Grundsätzlich lässt sich sagen, dass für die gängigsten Verteilungsarten (Normalverteilung, t-Verteilung, Chi- Quadrat-Verteilung) auch die gleiche Art der Berechnung der Freiheitsgrade vollzogen werden kann. In manchen Fällen, wie beispielsweise beim Chi-Quadrat-Test, kann die Berechnung allerdings vom Standardschema abweichen.
Die Freiheitsgrade bei der Berechnung innerhalb einer Standardnormalverteilung werden mit N-1 angegeben, wobei N die Anzahl der Messwerte beziehungsweise der aufgenommenen Daten darstellt.
2. t-Verteilung und Chi-Quadrat-Verteilung :
Die Freiheitsgrade einer t-Verteilung werden mit n-1 angegeben, wobei n den Stichprobenumfang darstellt. Die Stichprobe ist hier wesentlich von der Grundgesamtheit zu unterscheiden. Das Ziel der Betrachtung einer Stichprobe liegt darin, mit den gewonnenen Erkenntnissen Aussagen über die Grundgesamtheit zu treffen. Da diese mitsamt wichtigen Charakteristika wie Mittelwert, Varianz und Standardabweichung aber oft unbekannt bleibt, wird als Kompensationsversuch eine Anpassung auf die t-Verteilung eingesetzt.
In der Berechnung verhält sich die Chi-Quadrat-Verteilung, wenn sie ebenfalls auf einer Stichprobe basiert, analog: die Freiheitsgrade ergeben sich also aus n-1.
3. Chi-Quadrat-Test
Die Anzahl der Freiheitsgrade beim Chi-Quadrat-Test (Kreuztabelle) weicht von der bisher besprochenen Vorgehensweise ab und errechnet sich dafür folgendermaßen:
Beispiel:
Freiheitsgrade Beispiel
Um das ganze einmal zu veranschaulichen, soll das Szenario der Berechnung an einem Beispiel kurz aufgezeigt werden:
Drei befreundete Studenten schreiben in ihrer Klausur jeweils eine 1.7, eine 1.3 und eine 3.0, was als Mittelwert einen gemeinsamen Notendurchschnitt von 2.0 ergibt. Angenommen, man erinnert sich nicht mehr an die einzelnen Noten, sondern kennt nur noch den Mittelwert von 2.0, kann man folgendes versuchen: den Mittelwert über neue Einzelwerte wiederherzustellen. Für den ersten Wert wählt man dann beispielsweise 2.7 aus und für den zweiten 2.3. Beides stellt noch kein Problem dar, da beide Werte frei wählbar sind. Ausschlaggebend für den Mittelwert ist lediglich der letzte gewählte Wert. Dieser muss aufgrund der ersten beiden gewählten Werte jetzt 1.0 lauten. Bei einer Stichprobengröße von n = 3 Noten sind dementsprechend zwei Werte frei wählbar und ein Wert abhängig. Daraus folgt, dass sich nach dem Einsetzen in die Standardformel n – 1 zwei Freiheitsgrade ergeben.
Freiheitsgrade t-Test
Im Hinblick auf das Verhalten der Freiheitsgrade in der t-Verteilung sollte noch Folgendes festgehalten werden: Je höher diese werden, desto weiter nähert man sich an die Normalverteilung an. Ab einer Stichprobengröße von 30 kann man approximativ von der Standardnormalverteilung ausgehen. Bei einer Stichprobengröße von 50 ist bei einer graphischen Betrachtung mit bloßem Auge keine Unterscheidung zwischen den Kurven der Normalverteilung und der t-Verteilung mehr möglich. Im Optimalfall strebt der Freiheitsgrad so gesehen natürlich gegen . Das ist eine logische Folgerung, da ein höherer Freiheitsgrad mit Blick auf die Formel natürlich eine größere Stichprobe indiziert. Im Hinblick auf die Gütekriterien statistischer Berechnungen kann eine große Stichprobe ein probates Mittel sein, um Aussagen in Bezug auf die Grundgesamtheit valider und zutreffender zu gestalten.
Freiheitsgrade ANOVA
Auch zur Varianzanalyse (abgekürzt auch ANOVA, was für den englischen Begriff „Analysis of Variance“ steht) benötigt man für einen wichtigen Zwischenschritt der Berechnung die Freiheitsgrade. Diese müssen bei der Varianzanalyse vor der endgültigen Berechnung der Varianz zur Berechnung der summierten Abweichungsgrade ermittelt werden.