Induktive Statistik

Homoskedastizität und Heteroskedastizität

Du fragst dich was Homoskedastizität ist und wie sie sich von Heteroskedastizität unterscheidet? In diesem Beitrag klären wir diese und viele weitere Fragen!

Wenn du noch schneller als über Homoskedastizität erfahren möchtest, dann schau dir am besten unser Video dazu an!

Inhaltsübersicht

Homoskedastizität einfach erklärt.

Homoskedastizität bedeutet, dass die Varianz der Residuen in einer Regressionsanalyse   für alle Werte des Prädiktors konstant ist. Das heißt, die Abweichungen der vorhergesagten Werte von den wahren Werten sind in etwa immer gleich groß – unabhängig wie hoch oder niedrig der Wert des Prädiktors ist.

Um deine Regressionsanalyse sinnvoll interpretieren zu können, ist es wichtig, dass Homoskedastizität vorliegt. Homoskedastizität bildet deshalb neben einigen weiteren Aspekten (z.B. Vermeidung von Multikollinearität ) eine wichtige Voraussetzung für die lineare Regression.

Heteroskedastizität

Das Gegenteil von Homoskedastizität ist Heteroskedastizität. In diesem Fall verändert sich die Varianz der Residuen mit ansteigenden oder abfallenden Werten des Prädiktors. Beispielsweise kannst du bei Heteroskedastizität mit deiner Vorhersage systematisch umso weiter daneben liegen, je größer der Prädiktorwert ist, für den du dein Kriterium schätzen möchtest.

Homoskedastizität und Heteroskedastizität: Beispiel

Sehen wir uns Homo- und Heteroskedastizität nun mal an einem Beispiel an. Stell dir vor, du möchtest mit dem Einkommen einer Person vorhersagen, wie viel Geld sie für Autos ausgibt. Hierbei stellst du fest, dass Personen mit einem höheren Gehalt auch mehr für ihr Auto ausgeben. Nun möchtest du aber noch überprüfen, ob  Homoskedastizität der Residuen vorliegt und diese Voraussetzung der Regressionsanalyse erfüllt ist. 

Heteroskedastizität der Residuen tritt vor allem dann auf, wenn die Schätzgenauigkeit eines Kriteriumswerts von der Höhe des Prädiktorwerts abhängt. So variiert die Höhe des Betrags den Personen für ihr Auto ausgeben, vermutlich stärker für Personen mit einem hohen Einkommen als für Personen mit einem niedrigen Einkommen. Das könnte daran liegen, dass Personen mit einem niedrigen Einkommen einfach nicht so viel finanziellen Spielraum haben, da sie mit ihrem begrenzten Einkommen auch noch beispielsweise Lebensmittel und ihre Miete finanzieren müssen.

Personen mit einem hohen Einkommen sind hingegen deutlich freier und können flexibler entscheiden, wie viel Geld sie in ihr Auto investieren wollen. Hier wird es jedoch trotzdem Personen geben, die nicht viel Geld für ihr Auto ausgeben wollen, da sie sehr sparsam sind oder es ihnen nicht wichtig ist. Gleichzeitig gibt es aber auch Menschen, die große Autofans sind und deutlich mehr Geld in ihr Auto investieren wollen. Bei den Personen mit hohem Einkommen gibt es also deutlich größere Schwankungen, wie viel Geld für Autos ausgegeben wird als bei den Personen mit niedrigem Gehalt.

Führst du nun eine Regressionsanalyse mit dem Einkommen als Prädiktor und dem Investierten Geld in Autos als Kriterium durch, könnte das Streudiagramm mit der Regressionsgerade folgendermaßen aussehen:

%Bild

Du siehst, dass sich die Punktwolke nicht gleichmäßig um die Regressionsgerade verteilt. Stattdessen werden die Abstände der Punkte von der Regressionsgerade größer, je höher das Einkommen ist. Die senkrechten Abstände zwischen den Messwerten und der Regressionsgerade sind nichts anderes als die Residuen. In anderen Worten wird also die Varianz der Residuen mit ansteigenden Prädiktorwerten immer größer. Es liegt also Heteroskedastizität vor.

Das wünschenswerte Gegenteil davon wäre hingegen Homoskedastizität. In diesem Fall können Personen mit einem höheren Einkommen durchaus durchschnittlich auch mehr Geld für Autos ausgeben. Allerdings dürften sich die Personen in ihrem Ausgabeverhalten nicht stärker unterscheiden als Personen mit niedrigem Gehalt. 

Grafisch veranschaulich würde das so aussehen:

%Bild

Du siehst, dass die Regressionsgerade eine positive Steigung hat. Personen mit einem höheren Gehalt geben also nach wie vor mehr Geld für Autos aus. Allerdings verteilt sich die Punktwolke nun gleichmäßiger um die Regressionsgerade. Die Residuen werden also nicht systematisch größer, je höher der Wert auf dem Prädiktor ist. Es liegt Homoskedastizität vor.

Auswirkungen von Heteroskedastizität 

Heteroskedastizität stellt ein Problem für die Regressionsanalyse dar. Das liegt daran, dass sie Auswirkungen auf die Methode der kleinsten Quadrate haben kann. Die Methode der kleinsten Quadrate ist das Verfahren, mit dem die Regressionsgerade mathematisch bestimmt wird. Durch Heteroskedastizität kommt es hier zu Verzerrungen und auch die Standardfehler der Regressionsgewichte b werden durch Heteroskedastizität fehlerhaft. 

Um zu überprüfen, ob in deiner Regression Homoskedastizität vorliegt, kannst du verschiedene Testverfahren verwenden. Beispiele sind etwa der White-Test oder der Levene-Test. Wichtig ist hierbei, dass du bei diesen Tests auf eine Abweichung von Homoskedastizität testest. Das bedeutet, dass ein signifikanter Test auf Hetereoskedastizität hindeutet, während eine nicht signifikanter Test die Annahme von Homoskedastizität stützt. Du möchtest also, dass dieser Test nicht signifikant wird, damit die Annahme der Homoskedastizität erfüllt ist. 

Noch mehr Regressionsanalyse? 

Wenn du noch mehr über die Regressionsanalyse erfahren möchtest, haben wir viele weitere interessante Beiträge für dich. Schau doch beispielsweise mal hier vorbei: 


Beliebte Inhalte aus dem Bereich Induktive Statistik

Hallo, leider nutzt du einen AdBlocker.

Auf Studyflix bieten wir dir kostenlos hochwertige Bildung an. Dies können wir nur durch die Unterstützung unserer Werbepartner tun.

Schalte bitte deinen Adblocker für Studyflix aus oder füge uns zu deinen Ausnahmen hinzu. Das tut dir nicht weh und hilft uns weiter.

Danke!
Dein Studyflix-Team

Wenn du nicht weißt, wie du deinen Adblocker deaktivierst oder Studyflix zu den Ausnahmen hinzufügst, findest du hier eine kurze Anleitung. Bitte lade anschließend die Seite neu.