Induktive Statistik

Faktorenanalyse

Dieser Artikel hilft dir beim Einstieg in die Faktorenanalyse. Wir erklären dir, worum es bei der Faktorenanalyse überhaupt geht, wie du sie durchführst und was du bei der Interpretation beachten musst.

Du willst das Thema noch schneller verstehen? In unserem Video haben wir die Antworten auf die wichtigsten Fragen kompakt für dich zusammengefasst.

Inhaltsübersicht

Faktorenanalyse einfach erklärt

Mit der Faktorenanalyse kannst du viele Variablen zu wenigen Faktoren zusammenfassen. Dafür betrachtest du, was deine Variablen gemeinsam haben. Jede „Art“ der Gemeinsamkeiten stellst du dann als einen separaten Faktor dar. Die gefundenen Faktoren sind anschließend selbst wieder (künstlich erzeugte) Variablen, mit denen du weiter rechnen könntest. Durch die geringere Anzahl der Faktoren im Vergleich zu den Ausgangsvariablen ist das Rechnen mit den Faktoren jedoch übersichtlicher. Noch häufiger nutzt man die Faktorenanalyse, um zu untersuchen, welche Gemeinsamkeiten überhaupt hinter deinen Variablen stecken. Dafür führst du die Faktorenanalyse durch und versuchst anschließend, die Faktoren inhaltlich zu interpretieren. 

Die Faktorenanalyse gibt es in verschiedenen Formen. Insbesondere unterscheidet man die konfirmatorische und die explorative (oder exploratorische) Faktorenanalyse.  Bei der konfirmatorischen Faktorenanalyse hast du konkrete Hypothesen darüber, wie viele und was für Faktoren du hinter deinen Variablen erwartest. Bei der explorativen Faktorenanalyse betrachtest du hingegen ganz unvoreingenommen, welche gemeinsamen Faktoren du aus deinen Variablen bilden kannst.

Faktorenanalyse: Grundidee und Beispiel

Bei der Faktorenanalyse versuchst du, viele Ausgangsvariablen zu wenigen Faktoren zusammenzufassen. Dabei gehst du davon aus, dass deine Ausgangsvariablen teilweise ähnliche Dinge messen. Diese Ähnlichkeiten filterst du mit der Faktorenanalyse aus deinen Variablen heraus. Jede „Art“ der Ähnlichkeit wird anschließend als ein separater Faktor dargestellt.

Das klingt alles noch sehr abstrakt. Sehen wir uns das Ganze also einmal an einem vereinfachten Beispiel an: 

Stell dir vor, du hast zehn Beutel mit buntem Konfetti. In jedem Beutel ist sowohl rotes, gelbes als auch blaues Konfetti. Diese zehn Konfettibeutel bilden die Ausgangsvariablen, mit denen du eine Faktorenanalyse durchführen möchtest. Das verschiedenfarbige Konfetti ist die Information, die jeweils in einer Variablen enthalten ist.

% Bild Konfettibeutel mit rotem, gelbem und blauem Konfetti. Der Anteil der Farben ist in den Beuteln unterschiedlich

Nun ist es so, dass die verschiedenen Konfettibeutel etwas gemeinsam haben, nämlich, dass sie alle sowohl mit rotem, gelbem und auch mit blauem Konfetti befüllt sind. Anders ausgedrückt enthalten deine zehn Variablen also alle ähnliche Informationen. Wenn du nun diese Information aus den Konfettibeuteln kompakter darstellen möchtest, brauchst du folglich nicht alle zehn Konfettibeutel. Stattdessen musst du lediglich wissen, welche Konfettifarben in den Beuteln vertreten waren. Damit hast du auch schon deine Faktoren, mit denen du deine Variablen zusammenfassen kannst: Aus den zehn bunt gemischten Konfettibeuteln wurden drei Faktoren, nämlich die Konfettifarben rot, gelb und blau

%Bild Konfettibeutel wurden zu den drei Faktoren "rotes, gelbes und blaues Konfetti" zusammengefasst

Ziele der Faktorenanalyse 

Bei der Faktorenanalyse hast du immer zwei Ziele, die einander widersprechen: Einerseits möchtest du die vielen Variablen zu möglichst stark zusammenfassen. Andererseits soll dabei jedoch möglichst wenig Information der Ausgangsvariablen verloren gehen.

Bei unserem Beispiel war es noch einfach, beide Ziele unter einen Hut zu bekommen: Der Inhalt der zehn Konfettibeutel konnte komplett mit Hilfe der drei Faktoren „rotes, blaues und gelbes Konfetti“ abgebildet werden. Du konntest deine Variablen also stark zusammenfassen und hast trotzdem keine Information verloren. 

Nun könnte es ja aber auch sein, dass in ein paar der Konfettibeutel noch etwas grünes, pinkes oder oranges Konfetti enthalten ist. Jetzt musst du abwägen: Bildest du für jede weitere Konfettifarbe noch einen weiteren Faktor? In diesem Fall könntest du deine zehn Konfettibeutel statt auf drei, nur noch auf sechs Faktoren reduzieren, was keine so große Verbesserung ist. Lässt du die zusätzlichen Faktoren „grün“, „orange“ und „pink“ hingegen weg, dann ist die Information der Ausgangsvariablen nicht mehr komplett in deinen Faktoren erhalten. Schließlich fehlt dann die Information des grünen, pinken und orangen Konfettis. 

%Bild: Einige Konfettibeutel enthalten nun auch noch grünes, pinkes und/oder oranges Konfetti (aber nicht so viel wie rotes, gelbes und blaues, die neuen Farben sind eher ein kleiner Zusatz) 

Für dieses Problem gibt es keine allgemeingültige Lösung, jedoch existieren einige Richtlinien, wie viele Faktoren du vermutlich behalten solltest. Welche das sind, sehen wir uns im Abschnitt „Durchführung der Faktorenanalyse“ nochmal kurz an. 

Explorative und konfirmatorische Faktorenanalyse 

Von der Faktorenanalyse existieren verschiedene Formen. Besonders bekannt sind die konfirmatorische und die explorative (oder exploratorische) Faktorenanalyse.  Der Unterschied zwischen den beiden Arten der Faktorenanalyse liegt darin, ob du Hypothesen hast, wie viele und was für Faktoren du erwartest.

Hast du solche konkreten Hypothesen über das erwartete Faktorenmuster, dann handelt es sich um eine konfirmatorische Faktorenanalyse. In diesem Fall berechnest du mit sogenannten Fit-Indizes, wie gut deine Daten tatsächlich zu deinen Hypothesen passen und die erwarteten Faktoren bilden. 

Die explorative Faktorenanalyse ist hier ergebnisoffener. Mit dieser Art der Faktorenanalyse untersuchst du unvoreingenommen, welche gemeinsamen Faktoren du hinter deinen Variablen finden kannst. Anschließend versuchst du, die entdeckten Faktoren inhaltlich zu interpretieren. 

Faktorladung 

Die Grundidee und die Arten der Faktorenanalyse haben wir jetzt geklärt. Sehen wir uns als nächstes die wichtigsten Begrifflichkeiten der Faktorenanalyse anhand unseres Beispiels an. Als erstes sehen wir uns die „Faktorladung“ an.   

In unserem Beispiel haben wir zehn Konfettibeutel (Variablen) mit jeweils blauem, gelbem und rotem Konfetti. Vermutlich wir es aber so sein, dass nicht in jedem der Konfettibeutel gleich viel von jeder Konfettifarbe enthalten ist. Stattdessen ist in einem Beutel vielleicht mehr rotes und kaum blaues Konfetti und in einem anderen Beutel ist dafür wiederum ganz viel gelbes Konfetti. 

Folglich wird die Information eines Konfettibeutels mit viel rotem Konfetti besonders gut vom Faktor „rotes Konfetti“ dargestellt und hängt weniger stark mit den anderen beiden Faktoren zusammen. Wie gut eine Variable von einem Faktor repräsentiert wird, nennt man in der Fachsprache „Faktorladung“. Ein Konfettibeutel mit viel rotem Konfetti würde folglich hoch auf dem Faktor „rotes Konfetti“ laden und eher schwach auf den Faktoren „blaues“ und „gelbes Konfetti“. Mathematisch ist die Faktorladung (i. d. R.) nichts anderes als die Korrelation zwischen der Variable und dem Faktor.  Folglich kann die Faktorladung Werte zwischen -1 und 1 annehmen, wobei betragsmäßig höhere Werte bedeuten, dass eine Variable stark mit einem Faktor zusammenhängt. 

% Verbindungslinie von einem Beutel mit viel rotem Konfetti zu dem Faktor "rotes Konfetti" optisch hervorheben, um zu zeigen, dass die Ladung auf diesem Faktor stärker ist als auf den anderen beiden Faktoren.

Kommunalität 

Neben der Faktorladung gibt es bei der Faktorenanalyse noch die Kommunalität einer Variable und den Eigenwert eines Faktors.

Die Kommunalität einer Variable gibt an, welcher Anteil der Varianz dieser Variable durch alle Faktoren insgesamt abgebildet werden kann. In anderen Worten sagt sie also aus, wie gut die Information der Variable in den Faktoren insgesamt erhalten geblieben ist. Die Kommunalität kann Werte zwischen 0 und 1 annehmen, wobei höhere Werte dafürstehen, dass die Faktoren den Inhalt der Variable gut repräsentieren. Welche Annahmen bezüglich der Kommunalität zusätzlich genau gelten, hängt davon ab, welche Art der Faktorenanalyse du durchführst. Hier wird insbesondere zwischen der Hauptkomponentenanalyse (HKA) und der Hauptachsenanalyse (HAA) unterschieden. Bei der Hauptkomponentenanalyse wird zu Beginn der Faktorenanalyse eine Kommunalität von 1 angenommen, bei der Hauptachsenanalyse muss diese erst geschätzt werden.

Bezogen auf unser Konfettibeispiel kannst du dir die Kommunalität so vorstellen: Enthält ein Konfettibeutel ausschließlich blaues, gelbes und rotes Konfetti und wir haben auch genau die Faktoren rot, gelb und blau, dann kann die Information dieser Variable perfekt durch die Faktoren abgebildet werden. In diesem Fall ist die Kommunalität 1. Hast du hingegen wieder nur drei Faktoren, deine Ausgangsvariable enthält jedoch Konfetti von 5 verschiedenen Farben, dann kann die Information der Ausgangsvariable nicht perfekt durch die Faktoren „blau, gelb und rot“ abgebildet werden.  Folglich wäre die Kommunalität kleiner als 1. 

Eigenwert 

Der Eigenwert eines Faktors ist schließlich ein Maß dafür, wie viel Information in diesem Faktor gebündelt werden konnte und wie bedeutsam ein Faktor ist. Dabei gilt prinzipiell, dass größere Eigenwerte besser sind als kleine. Als grobe Orientierung kannst du dir merken, dass der Eigenwert eines Faktors mindestens größer als 1 sein sollte, da er in diesem Fall mehr Information enthält als eine (standardisierte) Variable. Es gibt jedoch auch noch detailliertere Richtlinien, ab wann ein Eigenwert als bedeutsam angesehen werden kann. Diese sehen wir uns im nächsten Abschnitt genauer an. 

Bezogen auf unser Beispiel gibt dir der Eigenwert eines Faktors vereinfacht Auskunft darüber, welche Konfettifarbe besonders stark vertreten ist. Hat etwa der Faktor „gelbes Konfetti“ einen sehr großen Eigenwert, dann scheint insgesamt in allen Tüten zusammen besonders viel gelbes Konfetti enthalten zu sein. 

Durchführung der Faktorenanalyse 

Eine Faktorenanalyse wirst du in der Praxis vermutlich nie per Hand durchführen. Das übernimmt in der Regel ein Statistikprogramm für dich dich. Trotzdem ist es hilfreich, einen groben Überblick darüber zu haben, was bei der Faktorenanalyse passiert: 
 
Allgemein basiert die Faktorenanalyse auf den Korrelationen zwischen den betrachteten Variablen, den so genannten „Interkorrelationen“. Betrachtet man das Muster der Zusammenhänge zwischen den Variablen können (nach einigen Zwischenschritten) die Gemeinsamkeiten zwischen den Variablen identifiziert und somit Faktoren gebildet werden.  

Faktorenextraktion und Abbruchkriterien

Dabei werden zunächst immer zu viele Faktoren gebildet (in der Fachsprache sagt man, die Faktoren werden „extrahiert“), als letztendlich benötigt werden. Im nächsten Schritt muss folglich entschieden werden, wie viele der Faktoren man tatsächlich behalten möchte. Dafür gibt es verschiedene Vorgehensweisen, die unterschiedlich präzise sind. Die bekannteste und einfachste Regel ist das Kaiser-Kriterium. Beim Kaiser-Kriterium werden einfach alle Faktoren behalten werden, die einen Eigenwert größer als 1 haben, da der Faktor ab dann mehr Varianz aufklärt als eine einzelne Ausgangsvariable. Daneben gibt es noch das Scree-Kriterium und die Parallel-Analyse nach Horn. Bei diesen Vorgehensweisen werden die Eigenwerte der Faktoren in ein Koordinatensystem eingetragen und anhand der entstandenen Kurve entschieden, welche Faktoren behalten werden sollen. 

Faktorenrotation

Bevor du deine Faktoren endlich inhaltlich interpretieren kannst, musst du deine Faktoren noch „rotieren“. Das liegt daran, dass deine gefundene Faktorlösung nur eine von unendlich vielen möglichen Lösungen ist. Dabei ist sie jedoch meist nicht die Lösung, die am einfachsten zu interpretieren ist. Mit Hilfe der Rotation kannst du eine Faktorlösung finden, bei der das leichter möglich ist. Dafür stehen dir bei einem Statistikprogramm verschiedene sogenannte orthogonale und oblique Rotationsverfahren zur Verfügung. Besonders bekannt sind etwa die Varimax- oder die Oblimin-Rotation. Bei orthogonalen Verfahren hast du den Vorteil, dass deine Faktoren nach der Rotation immer noch unabhängig voneinander sind. In manchen Fällen ist es jedoch inhaltlich logischer, Korrelationen zwischen den Faktoren zuzulassen, um eine gut interpretierbare Lösung zu finden. In diesem Fall solltest du auf oblique Rotationsverfahren zurückgreifen. 

Interpretation der Faktorlösung 

Hast du deine Faktoren nun extrahiert und rotiert, kannst du sie endlich interpretieren. Dabei geht es darum, sich anzusehen, welche Variablen auf welchen Faktoren hoch laden und daraus zu schließen, was der Faktor bedeuten könnte

Sehen wir uns das wieder an unserem Konfettibeispiel an. Hier könntest du etwa sehen, dass die Beutel mit viel gelbem Konfetti alle hohe Faktorladungen auf dem ersten Faktor haben, während die anderen Beutel nicht hoch auf diesem Faktor laden. In der Folge könntest du interpretieren, dass der erste Faktor vermutlich für „gelbes Konfetti“ steht.

Noch etwas deutlicher wird das Ganze, wenn wir uns ein reales Beispiel ansehen. Stell dir vor, du willst eine Faktorenanalyse mit den 30 Items eines Fragebogens durchführen. Die Items des Fragebogens sollen dabei die drei Persönlichkeitseigenschaften Extraversion, Gewissenhaftigkeit und Verträglichkeit erfassen. Hierbei sollen immer 10 Items eine Eigenschaft messen. Mit der Faktorenanalyse kannst du nun überprüfen, ob du hinter den 30 Items (den Variablen) wirklich auch drei Faktoren für die drei Persönlichkeitseigenschaften findest. Des Weiteren kannst du betrachten, ob die Items, die eine bestimmte Eigenschaft messen sollen, auch tatsächlich auf dem entsprechenden Faktor laden. So kannst du dir beispielsweise ansehen, ob die Items, die Extraversion messen sollen, auch wirklich alle hoch auf einem Faktor, dem Extraversionsfaktor, laden und niedrig auf den anderen beiden.

Bei der Interpretation der Faktorlösung geht es also darum, dir die Variablen inhaltlich anzusehen, um herauszufinden, was ein Faktor bedeuten könnte.

 

Hallo, leider nutzt du einen AdBlocker.

Auf Studyflix bieten wir dir kostenlos hochwertige Bildung an. Dies können wir nur durch die Unterstützung unserer Werbepartner tun.

Schalte bitte deinen Adblocker für Studyflix aus oder füge uns zu deinen Ausnahmen hinzu. Das tut dir nicht weh und hilft uns weiter.

Danke!
Dein Studyflix-Team

Wenn du nicht weißt, wie du deinen Adblocker deaktivierst oder Studyflix zu den Ausnahmen hinzufügst, findest du hier eine kurze Anleitung. Bitte lade anschließend die Seite neu.