Validität
Hier wird das Gütekriterium Validität anhand der internen Validität und der externen Validität einfach erklärt. Anschließend folgt eine genauere Untergliederung anhand der Inhaltsvalidität, Konstruktvalidität und Kriteriumsvalidität und deren Subkategorien. Auch der wichtige Zusammenhang zwischen Validität und Reliabilität kommt nochmal genau zur Sprache. Wenn dich also Fragen wie „Was bedeutet das Wort valide?“ oder „Wie wird Validität gemessen?“ interessieren, bist du hier genau richtig. Unser Video erklärt dir alles rund ums Thema!
Inhaltsübersicht
Validität einfach erklärt
Validität ist enorm wichtig, um die Güte einer Untersuchung zu gewährleisten. Dabei geht es im Kern darum herauszufinden, ob Mess- und Untersuchungsergebnisse die Wirklichkeit so genau wie möglich widerspiegeln. In anderen Worten: Messe ich auch wirklich das, was ich messen will? Um das zu gewährleisten und somit für valide Ergebnisse einer Untersuchung zu sorgen, kann man an verschiedenen Punkten im Forschungsprozess ansetzen. Diese verschiedenen Ansatzpunkte kann man auch als Validitätstypen bezeichnen. Auf einer ersten, allgemeinen Ebene lässt sich zwischen den beiden Bereichen interne und externe Validität unterscheiden. Es gibt gleichzeitig aber auch die Möglichkeit, anwendungsorientierter in die Kategorien Inhalts-, Konstrukt- und Kriteriumsvalidität zu unterteilen. Auf welche Aspekte bei den einzelnen Validitätstypen speziell zu achten ist, um eine hohe Validität für ein Forschungsvorhaben zu erreichen, erklären dir die folgenden Absätze im Detail.
Validität Definition
Validität misst per Definition die Gültigkeit einer Messung und soll im Allgemeinen sichern, dass eine Messung wirklich zielgerichtet das zu untersuchende Merkmal erfasst. Validität wird im Bezug auf empirische Untersuchungen häufig als das wichtigste der drei Kerngütekriterien Objektivität , Reliabilität und Validität deklariert. Besondere Relevanz kommt den Gütekriterien vor allem bei theoretischen Fragekonstrukten wie Vertrauen oder Zufriedenheit zu. Diese sind der Realität nur auf indirektem Weg zu entnehmen. Auf der höchsten Ebene der Betrachtung kann man das Gütekriterium Validität zuerst einmal in folgende Teile aufgliedern: Interne und externe Validität.
Interne Validität
Die interne Validierung konzentriert sich insbesondere auf die Identifikation und Bewertung von Störvariablen in Untersuchungen. Ein häufig auftretender Fall einer Störvariable ist beispielsweise das Bewusstsein der Probanden über ihre Beobachtung. Prozesse der internen Validierung stellen sicher, dass Ergebnisse tatsächlich auf die unabhängige Variable zurückzuführen sind und nicht etwa durch mögliche Störfaktoren verursacht wurden. Es können zwei wesentliche Arten von Störvariablen unterschieden werden: Merkmale von Versuchspersonen und äußere Faktoren.
Störvariablen
Unter die Merkmale von Versuchspersonen, die störend wirken können, fällt beispielsweise das individuelle Schätzvermögen von Befragten. Oftmals stellt man im Fragebogen Fragen, die darauf abzielen, wie lange sich Befragte mit einer Tätigkeit, zum Beispiel Musik hören, beschäftigen. Da man darüber selbst keine Daten sammelt, muss man bei der Beantwortung schätzen, was manche Leute besser und manche eben schlechter können. Das verzerrt die Repräsentativität der Antwort und verschlechtert somit die Validität der Befragung. Man kann den Störfaktor über die Konstruktion der Fragen aber zumindest minimieren, indem man Zeit in solchen Fällen in Kategorien (also auf ordinalem Skalenniveau) anstatt als exakte Zahl (also auf kardinalem Skalenniveau) erfragt und somit dem Befragten Spielraum zugesteht.
Störend wirkende äußere Faktoren können zum Beispiel finanzielle Mittel darstellen. Bleibt man beim Beispiel der Musik und will außerdem erfragen, wie groß das Interesse an Live-Musik und Konzerten ist, könnte man als Forscher auf die Idee kommen, dass allein die Anzahl an Konzertbesuchen das Thema gut abdeckt. Man muss aber bedenken, dass das Finanzielle hier eine große Rolle spielt und man daher nicht pauschal sagen kann, dass jemand der weniger Konzerte besucht daran auch weniger Interesse hat. Er könnte ja sein ganzes Freizeitbudget für Konzerte ausgeben, daher ein sehr hohes Interesse an ihnen haben und trotzdem in absoluten Zahlen seltener gehen als jemand, der weniger Interesse hat aber ein sehr großes Freizeitbudget. Man sollte sich in solchen Fällen also nicht auf die reine Anzahl als einziges Kriterium verlassen, sondern eben 1-2 Fragen mehr stellen, um das Thema vollständig und realitätsgetreu erfassen zu können.
Augenscheinvalidität
Außerdem wird der Test selbst bezüglich seines inneren Aufbaus genau unter die Lupe genommen. Ein erster Schritt hierbei sind oft die Anschauungs- oder Augenscheinvalidität. Sie überprüfen, ob Ergebnisse mit den subjektiven Voreinschätzungen von Wissenschaftlern bzw. Experten übereinstimmen. Trotz des Expertentums genügen solche Einschätzungen jedoch oft nicht den wissenschaftlichen Standards, die Tests und Erhebungen im Allgemeinen einhalten müssen. Deshalb gibt es weitere Testmöglichkeiten für Validität. Diese sind durch eine stark empirische oder inhaltlich-argumentative Ausrichtung verlässlicher, um bestimmen zu können, wie valide ein Test ist.
Externe Validität
Die externe Validierung, manchmal auch ökologische Validität, betrachtet im Gegensatz zur Internen die Möglichkeit einer Generalisierung und Übertragung der Untersuchungsergebnisse auf die Realität, um Schlüsse über diese anzustellen. Es geht also um die Allgemeingültigkeit von in Untersuchungen erzielten Ergebnissen. Dabei sortiert man nach bestimmten Arten von Übertragbarkeit: zeitliche Übertragbarkeit, Übertragbarkeit auf Populationen und situationsbedingte Übertragbarkeit.
Zeitlicher Faktor
Im Falle der zeitlichen Übertragung geht es um die Länge der Gültigkeit von Untersuchungsergebnissen; man muss also bezogen auf die jeweilige Studie überlegen und argumentieren, für wie lange die Ergebnisse gültig sein dürfen.
Populationsfaktor
Die Übertragung auf Populationen kann bei bestimmten Untersuchungen von ethnischen, geographischen oder milieubedingten Faktoren abhängen. Man sollte beispielsweise nicht ohne gut argumentieren Grund und Reflexion die Ergebnisse einer in Deutschland durchgeführten Studie eins zu eins auf andere Länder übertragen .
Situationsfaktor
Bei der situationsbedingten Übertragbarkeit geht es hauptsächlich um die Ausweitung der Ergebnisse von der verwendeten Stichprobe auf die zu untersuchende Grundgesamtheit. Man muss sich zum Beispiel darüber Gedanken machen, inwieweit beispielsweise eine Online-Umfrage das tatsächliche Kaufverhalten von Personen im Supermarkt abbilden kann und welche Verzerrungen auftreten könnten. Sehr problematisch sind im Falle der situationsbedingten Übertragbarkeit auch Laborversuche, da sich diese stark von einem realen Setting unterscheiden. Feldforschung hingegen besitzt eine relativ hohe ökologische Validität.
Inhaltsvalidität
Inhaltsvalidität kann man als Subkategorie von interner Validität betrachten. Sie wird dabei nicht über empirische Tests erhöht, sondern durch inhaltliche bzw. argumentative Überlegungen. Weiter liegt hier das Hauptaugenmerk auf der inhaltlichen Deckung des zu messenden Konstrukts und des verwendeten Testinstruments. Die in Tests oder Fragenkatalogen enthaltenen Frage-Items sollten dabei repräsentativ für das tatsächlich in der Realität betrachtete Merkmal sein und dieses so vollständig wie möglich abdecken und messen. Gleichzeitig sollte aber auch Unwesentliches außen vor gelassen werden. Daraus lässt sich folgende Handlungsvorlage ableiten: um eine hohe Inhaltsvalidität umzusetzen, sollten relevante Determinanten maximal vertreten sein, während irrelevante Determinanten im Test bzw. Fragekatalog vermieden werden. Um das ganze etwas verständlicher zu formulieren: Wie kannst du einen Fragebogen so konstruieren, dass ein Phänomen, zum Beispiel der Stellenwert von Musik im Leben von Jugendlichen, so realitätsnah und genau wie möglich abgedeckt wird?
Konstruktvalidität
Konstruktvalidität fungiert als Voraussetzung für Inhaltsvalidität und stellt die Überschneidung von Indikatoren und zu messendem Konstrukt dar. Vorliegen sollte im gewünschten Fall einer hohen Konstruktvalidität eine hohe Korrelation mit Tests, die dasselbe Konstrukt messen sollen. Gleichzeitig soll eine niedrige Korrelation mit Tests gegeben sein, die ein gänzlich anderes Konstrukt erfassen sollen. Die Konstruktvalidität lässt sich noch weiter in die Unterkategorien diskriminante Validität und konvergente Validität aufteilen.
Diskriminante Validität
Ein Fachbegriff für die beschriebene niedrige Korrelation mit Instrumenten, die andere Konstrukte messen, ist die diskriminante Validität. Sie stellt sicher, dass so wenig wie möglich irrelevante Determinanten im Test verbleiben.
Konvergente Validität
Umgekehrt soll zur Realisierung einer hohen konvergenten Validierung eine hohe Korrelation mit Tests vorliegen, die das gleiche Konstrukt erfassen und messen.
Kriteriumsvalidität
Bei der Kriteriumsvalidität dreht sich alles um mögliche relevante, andere Variablen, sogenannte Drittvariablen. Mit diesen auch Außenkriterium bezeichneten Drittvariablen sollten die Messungen möglichst hoch korrelieren. Die Kriteriumsvalidität unterteilt sich nochmals weiter in die retrospektive Validität, die konkurrente Validität sowie die prognostische Validität (manchmal auch prädiktive Validität). Bei dieser Unterteilung dreht es sich vor allem um die zeitliche Erfassung eines weiteren Kriteriums. Dieses kann mit einem Messinstrument entweder in der Vergangenheit erhoben worden sein (retrospektiv), zum gleichen Zeitpunkt (konkurrent) oder in der Zukunft (prognostisch). Am interessantesten bezüglich eines durchgeführten Tests sind meist seine Prognosefähigkeiten für die Zukunft. Trotzdem finden auch retrospektive und konkurrente Validierung Anwendung, vor allem um bei Prognosen für die Zukunft als Referenz und Anhaltspunkt zu fungieren.
Wenn beobachtetes Verhalten mit durch eine Messung prognostiziertem Verhalten korreliert wird, fällt dies unter die sogenannte Vorhersagevalidität. Bei der gleichzeitigen Messung von beobachtetem Verhalten und gemessener Einstellung spricht man hingegen von Übereinstimmungsvalidität. Die Rückblicksvalidität ermittelt schließlich den Zusammenhang zwischen einem aktuellen Testwert und einem bereits erhobenen Kriteriums. Ein Beispiel hierfür ist die Kombination von Abschneiden im Studium in einem fortgeschrittenen Semester und der Abiturnote.
Inkrementelle Validität
Sollte ein aktueller Test es schaffen, eine höhere Kriteriumsvalidität zu erzielen als bereits zuvor etablierte und verwendete Instrumente, bezeichnet man dieses Phänomen als sogenannte inkrementelle Validität.
Reliabilität Validität
Bei der Beschäftigung mit Validität muss auch darauf geachtet werden, die Beziehung zur Reliabilität immer im Blick zu haben. Eine hohe Reliabilität kann die Validität negativ beeinflussen und umgekehrt. Es handelt sich bei diesem Phänomen um das sogenannte Reliabilitäts-Validitäts-Dilemma. Hier ist forscherisches Feingefühl gefragt, denn oft kann es zu Situationen kommen, in denen man die Reliabilität erhöhende innere Konsistenz eines Fragebogens gegen die Heterogenität, die wiederum Validität gewährleistet, abwägen muss. Hier gibt es leider keine eindeutigen Handlungsanweisungen. Die Vor- und Nachteile müssen für jeden einzelnen Fall mit geeigneten Instrumenten empirisch geprüft oder argumentativ dargelegt werden.