Was bedeutet Validität einfach erklärt?

Validität bedeutet, dass eine Untersuchung genau das misst, was sie messen soll. So stellst du sicher, dass deine Ergebnisse auch wirklich das zeigen, was du untersuchst und nicht durch unerwünschte Faktoren verzerrt wurden.

Was bedeutet „hohe Validität“?

„Hohe Validität“ bedeutet, dass die Ergebnisse aussagekräftig und korrekt sind, weil sie nicht durch andere, störende Faktoren verzerrt wurden. Ein Test oder eine Untersuchung misst also das, was er oder sie messen soll.

Was ist Validität und Reliabilität?

Validität ist die Gültigkeit einer Messung, also ob sie tatsächlich das misst, was sie messen soll. Reliabilität hingegen beschreibt die Zuverlässigkeit, also ob eine Messmethode bei wiederholter Anwendung die gleichen Ergebnisse liefert. Eine Messung kann zuverlässig (reliabel), aber dennoch ungültig (nicht valide) sein.

Video

Quiz

Validität

Ob Fragebogen, Experiment oder Interview: Du kannst messen, was du willst — aber misst du auch wirklich das Richtige? Hier und im Video erfährst du, warum Validität so wichtig ist und wie du sie in deiner Forschung sicherstellst!

Inhaltsübersicht

Was ist Validität?

Die Validität ist neben Reliabilität und Objektivität ein Gütekriterium in der Forschung. Ein Test, Fragebogen oder Interview ist valide, wenn er wirklich das misst, was er messen soll — und nicht etwas anderes. Nur dann sind die Ergebnisse der Forschung tatsächlich aussagekräftig.

➡️ Beispiel: Ein Mathetest soll die Rechenfähigkeiten von Grundschülern messen. Doch die Aufgaben sind so kompliziert formuliert, dass die Schüler vor allem gutes Leseverständnis brauchen. Dadurch misst der Test in erster Linie nicht die Rechenfähigkeit. Validität wäre also nicht gegeben.

Validität — Definition

Validität ist ein Testgütekriterium, das angibt, inwieweit ein Messverfahren tatsächlich das misst, was es zu messen vorgibt. Eine Messung ist valide, wenn ihre Ergebnisse das interessierende Merkmal unverfälscht widerspiegeln und nicht durch andere Faktoren beeinflusst werden.

Arten der Validität

Validität ist nicht gleich Validität. Du unterscheidest verschiedene Arten, die jeweils unterschiedliche Fragen beantworten. Grob kannst du sie in grundlegende und spezifische Formen einteilen.

1. Grundlegende Arten — wichtig für jede empirische Forschung:

Interne Validität
Externe Validität

2. Spezifischere Arten — je nach Forschungsfrage relevant:

Konstruktvalidität
Inhaltsvalidität
Kriteriumsvalidität

Studyflix vernetzt: Hier ein Video aus einem anderen Bereich

Interne Validität

Interne Validität bedeutet, dass ein bestimmtes Ergebnis tatsächlich durch die untersuchte Ursache verursacht wurde — und nicht durch andere Einflüsse.

Die „untersuchte Ursache“ nennst du unabhängige Variable. Sie wird im Experiment gezielt verändert.
Das gemessene Ergebnis ist die abhängige Variable. Sie wird von der unabhängigen Variable beeinflusst.

Unterschiede im Ergebnis sollten nur auf die unabhängige Variable zurückzuführen sein. Je weniger alternative Erklärungen es für den Effekt gibt, desto höher ist die interne Validität.

➡️ Hohe interne Validität	➡️ Niedrige interne Validität
Studierende bekommen zufällig ein neues Konzentrationsmittel oder ein Placebo, und beide Gruppen machen denselben Aufmerksamkeitstest unter gleichen Bedingungen.	Eine Gruppe macht den Test morgens, die andere abends. Unterschiede könnten dann auch an der Tageszeit liegen — nicht am Konzentrationsmittel.

✅ So stellst du interne Validität sicher:

Störfaktoren kontrollieren oder ausschließen, z. B. durch gleiche Bedingungen für alle Teilnehmenden
Zufällige Zuteilung (Randomisierung) der Teilnehmenden zu den Gruppen, um Unterschiede zwischen den Gruppen möglichst gering zu halten
Standardisierte Abläufe, damit alle Teilnehmenden denselben Prozess durchlaufen

❌ Das gefährdet die interne Validität:

Veränderung über die Zeit — z. B. Übungseffekt oder Müdigkeit, wenn Teilnehmende eine Aufgabe mehrmals machen
Selektion — werden Teilnehmer nicht zufällig den Gruppen zugeteilt, könnten die Gruppen von Anfang an unterschiedlich sein
Versuchsleiter-Effekte — Versuchsleiter kann durch unbewusste Gestik oder Tonfall seine Erwartungen an die Teilnehmenden übertragen
Messinstrumente — technische Geräte oder auch Personen, die Daten erfassen, können unterschiedlich genau messen

Externe Validität

Die externe Validität beschreibt, wie gut sich die Ergebnisse einer Untersuchung auf andere Situationen, Personen, Orte oder Zeitpunkte anwenden lassen.

Eine Studie hat hohe externe Validität, wenn die gefundenen Effekte nicht nur unter den speziellen Bedingungen des Experiments auftreten, sondern auch auf die „reale Welt“ übertragbar sind.

➡️ Hohe externe Validität	➡️ Niedrige externe Validität
Eine Studie untersucht mit einem Online-Fragebogen, wie Studierende Social-Media-Plattformen nutzen. Der Fragebogen wird an mehrere Hochschulen in verschiedenen Städten verschickt, enthält unterschiedliche Fachrichtungen und Altersgruppen und ist zu verschiedenen Zeitpunkten zugänglich.	Der gleiche Fragebogen wird ausschließlich in einer WhatsApp-Gruppe von Wirtschaftsinformatik-Erstsemestern an einer einzigen Hochschule verteilt. Die Ergebnisse lassen sich kaum auf Studierende allgemein übertragen.

✅ So stellst du externe Validität sicher:

Untersuchung in möglichst realistischen Bedingungen durchführen, die der Alltagssituation ähneln
Vielfältige und repräsentative Stichprobe wählen, damit die Teilnehmenden nicht nur eine spezielle Altersgruppe repräsentieren
Wiederholung der Studie unter verschiedenen Bedingungen, um zu prüfen, ob die Ergebnisse stabil bleiben

❌ Das gefährdet die externe Validität:

Künstliche Laborsituationen, die wenig mit realen Bedingungen zu tun haben
Unterrepräsentative Stichprobe — z. B. nur Psychologie-Erstsemester, wenn aber Aussagen über die gesamte Bevölkerung getroffen werden sollen
Zeitgebundene Einflüsse, die verhindern, dass Ergebnisse zu einem anderen Zeitpunkt gelten — z. B. während einer gesellschaftlich angespannten Zeit

Konstruktvalidität

Unter Konstruktvalidität verstehst du, wie gut ein Fragebogen, Interview, o.ä. tatsächlich das Konstrukt erfasst, das es messen soll.

Ein Konstrukt ist ein Untersuchungsobjekt, das nicht direkt messbar ist. Dazu gehören z. B. Vertrauen, Zufriedenheit, Intelligenz oder Extraversion. Um sowas zu messen, musst du es in konkrete Fragen oder Aufgaben „übersetzen“.

➡️ Hohe Konstruktvalidität	➡️ Niedrige Konstruktvalidität
Ein Fragebogen zum Stresslevel von Studierenden erfasst typische Stresssymptome wie Schlafprobleme, Konzentrationsschwierigkeiten und Anspannung. Die Ergebnisse hängen stark mit anderen anerkannten Stressmessungen zusammen, aber kaum mit Messungen zu allgemeiner Lebenszufriedenheit.	Der gleiche Fragebogen enthält hauptsächlich Fragen zu Kaffeekonsum und Smartphone-Nutzung. Die Ergebnisse sagen wenig über das eigentliche Stresslevel aus und hängen eher mit Freizeitgewohnheiten als mit Stress zusammen.

Damit dein Messinstrument eine hohe Konstruktvalidität hat, muss es zwei Prüfungen bestehen:

Konvergenzvalidität: Ein Test, der dasselbe Konstrukt erfasst wie dein Test, sollte stark mit deinem Test zusammenhängen (korrelieren).
Diskriminanzvalidität: Ein Test, der ein anderes Konstrukt erfasst als dein Test, sollte nur schwach oder gar nicht mit deinem Test korrelieren — vorausgesetzt, diese Dinge hängen auch in der Realität nicht zusammen.

✏️ Die Konstruktvalidität solltest du in deiner Forschung genauer betrachten, wenn du abstrakte, nicht direkt messbare Konstrukte (latente Variablen) untersuchst.

Inhaltsvalidität

Die Inhaltsvalidität beschreibt, wie gut der Inhalt eines Tests das Konstrukt abdeckt, das untersucht werden soll.

Hohe Inhaltsvalidität liegt vor, wenn in deiner Messung alle wichtigen Aspekte des Konstrukts berücksichtigt und keine irrelevanten Inhalte abgefragt werden. Das Ziel ist, dass die Messung das gesamte Spektrum des Konstrukts abbildet — nicht nur einen Teil davon.

➡️ Hohe Inhaltsvalidität	➡️ Niedrige Inhaltsvalidität
Eine Studie misst mit einem Online-Fragebogen das Vertrauen von Studierenden in ihre Hochschule. Die Fragen decken mehrere Dimensionen ab, wie akademische Qualität, Transparenz von Entscheidungen, Umgang mit Feedback und soziale Unterstützung. Keine Frage weicht vom Thema Vertrauen ab.	Der gleiche Fragebogen enthält fast ausschließlich Fragen zur Ausstattung der Bibliothek und zur Sauberkeit der Mensa. Wichtige Aspekte wie die Qualität der Lehre oder die Kommunikation der Verwaltung fehlen. Das Konstrukt „Vertrauen in die Hochschule“ wird daher unvollständig erfasst.

✏️ Du solltest die Inhaltsvalidität ebenfalls genauer betrachten, wenn du ein nicht direkt messbares Konstrukt erfassen willst.

Kriteriumsvalidität

Die Kriteriumsvalidität zeigt dir, wie gut dein Messinstrument mit einem Außenkriterium zusammenhängt. Dieses Außenkriterium ist ein verlässlicher Maßstab für das Merkmal, das du untersuchst — zum Beispiel ein etablierter Test oder eine objektive Leistungsmessung. Je stärker die Übereinstimmung, desto höher die Kriteriumsvalidität.

➡️ Hohe Kriteriumsvalidität	➡️ Niedrige Kriteriumsvalidität
Du entwickelst einen Online-Eignungstest für Werkstudenten. Als Außenkriterium verwendest du die Bewertungen der Betreuer nach vier Wochen Probearbeit (Standardbewertungsskala für Arbeitsleistung). Die Testpunkte korrelieren stark mit diesen Betreuerbewertungen — dein Test sagt also das reale Arbeitsergebnis zuverlässig voraus.	Du behauptest, mit einem „Kommunikationstest“ die Teamfähigkeit vorherzusagen. Als Außenkriterium nimmst du später die Einschätzung durch Teamleiter in Projektbewertungen. Dein Testscore (z. B. Anzahl genutzter Social-Media-Plattformen) korreliert kaum mit diesen Teamleiter-Bewertungen. Das zeigt: Dein Test misst nicht das relevante Kriterium.

✏️ Die Kriteriumsvalidität ist elevant, wenn deine Messung etwas zuverlässig abbilden oder vorhersagen soll, wie z. B. eine Leistung oder ein bestimmtes Verhalten.

Reliabilität

Vielleicht fragst du dich jetzt: „Okay, mein Messinstrument ist valide. Heißt das, ich bin fertig?“ Nicht ganz. Denn die Validität ist nur eines von drei Gütekriterien. Daher solltest du auch die Reliabilität überprüfen. Die hängt mit der Validität nämlich eng zusammen.

Die Reliabilität beschreibt, wie zuverlässig und präzise deine Messung ist. Ein Test kann zum Beispiel das richtige Konstrukt messen, aber liefert immer ein anderes Ergebnis — dann ist er zwar valide, aber nicht reliabel.

Wie du die Reliabilität beurteilst und welche Arten es gibt, erfährst du hier im Beitrag!

Validität — häufigste Fragen

(ausklappen)

Was bedeutet Validität einfach erklärt?

Validität bedeutet, dass eine Untersuchung genau das misst, was sie messen soll. So stellst du sicher, dass deine Ergebnisse auch wirklich das zeigen, was du untersuchst und nicht durch unerwünschte Faktoren verzerrt wurden.
Was bedeutet „hohe Validität“?

„Hohe Validität“ bedeutet, dass die Ergebnisse aussagekräftig und korrekt sind, weil sie nicht durch andere, störende Faktoren verzerrt wurden. Ein Test oder eine Untersuchung misst also das, was er oder sie messen soll.
Was ist Validität und Reliabilität?

Validität ist die Gültigkeit einer Messung, also ob sie tatsächlich das misst, was sie messen soll. Reliabilität hingegen beschreibt die Zuverlässigkeit, also ob eine Messmethode bei wiederholter Anwendung die gleichen Ergebnisse liefert. Eine Messung kann zuverlässig (reliabel), aber dennoch ungültig (nicht valide) sein.