Die deskriptive Statistik gehört zu den Grundlagen der Statistik. Hier erklären wir dir dieses Themengebiet einfach und verständlich. Nach einer kurzen Übersicht über die Methoden und Kennzahlen der beschreibenden Statistik folgen anschließend konkrete Beispiele und eine Zusammenfassung.
Du lässt dir das Thema lieber in Bildern als in Worten erklären? Unser Video zur deskriptiven Statistik veranschaulicht alles auf einfachste Art und Weise und lässt keine Fragen mehr offen!
Was ist deskriptive Statistik? Per Definition bedeutet deskriptiv so viel wie beschreibend.Das heißt das Ziel ist die übersichtliche Darstellung und Aufbereitung empirischer Daten. Durch Tabellen, Grafiken und die Bestimmung relevanter Kennzahlen möchte man einen Überblick über das gesamte Datenmaterial gewinnen. Diese Kennzahlen, wie beispielsweise der Mittelwert, werden in der beschreibenden Statistik auch Maßzahlen oder Parameter genannt. Anhand dieser soll die zentrale Tendenz, Streuung und Verteilung einer Stichprobe beschrieben werden. Konkret heißt das, dass du anhand dieser Maßzahlen beurteilen kannst, wie alt beispielsweise ein Befragter bei deiner Umfrage im Durchschnitt ist, oder ob alle Teilnehmer in etwa gleich alt sind.
Bevor man seine Daten verwerten kann, muss man also als erstes die Stichprobe beschreiben. Daher beginnt so gut wie jede statistische Analyse mit der deskriptiven Datenanalyse als Grundlage. Im Anschluss verfolgt man mit der explorativen Statistik das Ziel seine Daten zu „erkunden“ und bisher unbekannte Zusammenhänge im Datensatz ausfindig zu machen. Die beschreibende Statistik stellt also die Frage, wie man die Verteilung des Merkmals beschreiben kann, wohingegen die erkundende Statistik nach Unregelmäßigkeiten und Besonderheiten in dieser Beschreibung sucht. So kann man im Zuge der explorativen Statistik neue Hypothesen aufstellen, welche dann im Zuge der induktiven Statistik ( auch interefielle Statistik oder Inferenzstatistik genannt) getestet werden. So soll letztendlich auf Basis des Datensatzes einer Stichprobe auf dessen Allgemeingültigkeit geschlossen werden können. Diese 3 Themengebiete bilden zusammen mit der Wahrscheinlichkeitsrechnung das als Stochastik bezeichnete Teilgebiet der Mathematik.
Statistik Übersicht:
Für die größte Verwirrung sorgt wohl die Unterscheidung zwischen deskriptiver und induktiver Statistik, obwohl diese eigentlich ganz einfach ist. Wie bereits gesagt, bildet die deskriptive Statistik die Grundlage für die weiteren Untersuchungen, indem sie die Daten der Stichprobe übersichtlich darstellt. Im Gegensatz dazu geht die induktive Statistik einen Schritt weiter und testet mit Hilfe wahrscheinlichkeitstheoretischer Methoden die allgemeine Gültigkeit der Erkenntnisse des Datensatzes. Die explorative Statistik gilt dabei als Mischform beziehungsweise als Zwischenstufe zwischen der beschreibenden und schließenden Statistik.
Um dir das Leben bei der Datenanalyse zu erleichtern, kannst du spezielle Softwareprogramme wie das Statistikprogramm R oder die SPSS Software nutzen. Du kannst deine Daten aber auch übersichtlich mithilfe von Excel, einfachen Tabellen und Grafiken darstellen. Das Ziel ist es anhand von Daten aus beispielsweise einer Umfrage oder anhand von Versuchsergebnissen die Eigenschaften und Trends in dem Datensatz zu veranschaulichen.
Dabei ist entscheidend, wie oft die möglichen Werte gemessen bzw. beobachtet wurden. Folglich unterscheidet man hierbei zwischen der absoluten und der relativen Häufigkeit .
Tabellen: Hier werden die Daten in einer Matrix dargestellt. Normalerweise werden die Beobachtungen in den Zeilen und die Variablen in den Spalten abgetragen. Eine beliebte Darstellungsmethode ist die so genannte Kontingenztabelle .
Grafiken: Um einen umfassenden Überblick zu erlangen sind Diagramme und Grafiken jedoch besser geeignet, da sie den Datensatz besser visualisieren. Der Nachteil hierbei ist, dass oft eine Zusammenfassung der Daten notwendig ist. So können im schlimmsten Fall Information verloren gehen. Die bekanntesten Darstellungsmethoden sind Kreisdiagramme, Streudiagramme oder so genannte Histogramme.
Zur übersichtlichen Darstellung der einzelnen Kennzahlen kann auch ein so genannter Boxplot sehr hilfreich sein. Diese Kastengrafik umfasst alle wichtigen Lage- und Streuungsmaße einer Verteilung und stellt diese graphisch dar. Diese charakteristischen Kennzahlen des Datensatzes werden wir nun im Folgenden genauer betrachten.
Welche Kennzahlen auf Basis deines Datensatzes gebildet werden können, hängt von der Fragestellung und von dem Skalenniveau der Daten ab. Es gibt drei Arten von Kenngrößen, welche dann die verschiedenen Maßzahlen und Parameter umfassen. Diese sind:
Lageparameter geben die zentrale Tendenz des Datensatzes an. Konkret wird also untersucht, ob die gemessenen Werte eher groß oder klein sind. Bei einer Umfrage kann man beispielsweise ermitteln, ob eher jüngere oder ältere Menschen befragt wurden. Die wichtigsten Parameter, welche in diesem Zuge gebildet werden, sind Mittelwert, Median und Modus .
Meist reichen die Lageparameter jedoch nicht aus um um den Datensatz umfassend zu veranschaulichen. Daher ist es sinnvoll sich zusätzlich die Streuung der Daten anzusehen. So kann man überprüfen, ob die Werte sehr unterschiedlich sind und es eventuell Ausreißer im Datensatz gibt. Die wichtigsten Streuungsparameter sind:
Ein Zusammenhangsparameter gibt die Stärke und gegebenenfalls die Richtung des Zusammenhangs zweier Variablen an. In diesem Zuge spielt auch die Korrelation eine wichtige Rolle. Es können verschiedene Korrelationskoeffizienten gebildet werden, zum Beispiel bei der Pearson Korrelation oder der Spearman Korrelation .
Übung macht den Meister. Das gilt auch für die Methoden und Kennzahlen der deskriptiven Statistik. Deshalb beinhalten unsere Videos der Playlist einige Anwendungsbeispiele mit Übungen und Lösungen zur deskriptiven Statistik.
Zusammenfassend kannst du dir also merken, dass es das Ziel der deskriptiven Statistik ist, deinen Datensatz anschaulich mit Hilfe von Tabellen und Grafiken darzustellen. So kannst du die zentralen Kennzahlen der Lage- Streuungs und Zusammenhangsmaße direkt ermitteln und ablesen, um anschließend weiter mit diesen Parametern arbeiten zu können im Rahmen der explorativen und induktiven Statistik.
Hallo, leider nutzt du einen AdBlocker.
Auf Studyflix bieten wir dir kostenlos hochwertige Bildung an. Dies können wir nur durch die Unterstützung unserer Werbepartner tun.
Schalte bitte deinen Adblocker für Studyflix aus oder füge uns zu deinen Ausnahmen hinzu. Das tut dir nicht weh und hilft uns weiter.
Danke!
Dein Studyflix-Team
Wenn du nicht weißt, wie du deinen Adblocker deaktivierst oder Studyflix zu den Ausnahmen hinzufügst, findest du hier eine kurze Anleitung. Bitte lade anschließend die Seite neu.