Deskriptive Statistik

Deskriptive Statistik

Inhaltsübersicht

Die deskriptive Statistik gehört zu den Grundlagen der Statistik. Hier erklären wir dir dieses Themengebiet einfach und verständlich. Nach einer kurzen Übersicht über die Methoden und Kennzahlen der beschreibenden Statistik folgen anschließend konkrete Beispiele und eine Zusammenfassung.

Du lässt dir das Thema lieber in Bildern als in Worten erklären? Unser Video zur deskriptiven Statistik veranschaulicht alles auf einfachste Art und Weise und lässt keine Fragen mehr offen!

Deskriptive Statistik einfach erklärt

Was ist deskriptive Statistik? Per Definition bedeutet deskriptiv so viel wie beschreibend.Das heißt das Ziel ist die übersichtliche Darstellung und Aufbereitung empirischer Daten. Durch Tabellen, Grafiken und die Bestimmung relevanter Kennzahlen möchte man einen Überblick über das gesamte Datenmaterial gewinnen. Diese  Kennzahlen, wie beispielsweise der Mittelwert, werden in der beschreibenden Statistik auch Maßzahlen oder Parameter genannt. Anhand dieser soll die zentrale Tendenz, Streuung und Verteilung einer Stichprobe beschrieben werden. Konkret heißt das, dass du anhand dieser Maßzahlen beurteilen kannst, wie alt beispielsweise ein  Befragter bei deiner Umfrage im Durchschnitt ist, oder ob alle Teilnehmer in etwa gleich alt sind.

Statistik Grundlagen

Bevor man seine Daten verwerten kann, muss man also als erstes die Stichprobe beschreiben. Daher beginnt so gut wie jede statistische Analyse mit der deskriptiven Datenanalyse als Grundlage. Im Anschluss verfolgt man mit der explorativen Statistik das Ziel seine Daten zu „erkunden“ und bisher unbekannte Zusammenhänge im Datensatz ausfindig zu machen. Die beschreibende Statistik stellt also die Frage, wie man die Verteilung des Merkmals beschreiben kann, wohingegen die erkundende Statistik nach Unregelmäßigkeiten und Besonderheiten in dieser Beschreibung sucht. So kann man im Zuge der explorativen Statistik neue Hypothesen aufstellen, welche dann im Zuge der induktiven Statistik %Link( auch interefielle Statistik oder Inferenzstatistik genannt) getestet werden. So soll letztendlich auf Basis des Datensatzes einer Stichprobe auf dessen Allgemeingültigkeit geschlossen werden können. Diese 3 Themengebiete bilden zusammen mit der Wahrscheinlichkeitsrechnung das als Stochastik bezeichnete Teilgebiet der Mathematik.

Statistik Übersicht: 

  • deskriptive Statistik ( beschreibende Statistik )
  • explorative Statistik ( erkundende Statistik )
  • induktive Statistik ( schließende Statistik )

Deskriptive und induktive Statistik

Für die größte Verwirrung sorgt wohl die Unterscheidung zwischen deskriptiver und induktiver Statistik, obwohl diese eigentlich ganz einfach ist. Wie bereits gesagt, bildet die deskriptive Statistik die Grundlage für die weiteren Untersuchungen, indem sie die Daten der Stichprobe übersichtlich darstellt. Im Gegensatz dazu geht die induktive Statistik einen Schritt weiter und testet mit Hilfe wahrscheinlichkeitstheoretischer Methoden die allgemeine Gültigkeit der Erkenntnisse des Datensatzes. Die explorative Statistik gilt dabei als Mischform beziehungsweise als Zwischenstufe zwischen der beschreibenden und schließenden Statistik.

Statistische Methoden: deskriptiv

Um dir das Leben bei der Datenanalyse zu erleichtern, kannst du spezielle Softwareprogramme wie das Statistikprogramm R oder die SPSS Software nutzen. Du kannst deine Daten aber auch übersichtlich mithilfe von Excel, einfachen Tabellen und Grafiken darstellen. Das Ziel ist es anhand von Daten aus beispielsweise einer Umfrage oder anhand von Versuchsergebnissen die Eigenschaften und Trends in dem Datensatz zu veranschaulichen.

Dabei ist entscheidend, wie oft die möglichen Werte gemessen bzw. beobachtet wurden. Folglich unterscheidet man hierbei zwischen der absoluten und der relativen Häufigkeit.

Tabellen: Hier werden die Daten in einer Matrix dargestellt. Normalerweise werden die Beobachtungen in den Zeilen und die Variablen in den Spalten abgetragen. Eine beliebte Darstellungsmethode ist die so genannte Kontingenztabelle.%Bild einfügen, Verweis an Animation

Grafiken: Um einen umfassenden Überblick zu erlangen sind Diagramme und Grafiken jedoch besser geeignet, da sie den Datensatz besser visualisieren. Der Nachteil hierbei ist, dass oft eine Zusammenfassung der Daten notwendig ist. So können im schlimmsten Fall Information verloren gehen. Die bekanntesten Darstellungsmethoden sind Kreisdiagramme, Streudiagramme oder so genannte Histogramme. %Bild einfügen, Verweis an Animation

Zur übersichtlichen Darstellung der einzelnen Kennzahlen kann auch ein so genannter Boxplot sehr hilfreich sein. Diese Kastengrafik umfasst alle wichtigen Lage- und Streuungsmaße einer Verteilung und stellt diese graphisch dar. Diese charakteristischen Kennzahlen des Datensatzes werden wir nun im Folgenden genauer betrachten.

Statistische Kennzahlen: deskriptiv

Welche Kennzahlen auf Basis deines Datensatzes gebildet werden können, hängt von der Fragestellung und von dem Skalenniveau der Daten ab. Es gibt drei Arten von Kenngrößen, welche dann die verschiedenen Maßzahlen und Parameter umfassen. Diese sind:

  • Lagemaße
  • Streuungsmaße 
  • Zusammenhangsmaße

Lagemaße

Lageparameter geben die zentrale Tendenz des Datensatzes an. Konkret wird also untersucht, ob die gemessenen Werte eher groß oder klein sind. Bei einer Umfrage  kann man beispielsweise ermitteln, ob eher jüngere oder ältere Menschen befragt wurden. Die wichtigsten Parameter, welche in diesem Zuge gebildet werden, sind Mittelwert, Median und Modus.

  • Mittelwert: Dieser Parameter gibt den Durchschnitt aller Werte an. Dabei kann zwischen dem arithmetischen Mittel, dem harmonischen Mittel und dem geometrischen Mittel unterschieden werden.
  • Median: Um den Median zu bilden, müssen die Daten zumindest den Anforderungen einer Ordinalskala entsprechen. Der Median teilt den Datensatz genau in der Mitte, sodass genauso viele Werte darüber wie darunter liegen.
  • Modus: Dieser Parameter kann für alle Skalenniveaus, also auch für Daten der Nominalskala gebildet werden. Der Modalwert beschreibt ganz einfach den Wert, der am häufigsten vorkommt.

Streuungsmaße

Meist reichen die Lageparameter jedoch nicht aus um um den Datensatz umfassend zu veranschaulichen. Daher ist es sinnvoll sich zusätzlich die Streuung der Daten anzusehen. So kann man überprüfen, ob die Werte sehr unterschiedlich sind und es eventuell Ausreißer im Datensatz gibt. Die wichtigsten Streuungsparameter sind:

Zusammenhangsmaße

Ein Zusammenhangsparameter gibt die Stärke und gegebenenfalls die Richtung des Zusammenhangs zweier Variablen an. In diesem Zuge spielt auch die Korrelation eine wichtige Rolle. Es können verschiedene Korrelationskoeffizienten gebildet werden, zum Beispiel bei der Pearson Korrelation oder der Spearman Korrelation.

Deskriptive Statistik Beispiele

Übung macht den Meister. Das gilt auch für die Methoden und Kennzahlen der deskriptiven Statistik. Deshalb beinhalten unsere Videos der Playlist einige Anwendungsbeispiele mit Übungen und Lösungen zur deskriptiven Statistik.

  • Zum Beispiel erklären wir dir, wie du das Skalenniveau bestimmen kannst und anschließend beispielsweise mit Hilfe der Intervallskala Temperaturschwankungen beschreiben kannst.
  • Außerdem erfährst du, wie du beispielsweise Aussagen über die Notenverteilung in deinem Kurs mit Hilfe des arithmetischen Mittels treffen kannst.
  • Wie du Ausreißer identifizieren und damit umgehen kannst, zeigen wir dir in dem Video Spannweite und Quartilsabstand, indem wir die Streuung um den Mittelwert genauer untersuchen.
  • Auch die Zusammenhangsmaße kommen nicht zu kurz und wir zeigen dir, wie du die Beziehung zwischen dem Schulabschluss und den monatlichen Einkommen in einer Kontingenztabelle übersichtlich darstellen kannst.

Zusammenfassung deskriptive Statistik

Zusammenfassend kannst du dir also merken, dass es das Ziel der deskriptiven Statistik ist, deinen Datensatz anschaulich mit Hilfe von Tabellen und Grafiken darzustellen. So kannst du die zentralen Kennzahlen der Lage- Streuungs und Zusammenhangsmaße direkt ermitteln und ablesen, um anschließend weiter mit diesen Parametern arbeiten zu können im Rahmen der explorativen und induktiven Statistik.

 


Andere Nutzer halten diese Inhalte aus dem Bereich „Deskriptive Statistik“ für besonders klausurrelevant

Hallo, leider nutzt du einen AdBlocker.

Auf Studyflix bieten wir dir kostenlos hochwertige Bildung an. Dies können wir nur durch die Unterstützung unserer Werbepartner tun.

Schalte bitte deinen Adblocker für Studyflix aus oder füge uns zu deinen Ausnahmen hinzu. Das tut dir nicht weh und hilft uns weiter.

Danke!
Dein Studyflix-Team

Wenn du nicht weißt, wie du deinen Adblocker deaktivierst oder Studyflix zu den Ausnahmen hinzufügst, findest du hier eine kurze Anleitung. Bitte lade anschließend die Seite neu.