Datentypen in der Statistik zeigen, was eine Variable darstellt. Wenn die Werte Bezeichnungen wie „rot“ oder „Biologie“ sind, sind die Daten qualitativ. Wenn die Werte numerische Größen sind, sind die Daten quantitativ. Bei quantitativen Daten stellt man dann meist noch eine weitere Frage: Handelt es sich um eine diskrete Anzahl oder eine stetige Messung?

Das ist wichtig, weil der Datentyp beeinflusst, welche Diagramme, Kennwerte und Modelle sinnvoll sind. Ein Mittelwert kann bei Körpergrößen hilfreich sein, aber nicht bei Augenfarben.

Qualitative vs. quantitative Daten

Qualitative Daten bedeuten Kategorien

Qualitative Daten beschreiben Eigenschaften, Gruppen oder Bezeichnungen statt numerischer Mengen. Beispiele sind Autofarbe, Blutgruppe und Land.

Diese Art von Daten wird auch oft als kategoriale Daten bezeichnet.

Quantitative Daten bedeuten numerische Mengen

Quantitative Daten erfassen eine numerische Größe. Die Zahl ist nicht nur eine Bezeichnung, sondern gibt an, wie viel, wie viele oder wie weit.

Beispiele sind Alter, Körpergröße, Testergebnis und Anzahl der Haustiere.

Diskrete vs. stetige Daten

Diskrete Daten entstehen durch Zählen

Diskrete Daten sind quantitative Daten, die meist durch Zählen entstehen. Die Werte springen von einem zulässigen Wert zum nächsten, statt ein ganzes Intervall auszufüllen.

Die Anzahl der Schülerinnen und Schüler in einer Klasse ist diskret, weil man ganze Personen zählt. In einem gewöhnlichen Zählmodell ergeben Werte wie 24.524.5 Schülerinnen und Schüler keinen Sinn.

Stetige Daten entstehen durch Messen

Stetige Daten sind quantitative Daten, die meist durch Messen entstehen. Grundsätzlich kann der Wert immer genauer erfasst werden, je nach Messinstrument und Kontext.

Körpergröße, Zeit und Temperatur sind typische Beispiele. Die Körpergröße einer Person kann je nach verwendeter Genauigkeit als 170170 cm, 170.2170.2 cm oder 170.24170.24 cm angegeben werden.

Durchgerechnetes Beispiel: Schülerdaten klassifizieren

Angenommen, eine Schule erfasst für jede Schülerin und jeden Schüler diese vier Variablen:

  • Klasse
  • Anzahl der Geschwister
  • Fahrzeit zur Schule
  • Lieblingsfach

So lassen sie sich einordnen.

Klasse ist qualitativ, weil sie eine Gruppenbezeichnung ist.

Anzahl der Geschwister ist quantitativ und diskret, weil es sich um eine Zählung handelt: 0,1,2,3,0, 1, 2, 3, und so weiter.

Fahrzeit zur Schule ist quantitativ und stetig, weil sie gemessen wird. Man kann sie auf die nächste Minute runden, aber die zugrunde liegende Variable kann feiner variieren.

Lieblingsfach ist qualitativ, weil es eine Kategorie bezeichnet und keine Menge.

Dieses Beispiel zeigt den wichtigsten Entscheidungsweg. Frage zuerst: „Bezeichnung oder Menge?“ Wenn es eine Menge ist, frage: „Zählung oder Messung?“

So erkennst du den Datentyp

Nutze diese Faustregel:

  1. Wenn ein Durchschnitt der Werte keinen Sinn ergibt, sind die Daten wahrscheinlich qualitativ.
  2. Wenn ein Durchschnitt sinnvoll wäre, sind die Daten wahrscheinlich quantitativ.
  3. Wenn die quantitativen Werte durch das Zählen einzelner Objekte entstehen, sind sie meist diskret.
  4. Wenn sie durch Messen auf einer Skala entstehen, sind sie meist stetig.

Das ist eine praktische Abkürzung, kein formaler Beweis. Der Kontext der Variable bleibt trotzdem wichtig.

Häufige Fehler bei Datentypen in der Statistik

Numerische Codes als echte Mengen behandeln

Wenn Umfrageantworten mit 11, 22 und 33 codiert sind, können diese Zahlen trotzdem für Kategorien und nicht für echte Mengen stehen. Eine Zahl in den Daten macht eine Variable nicht automatisch quantitativ.

Annehmen, dass jeder ganzzahlige Wert diskret ist

Ein gemessener Wert kann nur deshalb als ganze Zahl erscheinen, weil er gerundet wurde. Zum Beispiel sind Gewichte mit den Angaben 6868, 7272 und 7575 Kilogramm immer noch stetige Daten, wenn das Gewicht gemessen und nicht gezählt wurde.

Die Variable mit ihrer Speicherung verwechseln

Eine auf die nächste Minute gerundete Fahrzeit wird oft als ganze Zahl gespeichert, aber die Variable selbst ist weiterhin stetig. Das Speicherformat ändert den zugrunde liegenden Typ nicht immer.

Wo diese Datentypen in der Statistik verwendet werden

Die Einordnung ist wichtig, sobald du ein Diagramm, einen Kennwert oder ein statistisches Verfahren auswählst.

Für qualitative Daten sind Balkendiagramme und Häufigkeitstabellen üblich. Für quantitative Daten können Histogramme, Boxplots, Mittelwerte, Mediane und Standardabweichungen nützlich sein.

Die Unterscheidung zwischen diskret und stetig ist auch wichtig bei der Wahl eines Wahrscheinlichkeitsmodells. Manche Modelle sind für Zählwerte gedacht, andere für Messwerte auf einem Kontinuum.

Probiere deine eigene Version

Nimm fünf Variablen aus dem Alltag, zum Beispiel Schuhgröße, Postleitzahl, Temperatur, Anzahl der E-Mails oder Haarfarbe, und ordne jede ein. Wenn ein Fall mehrdeutig wirkt, nenne die Bedingung, die entscheidet, ob der Wert eine Bezeichnung, eine Zählung oder eine Messung ist.

Wenn du noch einen Schritt weitergehen willst, untersuche zusätzlich, welches Diagramm oder welcher Kennwert für jede Variable sinnvoll ist und welcher nicht.

Brauchst du Hilfe bei einer Aufgabe?

Lade deine Frage hoch und erhalte in Sekunden eine verifizierte Schritt-für-Schritt-Lösung.

GPAI Solver öffnen →