Die kumulierte Häufigkeit ist die fortlaufende Summe in einer Häufigkeitstabelle. Sie zeigt, wie viele Beobachtungen bei oder unter einem Wert oder einer Klassen­grenze liegen. Deshalb ist sie nützlich, um Median, Quartile und Perzentile zu bestimmen.

Eine Summenkurve ist die grafische Darstellung dieser laufenden Summe. Wenn du Tabelle und Graph zusammen lesen kannst, werden Aufgaben mit gruppierten Daten viel einfacher.

Definition der kumulierten Häufigkeit

Wenn die Klassenhäufigkeiten f1,f2,,fkf_1, f_2, \dots, f_k sind, dann ist die kumulierte Häufigkeit bis zur Klasse kk

Fk=f1+f2++fkF_k = f_1 + f_2 + \cdots + f_k

Jede Zeile fügt dem Gesamtwert eine weitere Klasse hinzu. Wenn die kumulierte Häufigkeit am Ende einer Klasse 2828 beträgt, dann liegen 2828 Beobachtungen in dieser Klasse oder darunter.

Bei ungruppierten Daten ist die kumulierte Häufigkeit einfach eine fortlaufende Zählung. Bei gruppierten Daten ist sie eine fortlaufende Zählung nach Klassenintervallen.

Wie eine Summenkurve beim Ablesen von Perzentilen hilft

Eine Summenkurve trägt die kumulierte Häufigkeit gegen Klassen­grenzen auf. Bei gruppierten stetigen Daten trägt man normalerweise ein:

  • die obere Klassen­grenze auf der horizontalen Achse
  • die kumulierte Häufigkeit auf der vertikalen Achse

Dann verbindet man die Punkte mit einer glatten oder stückweisen Linie. Die Kurve steigt an, weil die kumulierte Häufigkeit nie abnimmt.

Der wichtigste Nutzen einer Summenkurve ist das Ablesen von Positionen in einem geordneten Datensatz. Wenn die Gesamthäufigkeit NN ist, dann gilt:

  • der Median liegt ungefähr beim N/2N/2-ten Wert
  • das erste Quartil liegt ungefähr beim N/4N/4-ten Wert
  • das dritte Quartil liegt ungefähr beim 3N/43N/4-ten Wert
  • das pp-te Perzentil liegt ungefähr beim (p/100)N(p/100)N-ten Wert

Im Diagramm startest du bei dieser vertikalen Position, gehst waagrecht zur Summenkurve und dann senkrecht nach unten zur horizontalen Achse, um den Wert zu schätzen.

Durchgerechnetes Beispiel: Median und 75. Perzentil

Angenommen, die Testergebnisse von 4040 Schülerinnen und Schülern sind so gruppiert:

Punktzahl Häufigkeit Kumulierte Häufigkeit
0-10 22 22
10-20 55 77
20-30 99 1616
30-40 1212 2828
40-50 88 3636
50-60 44 4040

Die Gesamthäufigkeit ist N=40N = 40.

Bestimme den Median aus der Tabelle

Der Median ist der N/2=20N/2 = 20-te Wert.

Betrachte die kumulierten Häufigkeiten:

  • bis 20-30 beträgt die Summe 1616
  • bis 30-40 beträgt die Summe 2828

Also liegt der 2020-te Wert in der Klasse 3030-4040.

Wenn du eine Schätzung für gruppierte Daten möchtest, verwende Interpolation nur dann, wenn es sinnvoll ist anzunehmen, dass die Werte in dieser Klasse ziemlich gleichmäßig verteilt sind. Dann gilt

medianL+N/2Fbeforefw\text{median} \approx L + \frac{N/2 - F_{\text{before}}}{f} \cdot w

Hier ist:

  • L=30L = 30 die untere Grenze der Klasse
  • Fbefore=16F_{\text{before}} = 16 die kumulierte Häufigkeit vor dieser Klasse
  • f=12f = 12 die Klassenhäufigkeit
  • w=10w = 10 die Klassenbreite

Also

median30+20161210=30+401233.3\text{median} \approx 30 + \frac{20 - 16}{12} \cdot 10 = 30 + \frac{40}{12} \approx 33.3

Diese Schätzung ist nicht exakt. Sie hängt von der Annahme ab, dass die Werte innerhalb der Klasse 3030-4040 relativ gleichmäßig verteilt sind.

Schätze das 75. Perzentil

Das 7575-te Perzentil ist der (75/100)40=30(75/100) \cdot 40 = 30-te Wert.

Aus den kumulierten Häufigkeiten:

  • bis 30-40 beträgt die Summe 2828
  • bis 40-50 beträgt die Summe 3636

Also liegt der 3030-te Wert in der Klasse 4040-5050.

Mit derselben Interpolationsidee gilt

P7540+3028810=42.5P_{75} \approx 40 + \frac{30 - 28}{8} \cdot 10 = 42.5

In einer Summenkurve würdest du auf der Achse der kumulierten Häufigkeit die 3030 markieren, waagrecht zur Kurve gehen und dann auf der Punktzahlachse etwa 42.542.5 ablesen.

Häufige Fehler bei der kumulierten Häufigkeit

Häufigkeit und kumulierte Häufigkeit verwechseln

Die Häufigkeit sagt dir, wie viele Beobachtungen in einer einzelnen Klasse liegen. Die kumulierte Häufigkeit sagt dir, wie viele Beobachtungen in dieser Klasse und in allen vorherigen Klassen zusammen liegen.

Die falsche Position verwenden

Für den Median oder ein Perzentil ergibt sich die Position aus der Gesamthäufigkeit NN. Wenn du die falsche Gesamthäufigkeit verwendest, ist jeder spätere Schritt ebenfalls falsch.

Gruppierte Schätzungen als exakt behandeln

Eine Summenkurve oder Interpolation liefert eine Schätzung innerhalb einer Klasse, keinen exakten ursprünglichen Datenwert. Diese Schätzung hängt davon ab, wie die Daten innerhalb des Intervalls verteilt sind.

Die falschen horizontalen Werte eintragen

Bei gruppierten Daten werden Summenkurven normalerweise gegen Klassen­grenzen aufgetragen, besonders gegen obere Klassen­grenzen. Wenn du stattdessen Klassenmitten verwendest, ändert sich die Bedeutung.

Wann die kumulierte Häufigkeit verwendet wird

Die kumulierte Häufigkeit wird immer dann verwendet, wenn du die geordnete Position in einem Datensatz brauchst und nicht nur die Anzahl pro Klasse. Dazu gehören Zusammenfassungen von Prüfungsergebnissen, Einkommensverteilungen, Daten aus der Qualitätskontrolle und jede Situation, in der Perzentile oder Mediane wichtiger sind als einzelne Klassenhäufigkeiten.

Sie ist besonders nützlich, wenn die Rohdaten sehr umfangreich sind und eine gruppierte Tabelle leichter zu lesen ist als eine lange Liste von Beobachtungen.

Probiere eine ähnliche Aufgabe zur kumulierten Häufigkeit

Nimm eine beliebige kleine gruppierte Tabelle und ergänze eine Spalte für die kumulierte Häufigkeit, bevor du eine Summenkurve zeichnest. Lies dann den Median und ein Perzentil aus dem Diagramm ab und vergleiche sie mit der Schätzung aus der Tabelle.

Wenn du noch eine zusätzliche Kontrolle möchtest, versuche deine eigene Version mit N=50N = 50 und frage dich, in welche Klassen der 2020-te, 2525-te und 4545-te Wert fallen würden. Das ist eine einfache Möglichkeit, die Idee wirklich zu verinnerlichen.

Brauchst du Hilfe bei einer Aufgabe?

Lade deine Frage hoch und erhalte in Sekunden eine verifizierte Schritt-für-Schritt-Lösung.

GPAI Solver öffnen →