Die kumulierte Häufigkeit ist die fortlaufende Summe in einer Häufigkeitstabelle. Sie zeigt, wie viele Beobachtungen bei oder unter einem Wert oder einer Klassengrenze liegen. Deshalb ist sie nützlich, um Median, Quartile und Perzentile zu bestimmen.
Eine Summenkurve ist die grafische Darstellung dieser laufenden Summe. Wenn du Tabelle und Graph zusammen lesen kannst, werden Aufgaben mit gruppierten Daten viel einfacher.
Definition der kumulierten Häufigkeit
Wenn die Klassenhäufigkeiten sind, dann ist die kumulierte Häufigkeit bis zur Klasse
Jede Zeile fügt dem Gesamtwert eine weitere Klasse hinzu. Wenn die kumulierte Häufigkeit am Ende einer Klasse beträgt, dann liegen Beobachtungen in dieser Klasse oder darunter.
Bei ungruppierten Daten ist die kumulierte Häufigkeit einfach eine fortlaufende Zählung. Bei gruppierten Daten ist sie eine fortlaufende Zählung nach Klassenintervallen.
Wie eine Summenkurve beim Ablesen von Perzentilen hilft
Eine Summenkurve trägt die kumulierte Häufigkeit gegen Klassengrenzen auf. Bei gruppierten stetigen Daten trägt man normalerweise ein:
- die obere Klassengrenze auf der horizontalen Achse
- die kumulierte Häufigkeit auf der vertikalen Achse
Dann verbindet man die Punkte mit einer glatten oder stückweisen Linie. Die Kurve steigt an, weil die kumulierte Häufigkeit nie abnimmt.
Der wichtigste Nutzen einer Summenkurve ist das Ablesen von Positionen in einem geordneten Datensatz. Wenn die Gesamthäufigkeit ist, dann gilt:
- der Median liegt ungefähr beim -ten Wert
- das erste Quartil liegt ungefähr beim -ten Wert
- das dritte Quartil liegt ungefähr beim -ten Wert
- das -te Perzentil liegt ungefähr beim -ten Wert
Im Diagramm startest du bei dieser vertikalen Position, gehst waagrecht zur Summenkurve und dann senkrecht nach unten zur horizontalen Achse, um den Wert zu schätzen.
Durchgerechnetes Beispiel: Median und 75. Perzentil
Angenommen, die Testergebnisse von Schülerinnen und Schülern sind so gruppiert:
| Punktzahl | Häufigkeit | Kumulierte Häufigkeit |
|---|---|---|
| 0-10 | ||
| 10-20 | ||
| 20-30 | ||
| 30-40 | ||
| 40-50 | ||
| 50-60 |
Die Gesamthäufigkeit ist .
Bestimme den Median aus der Tabelle
Der Median ist der -te Wert.
Betrachte die kumulierten Häufigkeiten:
- bis 20-30 beträgt die Summe
- bis 30-40 beträgt die Summe
Also liegt der -te Wert in der Klasse -.
Wenn du eine Schätzung für gruppierte Daten möchtest, verwende Interpolation nur dann, wenn es sinnvoll ist anzunehmen, dass die Werte in dieser Klasse ziemlich gleichmäßig verteilt sind. Dann gilt
Hier ist:
- die untere Grenze der Klasse
- die kumulierte Häufigkeit vor dieser Klasse
- die Klassenhäufigkeit
- die Klassenbreite
Also
Diese Schätzung ist nicht exakt. Sie hängt von der Annahme ab, dass die Werte innerhalb der Klasse - relativ gleichmäßig verteilt sind.
Schätze das 75. Perzentil
Das -te Perzentil ist der -te Wert.
Aus den kumulierten Häufigkeiten:
- bis 30-40 beträgt die Summe
- bis 40-50 beträgt die Summe
Also liegt der -te Wert in der Klasse -.
Mit derselben Interpolationsidee gilt
In einer Summenkurve würdest du auf der Achse der kumulierten Häufigkeit die markieren, waagrecht zur Kurve gehen und dann auf der Punktzahlachse etwa ablesen.
Häufige Fehler bei der kumulierten Häufigkeit
Häufigkeit und kumulierte Häufigkeit verwechseln
Die Häufigkeit sagt dir, wie viele Beobachtungen in einer einzelnen Klasse liegen. Die kumulierte Häufigkeit sagt dir, wie viele Beobachtungen in dieser Klasse und in allen vorherigen Klassen zusammen liegen.
Die falsche Position verwenden
Für den Median oder ein Perzentil ergibt sich die Position aus der Gesamthäufigkeit . Wenn du die falsche Gesamthäufigkeit verwendest, ist jeder spätere Schritt ebenfalls falsch.
Gruppierte Schätzungen als exakt behandeln
Eine Summenkurve oder Interpolation liefert eine Schätzung innerhalb einer Klasse, keinen exakten ursprünglichen Datenwert. Diese Schätzung hängt davon ab, wie die Daten innerhalb des Intervalls verteilt sind.
Die falschen horizontalen Werte eintragen
Bei gruppierten Daten werden Summenkurven normalerweise gegen Klassengrenzen aufgetragen, besonders gegen obere Klassengrenzen. Wenn du stattdessen Klassenmitten verwendest, ändert sich die Bedeutung.
Wann die kumulierte Häufigkeit verwendet wird
Die kumulierte Häufigkeit wird immer dann verwendet, wenn du die geordnete Position in einem Datensatz brauchst und nicht nur die Anzahl pro Klasse. Dazu gehören Zusammenfassungen von Prüfungsergebnissen, Einkommensverteilungen, Daten aus der Qualitätskontrolle und jede Situation, in der Perzentile oder Mediane wichtiger sind als einzelne Klassenhäufigkeiten.
Sie ist besonders nützlich, wenn die Rohdaten sehr umfangreich sind und eine gruppierte Tabelle leichter zu lesen ist als eine lange Liste von Beobachtungen.
Probiere eine ähnliche Aufgabe zur kumulierten Häufigkeit
Nimm eine beliebige kleine gruppierte Tabelle und ergänze eine Spalte für die kumulierte Häufigkeit, bevor du eine Summenkurve zeichnest. Lies dann den Median und ein Perzentil aus dem Diagramm ab und vergleiche sie mit der Schätzung aus der Tabelle.
Wenn du noch eine zusätzliche Kontrolle möchtest, versuche deine eigene Version mit und frage dich, in welche Klassen der -te, -te und -te Wert fallen würden. Das ist eine einfache Möglichkeit, die Idee wirklich zu verinnerlichen.
Brauchst du Hilfe bei einer Aufgabe?
Lade deine Frage hoch und erhalte in Sekunden eine verifizierte Schritt-für-Schritt-Lösung.
GPAI Solver öffnen →