Ein Boxplot, auch Box-and-Whisker-Plot genannt, zeigt, wo ein Datensatz zentriert ist und wie stark er gestreut ist. Er hebt den Median, die mittleren 50%50\% der Daten und die Werte an den Rändern hervor, sodass du die Gesamtform schnell erkennen kannst.

Die wichtigsten Kennwerte sind das erste Quartil Q1Q_1, der Median, das dritte Quartil Q3Q_3 und der Interquartilsabstand IQR=Q3Q1IQR = Q_3 - Q_1. Eine Bedingung ist dabei sofort wichtig: Quartile sind nicht durch eine einzige universelle Regel festgelegt. Wenn deine Klasse, dein Lehrbuch oder deine Software eine bestimmte Quartilsmethode verwendet, dann bleibe von Anfang bis Ende bei genau dieser Methode.

Was ein Boxplot auf einen Blick zeigt

Die Box reicht von Q1Q_1 bis Q3Q_3 und enthält damit die mittleren 50%50\% der Daten. Die Linie in der Box ist der Median.

Die Whisker zeigen, wie weit die Daten über die Box hinaus reichen. In manchen Boxplots gehen sie bis zum Minimum und Maximum. In anderen enden sie bei den äußersten Werten, die nicht als Ausreißer behandelt werden. Du musst diese Regel kennen, bevor du entscheidest, was die Whisker bedeuten.

Wie Quartile und IQR funktionieren

Der Interquartilsabstand misst die Streuung der mittleren Hälfte der Daten:

IQR=Q3Q1IQR = Q_3 - Q_1

Ein größerer IQRIQR bedeutet, dass die mittlere Hälfte stärker gestreut ist. Ein kleinerer IQRIQR bedeutet, dass sie enger beieinanderliegt.

So zeichnest du einen Boxplot Schritt für Schritt

Verwende jedes Mal dieselbe Reihenfolge:

  1. Sortiere die Daten vom kleinsten zum größten Wert.
  2. Bestimme den Median.
  3. Bestimme Q1Q_1 und Q3Q_3 mit der Quartilsregel, die du verwenden sollst.
  4. Zeichne eine Zahlengerade und markiere Q1Q_1, den Median und Q3Q_3.
  5. Zeichne die Box von Q1Q_1 bis Q3Q_3 und die Medianlinie hinein.
  6. Ergänze die Whisker nach der Regel, die in deinem Unterricht oder in deiner Software verwendet wird.

Durchgerechnetes Beispiel: Quartile für einen Boxplot bestimmen

Beginne mit dem geordneten Datensatz

2, 4, 5, 7, 8, 9, 12, 15, 182,\ 4,\ 5,\ 7,\ 8,\ 9,\ 12,\ 15,\ 18

Es gibt 99 Werte, also ist der Median der fünfte Wert:

median=8\text{median} = 8

Für dieses Beispiel verwenden wir die in der Schule häufige Regel, bei der der Gesamtmedian beim Bestimmen der unteren und oberen Hälfte ausgeschlossen wird.

Die untere Hälfte ist

2, 4, 5, 72,\ 4,\ 5,\ 7

also gilt

Q1=4+52=4.5Q_1 = \frac{4 + 5}{2} = 4.5

Die obere Hälfte ist

9, 12, 15, 189,\ 12,\ 15,\ 18

also gilt

Q3=12+152=13.5Q_3 = \frac{12 + 15}{2} = 13.5

Nun bestimmen wir den Interquartilsabstand:

IQR=13.54.5=9IQR = 13.5 - 4.5 = 9

Damit erhältst du die wichtigsten Markierungen für die Box:

Q1=4.5,median=8,Q3=13.5Q_1 = 4.5,\quad \text{median} = 8,\quad Q_3 = 13.5

Wenn die Whisker bis zum Minimum und Maximum reichen, dann gehen sie bis 22 und 1818. Die Box reicht also von 4.54.5 bis 13.513.5, die Medianlinie liegt bei 88, und der gesamte Plot reicht von 22 bis 1818.

So liest du einen Boxplot schnell

Beginne mit dem Median, um die Mitte der Daten zu finden.

Prüfe dann die Breite der Box. Eine schmale Box bedeutet, dass die mittlere Hälfte eng beieinanderliegt. Eine breite Box bedeutet, dass sie stärker gestreut ist.

Vergleiche zum Schluss die Whisker und die Lage des Medians innerhalb der Box. Wenn eine Seite deutlich länger ist, kann die Verteilung auf dieser Seite stärker gestreckt sein.

Häufige Fehler bei Boxplots

Überspringe nicht das Sortieren. Wenn die Daten nicht geordnet sind, sind Median und Quartile falsch.

Gehe nicht davon aus, dass jeder Boxplot dieselbe Quartilsregel oder dieselbe Whisker-Regel verwendet. Zwei korrekte Plots können unterschiedlich aussehen, wenn sie mit verschiedenen Konventionen erstellt wurden.

Lies die Ränder der Box nicht als Minimum und Maximum. Meist markieren sie stattdessen Q1Q_1 und Q3Q_3.

Gehe nicht davon aus, dass eine breitere Box in diesem Bereich „mehr Daten“ bedeutet. Sie bedeutet, dass die Werte dort ein größeres Intervall auf der Zahlengeraden abdecken.

Wann Boxplots nützlich sind

Boxplots sind nützlich, wenn du schnell einen Überblick über Lage und Streuung bekommen möchtest, ohne jeden einzelnen Wert aufzulisten. Besonders hilfreich sind sie, wenn du zwei oder mehr Gruppen nebeneinander vergleichen willst.

Sie sind üblich im Statistikunterricht, in Laborberichten und in allen Situationen, in denen der Median und die mittlere Hälfte der Daten wichtiger sind als eine detaillierte Liste aller Werte.

Probiere deine eigene Version aus

Nimm einen kurzen sortierten Datensatz, bestimme die Fünf-Punkte-Zusammenfassung und skizziere den Boxplot von Hand. Vergleiche ihn dann mit einem Grafikwerkzeug, um zu prüfen, ob deine Quartilsregel und deine Whisker-Regel zum Ergebnis passen.

Brauchst du Hilfe bei einer Aufgabe?

Lade deine Frage hoch und erhalte in Sekunden eine verifizierte Schritt-für-Schritt-Lösung.

GPAI Solver öffnen →