Ein Boxplot zeigt auf einen Blick die Lage, Streuung und mögliche Schiefe eines Datensatzes. Er basiert auf der Fünf-Punkte-Zusammenfassung: Minimum, erstes Quartil Q1Q_1, Median, drittes Quartil Q3Q_3 und Maximum. Wenn in deinem Unterricht oder in deiner Software die Regel 1.5×IQR1.5 \times IQR verwendet wird, enden die Whisker möglicherweise bei den äußersten Werten, die keine Ausreißer sind, statt beim absoluten Minimum und Maximum.

Die Box reicht von Q1Q_1 bis Q3Q_3 und enthält damit die mittleren 50%50\% der Daten. Die Linie in der Box ist der Median. Die Whisker zeigen, wie weit sich die Daten über diese mittlere Hälfte hinaus erstrecken.

Was ein Box-Whisker-Diagramm zeigt

Ein Boxplot hilft dir, drei schnelle Fragen zu beantworten:

  • Wo liegt die Mitte? Schau auf den Median.
  • Wie stark ist die mittlere Hälfte gestreut? Schau auf die Breite der Box.
  • Sind die Enden ausgeglichen? Vergleiche die beiden Whisker.

Die Breite der Box ist der Interquartilsabstand, also IQR=Q3Q1IQR = Q_3 - Q_1. Ein größerer IQRIQR bedeutet, dass die mittlere Hälfte der Daten stärker gestreut ist. Wenn ein Whisker deutlich länger ist als der andere, können die Daten in diese Richtung schief verteilt sein.

Viele Boxplots verwenden auch die Regel 1.5×IQR1.5 \times IQR, um mögliche Ausreißer zu markieren. In dieser Version enden die Whisker bei den äußersten Werten, die keine Ausreißer sind. Deshalb können zwei korrekte Boxplots für dieselben Daten leicht unterschiedlich aussehen, wenn sie verschiedene Whisker-Regeln verwenden.

Durchgerechnetes Beispiel vom Datensatz zum Boxplot

Verwende den geordneten Datensatz

3, 5, 6, 7, 8, 9, 12, 153,\ 5,\ 6,\ 7,\ 8,\ 9,\ 12,\ 15

Es gibt 88 Werte, also ist der Median der Mittelwert der beiden mittleren Werte:

median=7+82=7.5\text{median} = \frac{7 + 8}{2} = 7.5

Da es eine gerade Anzahl von Datenpunkten gibt, teilst du die Liste in zwei gleich große Hälften. Die untere Hälfte ist 3,5,6,73, 5, 6, 7, also gilt

Q1=5+62=5.5Q_1 = \frac{5 + 6}{2} = 5.5

Die obere Hälfte ist 8,9,12,158, 9, 12, 15, also gilt

Q3=9+122=10.5Q_3 = \frac{9 + 12}{2} = 10.5

Damit erhältst du die Fünf-Punkte-Zusammenfassung:

min=3,Q1=5.5,median=7.5,Q3=10.5,max=15\text{min} = 3,\quad Q_1 = 5.5,\quad \text{median} = 7.5,\quad Q_3 = 10.5,\quad \text{max} = 15

Berechne nun den Interquartilsabstand:

IQR=Q3Q1=10.55.5=5IQR = Q_3 - Q_1 = 10.5 - 5.5 = 5

Wenn du die übliche Ausreißerregel 1.5×IQR1.5 \times IQR verwendest, sind die Grenzen

Q11.5(IQR)=5.57.5=2Q_1 - 1.5(IQR) = 5.5 - 7.5 = -2

und

Q3+1.5(IQR)=10.5+7.5=18Q_3 + 1.5(IQR) = 10.5 + 7.5 = 18

Alle Datenwerte liegen zwischen 2-2 und 1818, also gibt es nach dieser Regel keine möglichen Ausreißer. Für diesen Datensatz würde die Box von 5.55.5 bis 10.510.5 reichen, die Medianlinie läge bei 7.57.5, und die Whisker würden bis 33 und 1515 reichen.

Wie man einen Boxplot schnell liest

Beginne mit der Medianlinie. Sie zeigt dir, wo das Zentrum der Daten liegt.

Vergleiche dann die Breite der Box und die Längen der Whisker. Die Box zeigt, wo die mittleren 50%50\% der Werte liegen, während die Whisker zeigen, wie weit sich die Enden über diesen Bereich hinaus erstrecken.

Achte zum Schluss auf Asymmetrie. Wenn der Median innerhalb der Box nicht mittig liegt oder ein Whisker deutlich länger ist als der andere, ist die Verteilung um die Mitte möglicherweise nicht ausgeglichen.

Häufige Fehler bei Box-Whisker-Diagrammen

Ein häufiger Fehler ist, die Ränder der Box als Minimum und Maximum zu lesen. Sie stehen normalerweise für Q1Q_1 und Q3Q_3, nicht für die Endpunkte des gesamten Datensatzes.

Ein weiterer Fehler ist die Annahme, dass jeder Boxplot dieselbe Whisker-Regel verwendet. Manche Whisker reichen bis zum Minimum und Maximum. Andere enden bei den äußersten Werten, die keine Ausreißer sind.

Man vergisst auch leicht, dass Quartile von geordneten Daten abhängen. Wenn die Werte nicht zuerst sortiert werden, sind Quartile und Median falsch.

Wann Boxplots nützlich sind

Box-Whisker-Diagramme sind nützlich, wenn du eine schnelle Zusammenfassung einer Verteilung statt einer vollständigen Werteliste möchtest. Sie sind in Statistikunterricht, Versuchsübersichten, Qualitätskontrolle und beim Vergleich von Gruppen üblich.

Sie sind besonders hilfreich, wenn Ausreißer oder Schiefe wichtig sind, weil Median und Quartile meist stabiler sind als der Mittelwert allein.

Probiere einen ähnlichen Datensatz aus

Nimm einen kurzen sortierten Datensatz, notiere seine Fünf-Punkte-Zusammenfassung und skizziere die Box, bevor du dich um Ausreißer kümmerst. Wenn du deine Quartile und deinen Median bei einer ähnlichen Statistikaufgabe überprüfen möchtest, probiere deine eigene Version in einem Solver aus, nachdem du die geordnete Liste selbst aufgestellt hast.

Brauchst du Hilfe bei einer Aufgabe?

Lade deine Frage hoch und erhalte in Sekunden eine verifizierte Schritt-für-Schritt-Lösung.

GPAI Solver öffnen →