Wykres pudełkowy pokazuje położenie środka, rozrzut i możliwą skośność zbioru danych na pierwszy rzut oka. Jest tworzony na podstawie podsumowania pięcioliczbowego: minimum, pierwszy kwartyl Q1Q_1, mediana, trzeci kwartyl Q3Q_3 i maksimum. Jeśli na lekcji lub w używanym programie stosuje się regułę 1.5×IQR1.5 \times IQR, „wąsy” mogą kończyć się na najbardziej skrajnych wartościach nieodstających zamiast na bezwzględnym minimum i maksimum.

Pudełko rozciąga się od Q1Q_1 do Q3Q_3, więc zawiera środkowe 50%50\% danych. Linia wewnątrz pudełka oznacza medianę. Wąsy pokazują, jak daleko dane sięgają poza tę środkową połowę.

Co pokazuje wykres pudełkowy

Wykres pudełkowy pomaga szybko odpowiedzieć na trzy pytania:

  • Gdzie znajduje się środek? Spójrz na medianę.
  • Jak bardzo rozciągnięta jest środkowa połowa danych? Spójrz na szerokość pudełka.
  • Czy oba ogony są zrównoważone? Porównaj oba wąsy.

Szerokość pudełka to rozstęp międzykwartylowy, czyli IQR=Q3Q1IQR = Q_3 - Q_1. Większy IQRIQR oznacza, że środkowa połowa danych jest bardziej rozproszona. Jeśli jeden wąs jest znacznie dłuższy od drugiego, dane mogą być skośne w tym kierunku.

Wiele wykresów pudełkowych używa też reguły 1.5×IQR1.5 \times IQR do zaznaczania możliwych wartości odstających. W tej wersji wąsy kończą się na najbardziej skrajnych wartościach nieodstających. Dlatego dwa poprawne wykresy pudełkowe dla tych samych danych mogą wyglądać nieco inaczej, jeśli stosują różne zasady wyznaczania wąsów.

Przykład: od danych do wykresu pudełkowego

Użyj uporządkowanego zbioru danych

3, 5, 6, 7, 8, 9, 12, 153,\ 5,\ 6,\ 7,\ 8,\ 9,\ 12,\ 15

Jest 88 wartości, więc mediana to średnia z dwóch środkowych wartości:

median=7+82=7.5\text{median} = \frac{7 + 8}{2} = 7.5

Ponieważ liczba punktów danych jest parzysta, podziel listę na dwie równe połowy. Dolna połowa to 3,5,6,73, 5, 6, 7, więc

Q1=5+62=5.5Q_1 = \frac{5 + 6}{2} = 5.5

Górna połowa to 8,9,12,158, 9, 12, 15, więc

Q3=9+122=10.5Q_3 = \frac{9 + 12}{2} = 10.5

Daje to podsumowanie pięcioliczbowe:

min=3,Q1=5.5,median=7.5,Q3=10.5,max=15\text{min} = 3,\quad Q_1 = 5.5,\quad \text{median} = 7.5,\quad Q_3 = 10.5,\quad \text{max} = 15

Teraz oblicz rozstęp międzykwartylowy:

IQR=Q3Q1=10.55.5=5IQR = Q_3 - Q_1 = 10.5 - 5.5 = 5

Jeśli użyjesz popularnej reguły wartości odstających 1.5×IQR1.5 \times IQR, granice wynoszą

Q11.5(IQR)=5.57.5=2Q_1 - 1.5(IQR) = 5.5 - 7.5 = -2

oraz

Q3+1.5(IQR)=10.5+7.5=18Q_3 + 1.5(IQR) = 10.5 + 7.5 = 18

Wszystkie wartości danych mieszczą się między 2-2 a 1818, więc według tej reguły nie ma możliwych wartości odstających. Dla tego zbioru danych pudełko rozciągałoby się od 5.55.5 do 10.510.5, linia mediany byłaby na poziomie 7.57.5, a wąsy sięgałyby do 33 i 1515.

Jak szybko odczytać wykres pudełkowy

Zacznij od linii mediany. To ona pokazuje, gdzie znajduje się środek danych.

Następnie porównaj szerokość pudełka i długości wąsów. Pudełko pokazuje, gdzie leży środkowe 50%50\% wartości, a wąsy pokazują, jak daleko ogony sięgają poza ten obszar.

Na końcu zwróć uwagę na asymetrię. Jeśli mediana nie leży pośrodku pudełka albo jeden wąs jest znacznie dłuższy od drugiego, rozkład może nie być zrównoważony wokół środka.

Typowe błędy przy wykresach pudełkowych

Jednym z częstych błędów jest odczytywanie krawędzi pudełka jako minimum i maksimum. Zwykle oznaczają one Q1Q_1 i Q3Q_3, a nie końce całego zbioru danych.

Innym błędem jest zakładanie, że każdy wykres pudełkowy używa tej samej zasady wyznaczania wąsów. Niektóre wąsy sięgają do minimum i maksimum. Inne kończą się na najbardziej skrajnych wartościach nieodstających.

Łatwo też zapomnieć, że kwartyle zależą od uporządkowanych danych. Jeśli wartości nie zostaną najpierw posortowane, kwartyle i mediana będą błędne.

Kiedy wykresy pudełkowe są przydatne

Wykresy pudełkowe są przydatne, gdy chcesz szybko podsumować rozkład zamiast analizować pełną listę wartości. Są często używane na lekcjach statystyki, w podsumowaniach eksperymentów, kontroli jakości i porównaniach między grupami.

Są szczególnie pomocne wtedy, gdy znaczenie mają wartości odstające lub skośność, ponieważ mediana i kwartyle są zwykle bardziej stabilne niż sama średnia.

Wypróbuj podobny zbiór danych

Weź krótki, posortowany zbiór danych, zapisz jego podsumowanie pięcioliczbowe i naszkicuj pudełko, zanim zaczniesz przejmować się wartościami odstającymi. Jeśli chcesz sprawdzić swoje kwartyle i medianę na podobnym zadaniu ze statystyki, wypróbuj własną wersję w solverze po samodzielnym ułożeniu uporządkowanej listy.

Potrzebujesz pomocy z zadaniem?

Prześlij pytanie i otrzymaj zweryfikowane rozwiązanie krok po kroku w kilka sekund.

Otwórz GPAI Solver →