Wykres pudełkowy, nazywany też wykresem ramka-wąsy, pokazuje, gdzie znajduje się środek zbioru danych i jak bardzo dane są rozproszone. Wyróżnia medianę, środkowe 50%50\% danych oraz wartości blisko krańców, dzięki czemu można szybko odczytać ogólny kształt rozkładu.

Najważniejsze punkty to pierwszy kwartyl Q1Q_1, mediana, trzeci kwartyl Q3Q_3 oraz rozstęp międzykwartylowy IQR=Q3Q1IQR = Q_3 - Q_1. Od razu trzeba pamiętać o jednej rzeczy: kwartyle nie są wyznaczane według jednej uniwersalnej reguły. Jeśli na lekcji, w podręczniku lub w programie używa się konkretnej metody wyznaczania kwartylów, stosuj ją konsekwentnie od początku do końca.

Co pokazuje wykres pudełkowy na pierwszy rzut oka

Pudełko rozciąga się od Q1Q_1 do Q3Q_3, więc zawiera środkowe 50%50\% danych. Linia wewnątrz pudełka oznacza medianę.

Wąsy pokazują, jak daleko dane sięgają poza pudełko. Na niektórych wykresach pudełkowych dochodzą do minimum i maksimum. Na innych kończą się na najbardziej skrajnych wartościach, które nie są traktowane jako wartości odstające. Zanim zinterpretujesz wąsy, musisz znać tę regułę.

Jak działają kwartyle i IQR

Rozstęp międzykwartylowy mierzy rozproszenie środkowej połowy danych:

IQR=Q3Q1IQR = Q_3 - Q_1

Większy IQRIQR oznacza, że środkowa połowa danych jest bardziej rozciągnięta. Mniejszy IQRIQR oznacza, że jest bardziej skupiona.

Jak narysować wykres pudełkowy krok po kroku

Za każdym razem stosuj tę samą kolejność:

  1. Uporządkuj dane od najmniejszej do największej wartości.
  2. Wyznacz medianę.
  3. Wyznacz Q1Q_1 i Q3Q_3 zgodnie z metodą kwartylową, której masz użyć.
  4. Narysuj oś liczbową i zaznacz Q1Q_1, medianę oraz Q3Q_3.
  5. Narysuj pudełko od Q1Q_1 do Q3Q_3 i linię mediany w jego wnętrzu.
  6. Dodaj wąsy zgodnie z regułą wymaganą na zajęciach lub przez używane oprogramowanie.

Przykład: wyznaczanie kwartylów do wykresu pudełkowego

Zacznij od uporządkowanego zbioru danych

2, 4, 5, 7, 8, 9, 12, 15, 182,\ 4,\ 5,\ 7,\ 8,\ 9,\ 12,\ 15,\ 18

Jest tu 99 wartości, więc mediana to piąta wartość:

median=8\text{median} = 8

W tym przykładzie użyjemy często spotykanej szkolnej reguły, według której przy wyznaczaniu dolnej i górnej połowy pomija się medianę całego zbioru.

Dolna połowa to

2, 4, 5, 72,\ 4,\ 5,\ 7

więc

Q1=4+52=4.5Q_1 = \frac{4 + 5}{2} = 4.5

Górna połowa to

9, 12, 15, 189,\ 12,\ 15,\ 18

więc

Q3=12+152=13.5Q_3 = \frac{12 + 15}{2} = 13.5

Teraz wyznacz rozstęp międzykwartylowy:

IQR=13.54.5=9IQR = 13.5 - 4.5 = 9

Daje to kluczowe wartości potrzebne do narysowania pudełka:

Q1=4.5,median=8,Q3=13.5Q_1 = 4.5,\quad \text{median} = 8,\quad Q_3 = 13.5

Jeśli wąsy sięgają do minimum i maksimum, dochodzą do 22 i 1818. Zatem pudełko rozciąga się od 4.54.5 do 13.513.5, linia mediany znajduje się przy 88, a cały wykres biegnie od 22 do 1818.

Jak szybko odczytać wykres pudełkowy

Zacznij od mediany, aby znaleźć środek danych.

Następnie sprawdź szerokość pudełka. Wąskie pudełko oznacza, że środkowa połowa danych jest skupiona. Szerokie pudełko oznacza większe rozproszenie.

Na końcu porównaj długość wąsów i położenie mediany wewnątrz pudełka. Jeśli jedna strona jest wyraźnie dłuższa, rozkład może być bardziej rozciągnięty po tej stronie.

Typowe błędy przy wykresach pudełkowych

Nie pomijaj porządkowania danych. Jeśli dane nie są ułożone rosnąco, mediana i kwartyle będą wyznaczone błędnie.

Nie zakładaj, że każdy wykres pudełkowy używa tej samej reguły dla kwartylów albo tej samej reguły dla wąsów. Dwa poprawne wykresy mogą wyglądać inaczej, jeśli zostały zbudowane według różnych konwencji.

Nie odczytuj krawędzi pudełka jako minimum i maksimum. Zwykle oznaczają one odpowiednio Q1Q_1 i Q3Q_3.

Nie zakładaj, że szersze pudełko oznacza „więcej danych” w tym obszarze. Oznacza ono, że wartości obejmują tam szerszy przedział na osi liczbowej.

Kiedy wykresy pudełkowe są przydatne

Wykresy pudełkowe są przydatne, gdy chcesz szybko zobaczyć położenie środka i rozproszenie danych bez wypisywania każdej wartości. Są szczególnie pomocne przy porównywaniu dwóch lub większej liczby grup obok siebie.

Często pojawiają się na lekcjach statystyki, w raportach laboratoryjnych i wszędzie tam, gdzie mediana oraz środkowa połowa danych są ważniejsze niż szczegółowa lista wszystkich wartości.

Spróbuj samodzielnie

Weź krótki, uporządkowany zbiór danych, wyznacz pięcioliczbowe podsumowanie i naszkicuj wykres pudełkowy ręcznie. Następnie porównaj go z wynikiem z narzędzia do tworzenia wykresów, aby sprawdzić, czy użyta reguła dla kwartylów i wąsów daje ten sam rezultat.

Potrzebujesz pomocy z zadaniem?

Prześlij pytanie i otrzymaj zweryfikowane rozwiązanie krok po kroku w kilka sekund.

Otwórz GPAI Solver →