Wykres pudełkowy pokazuje położenie środka, rozrzut i możliwą skośność zbioru danych na pierwszy rzut oka. Jest tworzony na podstawie podsumowania pięcioliczbowego: minimum, pierwszy kwartyl , mediana, trzeci kwartyl i maksimum. Jeśli na lekcji lub w używanym programie stosuje się regułę , „wąsy” mogą kończyć się na najbardziej skrajnych wartościach nieodstających zamiast na bezwzględnym minimum i maksimum.
Pudełko rozciąga się od do , więc zawiera środkowe danych. Linia wewnątrz pudełka oznacza medianę. Wąsy pokazują, jak daleko dane sięgają poza tę środkową połowę.
Co pokazuje wykres pudełkowy
Wykres pudełkowy pomaga szybko odpowiedzieć na trzy pytania:
- Gdzie znajduje się środek? Spójrz na medianę.
- Jak bardzo rozciągnięta jest środkowa połowa danych? Spójrz na szerokość pudełka.
- Czy oba ogony są zrównoważone? Porównaj oba wąsy.
Szerokość pudełka to rozstęp międzykwartylowy, czyli . Większy oznacza, że środkowa połowa danych jest bardziej rozproszona. Jeśli jeden wąs jest znacznie dłuższy od drugiego, dane mogą być skośne w tym kierunku.
Wiele wykresów pudełkowych używa też reguły do zaznaczania możliwych wartości odstających. W tej wersji wąsy kończą się na najbardziej skrajnych wartościach nieodstających. Dlatego dwa poprawne wykresy pudełkowe dla tych samych danych mogą wyglądać nieco inaczej, jeśli stosują różne zasady wyznaczania wąsów.
Przykład: od danych do wykresu pudełkowego
Użyj uporządkowanego zbioru danych
Jest wartości, więc mediana to średnia z dwóch środkowych wartości:
Ponieważ liczba punktów danych jest parzysta, podziel listę na dwie równe połowy. Dolna połowa to , więc
Górna połowa to , więc
Daje to podsumowanie pięcioliczbowe:
Teraz oblicz rozstęp międzykwartylowy:
Jeśli użyjesz popularnej reguły wartości odstających , granice wynoszą
oraz
Wszystkie wartości danych mieszczą się między a , więc według tej reguły nie ma możliwych wartości odstających. Dla tego zbioru danych pudełko rozciągałoby się od do , linia mediany byłaby na poziomie , a wąsy sięgałyby do i .
Jak szybko odczytać wykres pudełkowy
Zacznij od linii mediany. To ona pokazuje, gdzie znajduje się środek danych.
Następnie porównaj szerokość pudełka i długości wąsów. Pudełko pokazuje, gdzie leży środkowe wartości, a wąsy pokazują, jak daleko ogony sięgają poza ten obszar.
Na końcu zwróć uwagę na asymetrię. Jeśli mediana nie leży pośrodku pudełka albo jeden wąs jest znacznie dłuższy od drugiego, rozkład może nie być zrównoważony wokół środka.
Typowe błędy przy wykresach pudełkowych
Jednym z częstych błędów jest odczytywanie krawędzi pudełka jako minimum i maksimum. Zwykle oznaczają one i , a nie końce całego zbioru danych.
Innym błędem jest zakładanie, że każdy wykres pudełkowy używa tej samej zasady wyznaczania wąsów. Niektóre wąsy sięgają do minimum i maksimum. Inne kończą się na najbardziej skrajnych wartościach nieodstających.
Łatwo też zapomnieć, że kwartyle zależą od uporządkowanych danych. Jeśli wartości nie zostaną najpierw posortowane, kwartyle i mediana będą błędne.
Kiedy wykresy pudełkowe są przydatne
Wykresy pudełkowe są przydatne, gdy chcesz szybko podsumować rozkład zamiast analizować pełną listę wartości. Są często używane na lekcjach statystyki, w podsumowaniach eksperymentów, kontroli jakości i porównaniach między grupami.
Są szczególnie pomocne wtedy, gdy znaczenie mają wartości odstające lub skośność, ponieważ mediana i kwartyle są zwykle bardziej stabilne niż sama średnia.
Wypróbuj podobny zbiór danych
Weź krótki, posortowany zbiór danych, zapisz jego podsumowanie pięcioliczbowe i naszkicuj pudełko, zanim zaczniesz przejmować się wartościami odstającymi. Jeśli chcesz sprawdzić swoje kwartyle i medianę na podobnym zadaniu ze statystyki, wypróbuj własną wersję w solverze po samodzielnym ułożeniu uporządkowanej listy.
Potrzebujesz pomocy z zadaniem?
Prześlij pytanie i otrzymaj zweryfikowane rozwiązanie krok po kroku w kilka sekund.
Otwórz GPAI Solver →