Rozkład częstości to tabela lub wykres pokazujący, jak często każda wartość, kategoria albo przedział pojawia się w zbiorze danych. Jeśli danych jest dużo, zbliżone wartości często grupuje się w przedziały klasowe, a liczba elementów w każdym przedziale to częstość.
Jest to pomocne, ponieważ surowe dane często trudno szybko przejrzeć. Rozkład częstości szybko uwidacznia wzorzec: gdzie wartości się skupiają, gdzie występują rzadziej i które wyniki są najczęstsze.
Tabela rozkładu częstości a tabela grupowana
Dla danych niegrupowanych tabela może wypisywać każdą wartość osobno. Jeśli wyniki to , to częstość wartości wynosi , ponieważ pojawia się trzy razy.
W większych zbiorach danych liczbowych dokładne wartości często grupuje się w przedziały, takie jak -, - i -. Taka wersja nazywa się grupowanym rozkładem częstości.
Jak działają przedziały klasowe
Przedział klasowy to zakres używany do zebrania zbliżonych wartości w jedną grupę. W dobrze zbudowanej tabeli grupowanej każda obserwacja należy dokładnie do jednej klasy, a klasy nie nakładają się na siebie.
Jeśli używasz przedziałów takich jak -, - i -, to wartość taka jak należy dokładnie do jednej klasy. Ta jasna zasada ma znaczenie. Jeśli granice klas nakładają się na siebie, tabela staje się niejednoznaczna.
Szerokość klasy to rozmiar każdego przedziału. Jeśli klasy to -, - i -, szerokość jest stała. Ma to znaczenie przy rysowaniu histogramu: bezpośrednie porównywanie wysokości słupków jest poprawne tylko wtedy, gdy szerokości klas są równe.
Przykład: odczytywanie rozkładu częstości
Załóżmy, że nauczyciel zapisuje wyniki kartkówki uczniów i grupuje je w przedziały:
| Przedział wyników | Częstość |
|---|---|
| - | |
| - | |
| - | |
| - | |
| - |
Przedział - ma największą częstość, więc jest to najczęstszy zakres wyników. Nie oznacza to, że każdy uczeń uzyskał tę samą liczbę punktów. Oznacza to, że uczniów uzyskało wynik mieszczący się w tym przedziale.
Częstości sumują się też do łącznej liczby uczniów:
Jeśli chcesz otrzymać udział zamiast liczby, użyj częstości względnej:
Dla przedziału - częstość względna wynosi:
Zatem uczniów uzyskało wynik między a .
Wykresy rozkładu częstości: wykres słupkowy czy histogram?
Rozkład częstości można przedstawić jako tabelę, wykres słupkowy albo histogram. Właściwy wykres zależy od rodzaju danych.
Użyj wykresu słupkowego, gdy zliczasz oddzielne kategorie, takie jak ulubione owoce albo środki transportu. Słupki są rozdzielone, ponieważ kategorie są odrębne.
Użyj histogramu, gdy grupujesz dane liczbowe w przedziały. Słupki stykają się ze sobą, ponieważ przedziały reprezentują skalę ciągłą.
Jeśli wszystkie przedziały klasowe mają tę samą szerokość, wyższe słupki histogramu oznaczają większe częstości. Jeśli szerokości klas są różne, sama wysokość może wprowadzać w błąd. W takim przypadku histogram powinien używać gęstości częstości, tak aby częstość była reprezentowana przez pole słupka, a nie tylko jego wysokość.
Częste błędy w tabelach rozkładu częstości
Mylenie kategorii i przedziałów
Wykres słupkowy dla kategorii i histogram dla pogrupowanych danych liczbowych nie oznaczają tego samego. Użycie niewłaściwego wykresu może ukryć strukturę danych.
Nakładające się klasy
Przedziały muszą mieć jasną zasadę przypisania. Układ taki jak - i - jest problematyczny, chyba że dokładnie określisz, do którego przedziału należy wartość .
Zapominanie, że grupowanie ukrywa szczegóły
Grupowany rozkład częstości podsumowuje dane, ale nie zachowuje każdej pierwotnej wartości. Gdy wyniki są zebrane w przedziały, łatwiej dostrzec wzorzec, ale traci się część dokładności.
Porównywanie nierównych słupków tak, jakby były równe
Jeśli jeden przedział klasowy jest dwa razy szerszy od innego, histogramu nie należy odczytywać tak samo jak histogramu o równych szerokościach klas. Ten warunek ma znaczenie: klasy o równej szerokości pozwalają bezpośrednio porównywać wysokości, a klasy o nierównej szerokości już nie.
Kiedy stosuje się rozkłady częstości
Rozkłady częstości są powszechne w statystyce, w szkole, w badaniach ankietowych, kontroli jakości i pracy laboratoryjnej. Są najbardziej przydatne wtedy, gdy surowa lista danych jest na tyle długa, że szybkie przejrzenie nie pokazuje już wyraźnie wzorca.
Są też punktem wyjścia do powiązanych pojęć, takich jak histogramy, częstość skumulowana, średnie dla danych grupowanych i oszacowania rozproszenia.
Spróbuj podobnego zadania
Weź od do liczb z karty pracy, doświadczenia albo listy wyników. Najpierw ułóż tabelę częstości dla danych niegrupowanych, a potem pogrupuj te same dane w przedziały klasowe. Porównanie tych dwóch wersji to jeden z najszybszych sposobów, by zobaczyć, co rozkład częstości pomaga zauważyć i jakie szczegóły ukrywa grupowanie.
Potrzebujesz pomocy z zadaniem?
Prześlij pytanie i otrzymaj zweryfikowane rozwiązanie krok po kroku w kilka sekund.
Otwórz GPAI Solver →