Rozkład częstości to tabela lub wykres pokazujący, jak często każda wartość, kategoria albo przedział pojawia się w zbiorze danych. Jeśli danych jest dużo, zbliżone wartości często grupuje się w przedziały klasowe, a liczba elementów w każdym przedziale to częstość.

Jest to pomocne, ponieważ surowe dane często trudno szybko przejrzeć. Rozkład częstości szybko uwidacznia wzorzec: gdzie wartości się skupiają, gdzie występują rzadziej i które wyniki są najczęstsze.

Tabela rozkładu częstości a tabela grupowana

Dla danych niegrupowanych tabela może wypisywać każdą wartość osobno. Jeśli wyniki to 4,5,5,6,6,64, 5, 5, 6, 6, 6, to częstość wartości 66 wynosi 33, ponieważ pojawia się trzy razy.

W większych zbiorach danych liczbowych dokładne wartości często grupuje się w przedziały, takie jak 4040-4949, 5050-5959 i 6060-6969. Taka wersja nazywa się grupowanym rozkładem częstości.

Jak działają przedziały klasowe

Przedział klasowy to zakres używany do zebrania zbliżonych wartości w jedną grupę. W dobrze zbudowanej tabeli grupowanej każda obserwacja należy dokładnie do jednej klasy, a klasy nie nakładają się na siebie.

Jeśli używasz przedziałów takich jak 1010-1919, 2020-2929 i 3030-3939, to wartość taka jak 2424 należy dokładnie do jednej klasy. Ta jasna zasada ma znaczenie. Jeśli granice klas nakładają się na siebie, tabela staje się niejednoznaczna.

Szerokość klasy to rozmiar każdego przedziału. Jeśli klasy to 1010-1919, 2020-2929 i 3030-3939, szerokość jest stała. Ma to znaczenie przy rysowaniu histogramu: bezpośrednie porównywanie wysokości słupków jest poprawne tylko wtedy, gdy szerokości klas są równe.

Przykład: odczytywanie rozkładu częstości

Załóżmy, że nauczyciel zapisuje wyniki kartkówki 2020 uczniów i grupuje je w przedziały:

Przedział wyników Częstość
00-99 22
1010-1919 55
2020-2929 88
3030-3939 44
4040-4949 11

Przedział 2020-2929 ma największą częstość, więc jest to najczęstszy zakres wyników. Nie oznacza to, że każdy uczeń uzyskał tę samą liczbę punktów. Oznacza to, że 88 uczniów uzyskało wynik mieszczący się w tym przedziale.

Częstości sumują się też do łącznej liczby uczniów:

2+5+8+4+1=202 + 5 + 8 + 4 + 1 = 20

Jeśli chcesz otrzymać udział zamiast liczby, użyj częstości względnej:

relative frequency=frequencytotal number of observations\text{relative frequency} = \frac{\text{frequency}}{\text{total number of observations}}

Dla przedziału 2020-2929 częstość względna wynosi:

820=0.4\frac{8}{20} = 0.4

Zatem 40%40\% uczniów uzyskało wynik między 2020 a 2929.

Wykresy rozkładu częstości: wykres słupkowy czy histogram?

Rozkład częstości można przedstawić jako tabelę, wykres słupkowy albo histogram. Właściwy wykres zależy od rodzaju danych.

Użyj wykresu słupkowego, gdy zliczasz oddzielne kategorie, takie jak ulubione owoce albo środki transportu. Słupki są rozdzielone, ponieważ kategorie są odrębne.

Użyj histogramu, gdy grupujesz dane liczbowe w przedziały. Słupki stykają się ze sobą, ponieważ przedziały reprezentują skalę ciągłą.

Jeśli wszystkie przedziały klasowe mają tę samą szerokość, wyższe słupki histogramu oznaczają większe częstości. Jeśli szerokości klas są różne, sama wysokość może wprowadzać w błąd. W takim przypadku histogram powinien używać gęstości częstości, tak aby częstość była reprezentowana przez pole słupka, a nie tylko jego wysokość.

Częste błędy w tabelach rozkładu częstości

Mylenie kategorii i przedziałów

Wykres słupkowy dla kategorii i histogram dla pogrupowanych danych liczbowych nie oznaczają tego samego. Użycie niewłaściwego wykresu może ukryć strukturę danych.

Nakładające się klasy

Przedziały muszą mieć jasną zasadę przypisania. Układ taki jak 00-1010 i 1010-2020 jest problematyczny, chyba że dokładnie określisz, do którego przedziału należy wartość 1010.

Zapominanie, że grupowanie ukrywa szczegóły

Grupowany rozkład częstości podsumowuje dane, ale nie zachowuje każdej pierwotnej wartości. Gdy wyniki są zebrane w przedziały, łatwiej dostrzec wzorzec, ale traci się część dokładności.

Porównywanie nierównych słupków tak, jakby były równe

Jeśli jeden przedział klasowy jest dwa razy szerszy od innego, histogramu nie należy odczytywać tak samo jak histogramu o równych szerokościach klas. Ten warunek ma znaczenie: klasy o równej szerokości pozwalają bezpośrednio porównywać wysokości, a klasy o nierównej szerokości już nie.

Kiedy stosuje się rozkłady częstości

Rozkłady częstości są powszechne w statystyce, w szkole, w badaniach ankietowych, kontroli jakości i pracy laboratoryjnej. Są najbardziej przydatne wtedy, gdy surowa lista danych jest na tyle długa, że szybkie przejrzenie nie pokazuje już wyraźnie wzorca.

Są też punktem wyjścia do powiązanych pojęć, takich jak histogramy, częstość skumulowana, średnie dla danych grupowanych i oszacowania rozproszenia.

Spróbuj podobnego zadania

Weź od 1515 do 2020 liczb z karty pracy, doświadczenia albo listy wyników. Najpierw ułóż tabelę częstości dla danych niegrupowanych, a potem pogrupuj te same dane w przedziały klasowe. Porównanie tych dwóch wersji to jeden z najszybszych sposobów, by zobaczyć, co rozkład częstości pomaga zauważyć i jakie szczegóły ukrywa grupowanie.

Potrzebujesz pomocy z zadaniem?

Prześlij pytanie i otrzymaj zweryfikowane rozwiązanie krok po kroku w kilka sekund.

Otwórz GPAI Solver →