Częstość skumulowana to suma narastająca w tabeli częstości. Pokazuje, ile obserwacji znajduje się na danej wartości lub poniżej niej albo do danej granicy klasy, dlatego jest przydatna przy wyznaczaniu mediany, kwartylów i percentyli.
Ogiva to wykres tej sumy narastającej. Gdy umiesz odczytywać razem tabelę i wykres, zadania z danymi pogrupowanymi stają się dużo łatwiejsze.
Definicja częstości skumulowanej
Jeśli częstości klas wynoszą , to częstość skumulowana do klasy wynosi
Każdy wiersz dodaje do sumy jeszcze jedną klasę. Jeśli częstość skumulowana wynosi na końcu pewnej klasy, to obserwacji znajduje się w tej klasie lub poniżej niej.
Dla danych niepogrupowanych częstość skumulowana jest po prostu liczbą narastającą. Dla danych pogrupowanych jest to liczba narastająca według przedziałów klasowych.
Jak ogiva pomaga odczytywać percentyle
Ogiva przedstawia częstość skumulowaną względem granic klas. Dla pogrupowanych danych ciągłych zwykle zaznacza się:
- górną granicę klasy na osi poziomej
- częstość skumulowaną na osi pionowej
Następnie łączy się punkty gładką linią albo linią odcinkową. Krzywa rośnie, ponieważ częstość skumulowana nigdy nie maleje.
Główne zastosowanie ogivy to odczytywanie pozycji w uporządkowanym zbiorze danych. Jeśli łączna częstość wynosi , to:
- mediana jest w przybliżeniu -tą wartością
- pierwszy kwartyl jest w przybliżeniu -tą wartością
- trzeci kwartyl jest w przybliżeniu -tą wartością
- -ty percentyl jest w przybliżeniu -tą wartością
Na wykresie zaczynasz od tej pozycji na osi pionowej, przesuwasz się poziomo do ogivy, a potem schodzisz w dół do osi poziomej, aby oszacować wartość.
Przykład: mediana i 75. percentyl
Załóżmy, że wyniki testu dla uczniów są pogrupowane tak:
| Wynik | Częstość | Częstość skumulowana |
|---|---|---|
| 0-10 | ||
| 10-20 | ||
| 20-30 | ||
| 30-40 | ||
| 40-50 | ||
| 50-60 |
Łączna częstość wynosi .
Wyznacz medianę z tabeli
Mediana to -ta wartość.
Spójrz na częstości skumulowane:
- do 20-30 suma wynosi
- do 30-40 suma wynosi
Zatem -ta wartość leży w klasie -.
Jeśli chcesz uzyskać oszacowanie dla danych pogrupowanych, użyj interpolacji tylko wtedy, gdy rozsądnie jest przyjąć, że wartości są dość równomiernie rozłożone w tej klasie. Wtedy
Tutaj:
- to dolna granica klasy
- to częstość skumulowana przed tą klasą
- to częstość klasy
- to szerokość klasy
Zatem
To oszacowanie nie jest dokładne. Zależy od założenia, że wartości wewnątrz klasy - są rozłożone dość płynnie.
Oszacuj 75. percentyl
-ty percentyl to -ta wartość.
Z częstości skumulowanych:
- do 30-40 suma wynosi
- do 40-50 suma wynosi
Zatem -ta wartość leży w klasie -.
Korzystając z tej samej idei interpolacji,
Na ogivie zaznaczyłbyś na osi częstości skumulowanej, przesunął się poziomo do krzywej, a następnie odczytał w dół około na osi wyników.
Typowe błędy przy częstości skumulowanej
Mylenie częstości z częstością skumulowaną
Częstość mówi, ile obserwacji znajduje się w jednej klasie. Częstość skumulowana mówi, ile obserwacji znajduje się w tej klasie oraz we wszystkich wcześniejszych klasach razem.
Użycie złej pozycji
Dla mediany lub percentyla pozycja wynika z łącznej częstości . Jeśli użyjesz złej sumy, każdy kolejny krok będzie błędny.
Traktowanie oszacowań z danych pogrupowanych jako dokładnych
Ogiva lub interpolacja daje oszacowanie wewnątrz klasy, a nie dokładną oryginalną wartość danych. To oszacowanie zależy od tego, jak dane są rozłożone wewnątrz przedziału.
Zaznaczanie niewłaściwych wartości na osi poziomej
Dla danych pogrupowanych ogivy zwykle rysuje się względem granic klas, zwłaszcza górnych granic klas. Rysowanie względem środków klas zmienia znaczenie wykresu.
Kiedy używa się częstości skumulowanej
Częstości skumulowanej używa się zawsze wtedy, gdy potrzebna jest uporządkowana pozycja w zbiorze danych, a nie tylko liczebności w poszczególnych klasach. Obejmuje to podsumowania wyników egzaminów, rozkłady dochodów, dane z kontroli jakości oraz każdą sytuację, w której percentyle lub mediany są ważniejsze niż liczebności pojedynczych przedziałów.
Jest ona szczególnie przydatna wtedy, gdy surowych danych jest dużo i tabela pogrupowana jest łatwiejsza do odczytania niż długa lista obserwacji.
Spróbuj podobnego zadania z częstością skumulowaną
Weź dowolną małą tabelę pogrupowaną i dodaj kolumnę częstości skumulowanej przed narysowaniem ogivy. Następnie odczytaj medianę i jeden percentyl z wykresu i porównaj je z oszacowaniem z tabeli.
Jeśli chcesz zrobić jeszcze jedno sprawdzenie, spróbuj własnej wersji z i zapytaj, gdzie wypadłyby -ta, -ta i -ta wartość. To prosty sposób, by dobrze utrwalić ten pomysł.
Potrzebujesz pomocy z zadaniem?
Prześlij pytanie i otrzymaj zweryfikowane rozwiązanie krok po kroku w kilka sekund.
Otwórz GPAI Solver →