Średnia, mediana i dominanta to trzy sposoby opisywania środka zbioru danych. Średnia to przeciętna, mediana to wartość środkowa po uporządkowaniu danych, a dominanta to wartość występująca najczęściej. Jeśli chcesz prostą zasadę: używaj średniej, gdy dane są dość wyrównane, mediany, gdy wartości odstające mogą zniekształcić wynik, a dominanty, gdy najważniejsza jest wartość pojawiająca się najczęściej.

Te miary mogą dawać różne wyniki, ponieważ każda z nich inaczej definiuje „środek”. I właśnie dlatego są przydatne.

Średnia, mediana i dominanta w skrócie

Średnia uwzględnia każdą wartość w zbiorze:

mean=sum of all valuesnumber of values\text{mean} = \frac{\text{sum of all values}}{\text{number of values}}

Ponieważ każda wartość ma wpływ na wynik, jedna wyjątkowo duża lub mała liczba może przesunąć średnią daleko od tego, co wydaje się typowe.

Mediana to wartość środkowa, gdy dane są zapisane w kolejności rosnącej. Jeśli liczba wartości jest nieparzysta, istnieje jedna wartość środkowa. Jeśli liczba wartości jest parzysta, mediana jest średnią z dwóch środkowych wartości.

Dominanta to wartość, która występuje najczęściej. Zbiór danych może mieć jedną dominantę, więcej niż jedną dominantę albo nie mieć dominanty wcale, jeśli żadna wartość nie pojawia się częściej niż pozostałe.

Przykład z wartością odstającą

Użyj zbioru danych 2,3,3,4,202, 3, 3, 4, 20.

Średnia wynosi

2+3+3+4+205=325=6.4\frac{2 + 3 + 3 + 4 + 20}{5} = \frac{32}{5} = 6.4

Mediana to 33, ponieważ 33 jest wartością środkową na uporządkowanej liście.

Dominanta to również 33, ponieważ pojawia się częściej niż każda inna wartość.

Ten przykład jest ważny, ponieważ dane zawierają wartość odstającą: 2020. Ta jedna wartość podnosi średnią do 6.46.4, podczas gdy mediana pozostaje równa 33. Jeśli chcesz opisać typową wartość dla tego zbioru, mediana jest zwykle lepszym podsumowaniem.

Częste błędy przy średniej, medianie i dominancie

Nieuporządkowanie danych przed wyznaczeniem mediany

Mediana zależy od kolejności. Jeśli lista nie zostanie najpierw uporządkowana, wybrana wartość środkowa nie będzie wiarygodna.

Traktowanie „przeciętnej” tak, jakby zawsze oznaczała średnią

W codziennym języku ludzie często używają słowa „przeciętna” dość swobodnie. W statystyce warto być bardziej precyzyjnym. Czasem mediana albo dominanta daje bardziej użyteczne podsumowanie.

Zakładanie, że każdy zbiór danych ma dominantę

Zbiór 1,2,3,41, 2, 3, 4 nie ma dominanty, ponieważ żadna wartość się nie powtarza. Zbiór może też mieć dwie lub więcej dominant, jeśli kilka wartości ma taką samą największą częstość.

Ignorowanie wartości odstających

Jeśli jedna wartość jest znacznie większa lub mniejsza od pozostałych, średnia może się mocno przesunąć. To nie znaczy, że średnia jest błędna, ale zmienia to, jaką historię opowiada ta liczba.

Kiedy używać każdej miary tendencji centralnej

Używaj średniej, gdy dane są dość wyrównane i każda wartość powinna wpływać na wynik. Prostym przykładem są wyniki z jednego spójnego quizu.

Używaj mediany, gdy skrajne wartości mogą zniekształcić środek. Dochody, czynsze i ceny domów to częste przypadki, ponieważ kilka bardzo dużych wartości może zawyżyć średnią.

Używaj dominanty, gdy najczęściej występująca wartość jest ważniejsza niż środek arytmetyczny. Pasują do tego na przykład rozmiary koszulek sprzedawanych w sklepie albo najczęstsza odpowiedź w ankiecie.

Dlaczego uczniowie uczą się tego pojęcia

Miary tendencji centralnej są często pierwszym krokiem do zrozumienia danych. Pomagają podsumować listę wartości, zanim porównasz grupy, sprawdzisz rozproszenie albo zdecydujesz, czy dane są skośne.

Jeśli dane są liczbowe i dość stabilne, średnia często jest informacyjna. Jeśli dane są skośne, mediana jest zwykle bezpieczniejsza. Jeśli pytanie dotyczy tego, co zdarza się najczęściej, dominanta może być jedyną miarą, która odpowiada na nie bezpośrednio.

Spróbuj podobnego zadania

Weź listę 5,6,6,7,305, 6, 6, 7, 30 i wyznacz wszystkie trzy miary. Następnie zamień 3030 na 88 i porównaj, co się zmienia. Ta jedna zmiana znacznie ułatwia dostrzeżenie roli wartości odstających.

Potrzebujesz pomocy z zadaniem?

Prześlij pytanie i otrzymaj zweryfikowane rozwiązanie krok po kroku w kilka sekund.

Otwórz GPAI Solver →