Średnia, mediana i dominanta to trzy sposoby opisywania środka zbioru danych. Średnia to przeciętna, mediana to wartość środkowa po uporządkowaniu danych, a dominanta to wartość występująca najczęściej. Jeśli chcesz prostą zasadę: używaj średniej, gdy dane są dość wyrównane, mediany, gdy wartości odstające mogą zniekształcić wynik, a dominanty, gdy najważniejsza jest wartość pojawiająca się najczęściej.
Te miary mogą dawać różne wyniki, ponieważ każda z nich inaczej definiuje „środek”. I właśnie dlatego są przydatne.
Średnia, mediana i dominanta w skrócie
Średnia uwzględnia każdą wartość w zbiorze:
Ponieważ każda wartość ma wpływ na wynik, jedna wyjątkowo duża lub mała liczba może przesunąć średnią daleko od tego, co wydaje się typowe.
Mediana to wartość środkowa, gdy dane są zapisane w kolejności rosnącej. Jeśli liczba wartości jest nieparzysta, istnieje jedna wartość środkowa. Jeśli liczba wartości jest parzysta, mediana jest średnią z dwóch środkowych wartości.
Dominanta to wartość, która występuje najczęściej. Zbiór danych może mieć jedną dominantę, więcej niż jedną dominantę albo nie mieć dominanty wcale, jeśli żadna wartość nie pojawia się częściej niż pozostałe.
Przykład z wartością odstającą
Użyj zbioru danych .
Średnia wynosi
Mediana to , ponieważ jest wartością środkową na uporządkowanej liście.
Dominanta to również , ponieważ pojawia się częściej niż każda inna wartość.
Ten przykład jest ważny, ponieważ dane zawierają wartość odstającą: . Ta jedna wartość podnosi średnią do , podczas gdy mediana pozostaje równa . Jeśli chcesz opisać typową wartość dla tego zbioru, mediana jest zwykle lepszym podsumowaniem.
Częste błędy przy średniej, medianie i dominancie
Nieuporządkowanie danych przed wyznaczeniem mediany
Mediana zależy od kolejności. Jeśli lista nie zostanie najpierw uporządkowana, wybrana wartość środkowa nie będzie wiarygodna.
Traktowanie „przeciętnej” tak, jakby zawsze oznaczała średnią
W codziennym języku ludzie często używają słowa „przeciętna” dość swobodnie. W statystyce warto być bardziej precyzyjnym. Czasem mediana albo dominanta daje bardziej użyteczne podsumowanie.
Zakładanie, że każdy zbiór danych ma dominantę
Zbiór nie ma dominanty, ponieważ żadna wartość się nie powtarza. Zbiór może też mieć dwie lub więcej dominant, jeśli kilka wartości ma taką samą największą częstość.
Ignorowanie wartości odstających
Jeśli jedna wartość jest znacznie większa lub mniejsza od pozostałych, średnia może się mocno przesunąć. To nie znaczy, że średnia jest błędna, ale zmienia to, jaką historię opowiada ta liczba.
Kiedy używać każdej miary tendencji centralnej
Używaj średniej, gdy dane są dość wyrównane i każda wartość powinna wpływać na wynik. Prostym przykładem są wyniki z jednego spójnego quizu.
Używaj mediany, gdy skrajne wartości mogą zniekształcić środek. Dochody, czynsze i ceny domów to częste przypadki, ponieważ kilka bardzo dużych wartości może zawyżyć średnią.
Używaj dominanty, gdy najczęściej występująca wartość jest ważniejsza niż środek arytmetyczny. Pasują do tego na przykład rozmiary koszulek sprzedawanych w sklepie albo najczęstsza odpowiedź w ankiecie.
Dlaczego uczniowie uczą się tego pojęcia
Miary tendencji centralnej są często pierwszym krokiem do zrozumienia danych. Pomagają podsumować listę wartości, zanim porównasz grupy, sprawdzisz rozproszenie albo zdecydujesz, czy dane są skośne.
Jeśli dane są liczbowe i dość stabilne, średnia często jest informacyjna. Jeśli dane są skośne, mediana jest zwykle bezpieczniejsza. Jeśli pytanie dotyczy tego, co zdarza się najczęściej, dominanta może być jedyną miarą, która odpowiada na nie bezpośrednio.
Spróbuj podobnego zadania
Weź listę i wyznacz wszystkie trzy miary. Następnie zamień na i porównaj, co się zmienia. Ta jedna zmiana znacznie ułatwia dostrzeżenie roli wartości odstających.
Potrzebujesz pomocy z zadaniem?
Prześlij pytanie i otrzymaj zweryfikowane rozwiązanie krok po kroku w kilka sekund.
Otwórz GPAI Solver →