Wariancja mierzy, jak bardzo liczby są rozproszone wokół swojej średniej. Mała wariancja oznacza, że wartości pozostają dość blisko średniej. Duża wariancja oznacza, że są bardziej rozproszone.
Aby obliczyć wariancję, sprawdź, jak daleko każda wartość jest od średniej, podnieś te odległości do kwadratu i oblicz ich średnią. Podnoszenie do kwadratu jest ważne, ponieważ w przeciwnym razie dodatnie i ujemne odchylenia by się znosiły.
Wzór na wariancję: populacja a próba
Użyj wzoru na wariancję populacji, gdy twoje dane obejmują każdą wartość w grupie, którą chcesz opisać:
Użyj wzoru na wariancję próby, gdy twoje dane są tylko próbą i chcesz oszacować rozproszenie większej populacji:
Jedyna różnica dotyczy mianownika. Użyj dla całej populacji. Użyj dla oszacowania na podstawie próby.
Co oznacza wariancja
Wariancja nie mówi, gdzie znajduje się środek danych. Pokazuje, jak daleko dane zwykle leżą od tego środka.
Jeśli dwa zbiory danych mają tę samą średnią, to ten z większą wariancją ma wartości, które przeciętnie leżą dalej od średniej. Ponieważ odchylenia są podnoszone do kwadratu, wyjątkowo duże różnice mają większy wpływ.
Jeden ważny szczegół: wariancja jest wyrażana w jednostkach kwadratowych. Jeśli dane są podane w metrach, wariancja jest podana w metrach kwadratowych. Dlatego odchylenie standardowe jest często łatwiejsze do interpretacji w codziennym użyciu.
Jak obliczyć wariancję: przykład krok po kroku
Użyj zbioru danych .
Najpierw oblicz średnią:
Teraz odejmij średnią od każdej wartości i podnieś wynik do kwadratu:
Dodaj te kwadraty odchyleń:
Jeśli te osiem wartości stanowi całą populację, wariancja populacji wynosi:
Jeśli te same osiem wartości traktujemy jako próbę z większej populacji, wariancja próby wynosi:
Ten przykład jasno pokazuje główną ideę: kwadraty odchyleń są takie same, ale końcowy wynik zmienia się w zależności od tego, czy dzielisz przez , czy przez .
Typowe błędy przy obliczaniu wariancji
- Zapominanie o podniesieniu odchyleń do kwadratu. Jeśli obliczysz średnią z surowych odchyleń, wartości dodatnie i ujemne się zniosą, więc nie zmierzysz poprawnie rozproszenia.
- Mylenie wariancji populacji z wariancją próby. Dziel przez dla całej populacji i przez dla próby używanej do oszacowania większej populacji.
- Zapominanie, że wariancja używa jednostek kwadratowych. Wariancja jest przydatna, ale odchylenie standardowe jest często łatwiejsze do odczytania, ponieważ wraca do oryginalnych jednostek.
- Zakładanie, że duża wariancja zawsze jest czymś złym. Większa wariancja oznacza tylko większe rozproszenie. To, czy ma to znaczenie, zależy od kontekstu.
Kiedy używa się wariancji
Wariancja jest używana zawsze wtedy, gdy trzeba opisać lub porównać rozproszenie w spójny sposób.
- W statystyce pomaga podsumować, jak bardzo rozproszony jest zbiór danych.
- W kontroli jakości może pomóc śledzić, czy proces pozostaje stabilny w czasie.
- W finansach wariancja służy do opisu tego, jak bardzo wahają się stopy zwrotu, choć jest to tylko jeden ze sposobów myślenia o ryzyku.
- W uczeniu maszynowym i analizie danych pomaga opisać, jak cechy lub błędy zmieniają się między obserwacjami.
Spróbuj podobnego zadania
Spróbuj własnej wersji z dwoma małymi zbiorami danych, które mają tę samą średnią, ale różne rozproszenie. Oblicz wariancję dla obu i sprawdź, czy bardziej rozproszony zbiór danych daje większą wartość. To jedno porównanie zwykle dobrze utrwala ten pomysł.
Potrzebujesz pomocy z zadaniem?
Prześlij pytanie i otrzymaj zweryfikowane rozwiązanie krok po kroku w kilka sekund.
Otwórz GPAI Solver →