Z-score mówi, o ile odchyleń standardowych dana wartość leży powyżej lub poniżej średniej. Opisuje położenie względne, a nie samo w sobie dokładne prawdopodobieństwo.

Rozkład normalny — krzywa dzwonowa, z-score i wzór

Q: Czym jest rozkład normalny w prostych słowach?

Rozkład normalny to ciągły, symetryczny model prawdopodobieństwa, w którym wartości bliskie średniej występują najczęściej, a wartości dalsze od średniej pojawiają się coraz rzadziej, tworząc kształt dzwonu.

Rozkład normalny to model prawdopodobieństwa o kształcie dzwonu, w którym wartości bliskie średniej występują najczęściej, a wartości bardziej odległe pojawiają się coraz rzadziej w sposób symetryczny. Jeśli chcesz zrozumieć krzywą dzwonową, z-score albo wzór rozkładu normalnego, kluczowa idea jest prosta: średnia wyznacza środek, a odchylenie standardowe określa rozproszenie.

Ten model jest użyteczny tylko wtedy, gdy kształt normalny jest rozsądnym dopasowaniem do danych lub sytuacji. Gdy ten warunek jest spełniony, możesz oszacować typowe zakresy, porównywać wartości za pomocą z-score i interpretować, jak nietypowy jest dany wynik.

Co oznacza krzywa dzwonowa

Jeśli zmienna ma rozkład normalny, wartości bliskie średniej są częstsze niż wartości od niej odległe. Lewa i prawa strona są swoim lustrzanym odbiciem, więc bycie $2$ odchylenia standardowe powyżej średniej jest tak samo nietypowe jak bycie $2$ odchylenia standardowe poniżej średniej.

Często zobaczysz zapis

X \sim N(\mu, \sigma^2)

Oznacza to, że zmienna losowa $X$ jest modelowana rozkładem normalnym o średniej $\mu$ i wariancji $\sigma^2$ . Ponieważ wariancja to $\sigma^2$ , odchylenie standardowe wynosi $\sigma$ , gdzie $\sigma > 0$ .

Wzór rozkładu normalnego prostym językiem

Wzór na gęstość rozkładu normalnego to

f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{-(x-\mu)^2/(2\sigma^2)}

Nie musisz zapamiętywać każdego elementu tego wzoru, aby dobrze rozumieć ideę. Najważniejsze jest to, że $\mu$ przesuwa krzywą w lewo lub w prawo, a $\sigma$ sprawia, że staje się ona węższa albo szersza.

Ten wzór opisuje gęstość, a nie prawdopodobieństwo jednej dokładnej wartości. W modelu ciągłym prawdopodobieństwa pochodzą z przedziałów, takich jak $P(X < 80)$ lub $P(65 \le X \le 85)$ .

Jak łączą się średnia, odchylenie standardowe i z-score

Zmiana średniej przesuwa krzywą w lewo lub w prawo. Zmiana odchylenia standardowego sprawia, że krzywa staje się węższa albo szersza. Małe $\sigma$ oznacza, że wartości są skupione blisko średniej. Większe $\sigma$ oznacza większe rozproszenie.

Aby porównać jedną wartość z resztą rozkładu, użyj z-score:

z = \frac{x - \mu}{\sigma}

To mówi o położeniu względnym w jednostkach odchylenia standardowego. Jeśli $z = 1.5$ , wartość leży $1.5$ odchylenia standardowego powyżej średniej. Jeśli $z = -2$ , leży $2$ odchylenia standardowe poniżej średniej.

W przypadku modelu normalnego jednym z praktycznych skrótów jest reguła empiryczna:

\text{około } 68\% \text{ wartości leży w przedziale } \mu \pm \sigma

\text{około } 95\% \text{ wartości leży w przedziale } \mu \pm 2\sigma

\text{około } 99.7\% \text{ wartości leży w przedziale } \mu \pm 3\sigma

Używaj tego tylko wtedy, gdy model normalny jest rzeczywiście rozsądny. To użyteczne przybliżenie, a nie gwarancja dla każdego rzeczywistego zbioru danych.

Przykład z obliczeniem z-score i krzywą dzwonową

Załóżmy, że wyniki egzaminu są modelowane przez

X \sim N(70, 10^2)

Zatem średni wynik to $70$ , a odchylenie standardowe wynosi $10$ .

Najpierw użyj reguły empirycznej. Około $68\%$ wyników powinno mieścić się w granicach jednego odchylenia standardowego od średniej:

70 \pm 10

Zatem szybki przedział to

60 \text{ do } 80

Około $95\%$ wyników powinno mieścić się w granicach dwóch odchyleń standardowych:

70 \pm 2(10) = 70 \pm 20

Zatem ten przedział to

50 \text{ do } 90

Teraz weźmy ucznia, który uzyskał $85$ punktów. Jego z-score wynosi

z = \frac{85 - 70}{10} = 1.5

To oznacza, że wynik leży $1.5$ odchylenia standardowego powyżej średniej. To najszybsza użyteczna interpretacja: wynik jest wyraźnie powyżej przeciętnej, ale nie znajduje się jeszcze bardzo daleko w ogonie rozkładu.

Częste błędy w zadaniach o rozkładzie normalnym

Traktowanie każdego wykresu w kształcie dzwonu jako normalnego

Niektóre dane są skośne, mają grube ogony albo kilka wierzchołków. W takich przypadkach model normalny może być słabym dopasowaniem, nawet jeśli wykres wygląda na w przybliżeniu zaokrąglony.

Mylenie gęstości z prawdopodobieństwem

Wzór $f(x)$ nie jest prawdopodobieństwem tego, że $X$ przyjmuje jedną dokładną wartość. Dla rozkładów ciągłych prawdopodobieństwo w jednym punkcie wynosi $0$ , więc pracuje się z przedziałami.

Używanie reguły empirycznej bez sprawdzenia modelu

Reguła $68$ - $95$ - $99.7$ dotyczy rozkładu normalnego. Nie należy stosować jej automatycznie do każdego zbioru danych.

Mylenie wariancji z odchyleniem standardowym

Wariancja to $\sigma^2$ . W z-score używa się $\sigma$ , a nie $\sigma^2$ .

Kiedy stosuje się rozkład normalny

Rozkład normalny pojawia się często wtedy, gdy pomiary skupiają się wokół wartości centralnej, a wartości skrajne są stosunkowo rzadkie. Jest powszechny w modelach błędu pomiaru, interpretacji wyników testów, kontroli jakości oraz w badaniu średnich z próby.

Nie oznacza to, że wszystkie rzeczywiste dane mają rozkład normalny. Oznacza to, że model normalny jest użytecznym przybliżeniem wtedy, gdy kształt, kontekst i założenia sprawiają, że takie przybliżenie jest rozsądne.

Spróbuj podobnego zadania

Zmień przykład na $X \sim N(100, 15^2)$ i oblicz z-score dla $130$ . Następnie wyznacz przedział obejmujący około $95\%$ wartości. Wypróbowanie własnej wersji z inną średnią lub innym odchyleniem standardowym to dobry sposób, by zobaczyć, jak zmienia się krzywa dzwonowa.

Potrzebujesz pomocy z zadaniem?

Prześlij pytanie i otrzymaj zweryfikowane rozwiązanie krok po kroku w kilka sekund.

Otwórz GPAI Solver →