Rozkład normalny to model prawdopodobieństwa o kształcie dzwonu, w którym wartości bliskie średniej występują najczęściej, a wartości bardziej odległe pojawiają się coraz rzadziej w sposób symetryczny. Jeśli chcesz zrozumieć krzywą dzwonową, z-score albo wzór rozkładu normalnego, kluczowa idea jest prosta: średnia wyznacza środek, a odchylenie standardowe określa rozproszenie.

Ten model jest użyteczny tylko wtedy, gdy kształt normalny jest rozsądnym dopasowaniem do danych lub sytuacji. Gdy ten warunek jest spełniony, możesz oszacować typowe zakresy, porównywać wartości za pomocą z-score i interpretować, jak nietypowy jest dany wynik.

Co oznacza krzywa dzwonowa

Jeśli zmienna ma rozkład normalny, wartości bliskie średniej są częstsze niż wartości od niej odległe. Lewa i prawa strona są swoim lustrzanym odbiciem, więc bycie 22 odchylenia standardowe powyżej średniej jest tak samo nietypowe jak bycie 22 odchylenia standardowe poniżej średniej.

Często zobaczysz zapis

XN(μ,σ2)X \sim N(\mu, \sigma^2)

Oznacza to, że zmienna losowa XX jest modelowana rozkładem normalnym o średniej μ\mu i wariancji σ2\sigma^2. Ponieważ wariancja to σ2\sigma^2, odchylenie standardowe wynosi σ\sigma, gdzie σ>0\sigma > 0.

Wzór rozkładu normalnego prostym językiem

Wzór na gęstość rozkładu normalnego to

f(x)=1σ2πe(xμ)2/(2σ2)f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{-(x-\mu)^2/(2\sigma^2)}

Nie musisz zapamiętywać każdego elementu tego wzoru, aby dobrze rozumieć ideę. Najważniejsze jest to, że μ\mu przesuwa krzywą w lewo lub w prawo, a σ\sigma sprawia, że staje się ona węższa albo szersza.

Ten wzór opisuje gęstość, a nie prawdopodobieństwo jednej dokładnej wartości. W modelu ciągłym prawdopodobieństwa pochodzą z przedziałów, takich jak P(X<80)P(X < 80) lub P(65X85)P(65 \le X \le 85).

Jak łączą się średnia, odchylenie standardowe i z-score

Zmiana średniej przesuwa krzywą w lewo lub w prawo. Zmiana odchylenia standardowego sprawia, że krzywa staje się węższa albo szersza. Małe σ\sigma oznacza, że wartości są skupione blisko średniej. Większe σ\sigma oznacza większe rozproszenie.

Aby porównać jedną wartość z resztą rozkładu, użyj z-score:

z=xμσz = \frac{x - \mu}{\sigma}

To mówi o położeniu względnym w jednostkach odchylenia standardowego. Jeśli z=1.5z = 1.5, wartość leży 1.51.5 odchylenia standardowego powyżej średniej. Jeśli z=2z = -2, leży 22 odchylenia standardowe poniżej średniej.

W przypadku modelu normalnego jednym z praktycznych skrótów jest reguła empiryczna:

około 68% wartosˊci lez˙y w przedziale μ±σ\text{około } 68\% \text{ wartości leży w przedziale } \mu \pm \sigma około 95% wartosˊci lez˙y w przedziale μ±2σ\text{około } 95\% \text{ wartości leży w przedziale } \mu \pm 2\sigma około 99.7% wartosˊci lez˙y w przedziale μ±3σ\text{około } 99.7\% \text{ wartości leży w przedziale } \mu \pm 3\sigma

Używaj tego tylko wtedy, gdy model normalny jest rzeczywiście rozsądny. To użyteczne przybliżenie, a nie gwarancja dla każdego rzeczywistego zbioru danych.

Przykład z obliczeniem z-score i krzywą dzwonową

Załóżmy, że wyniki egzaminu są modelowane przez

XN(70,102)X \sim N(70, 10^2)

Zatem średni wynik to 7070, a odchylenie standardowe wynosi 1010.

Najpierw użyj reguły empirycznej. Około 68%68\% wyników powinno mieścić się w granicach jednego odchylenia standardowego od średniej:

70±1070 \pm 10

Zatem szybki przedział to

60 do 8060 \text{ do } 80

Około 95%95\% wyników powinno mieścić się w granicach dwóch odchyleń standardowych:

70±2(10)=70±2070 \pm 2(10) = 70 \pm 20

Zatem ten przedział to

50 do 9050 \text{ do } 90

Teraz weźmy ucznia, który uzyskał 8585 punktów. Jego z-score wynosi

z=857010=1.5z = \frac{85 - 70}{10} = 1.5

To oznacza, że wynik leży 1.51.5 odchylenia standardowego powyżej średniej. To najszybsza użyteczna interpretacja: wynik jest wyraźnie powyżej przeciętnej, ale nie znajduje się jeszcze bardzo daleko w ogonie rozkładu.

Częste błędy w zadaniach o rozkładzie normalnym

Traktowanie każdego wykresu w kształcie dzwonu jako normalnego

Niektóre dane są skośne, mają grube ogony albo kilka wierzchołków. W takich przypadkach model normalny może być słabym dopasowaniem, nawet jeśli wykres wygląda na w przybliżeniu zaokrąglony.

Mylenie gęstości z prawdopodobieństwem

Wzór f(x)f(x) nie jest prawdopodobieństwem tego, że XX przyjmuje jedną dokładną wartość. Dla rozkładów ciągłych prawdopodobieństwo w jednym punkcie wynosi 00, więc pracuje się z przedziałami.

Używanie reguły empirycznej bez sprawdzenia modelu

Reguła 6868-9595-99.799.7 dotyczy rozkładu normalnego. Nie należy stosować jej automatycznie do każdego zbioru danych.

Mylenie wariancji z odchyleniem standardowym

Wariancja to σ2\sigma^2. W z-score używa się σ\sigma, a nie σ2\sigma^2.

Kiedy stosuje się rozkład normalny

Rozkład normalny pojawia się często wtedy, gdy pomiary skupiają się wokół wartości centralnej, a wartości skrajne są stosunkowo rzadkie. Jest powszechny w modelach błędu pomiaru, interpretacji wyników testów, kontroli jakości oraz w badaniu średnich z próby.

Nie oznacza to, że wszystkie rzeczywiste dane mają rozkład normalny. Oznacza to, że model normalny jest użytecznym przybliżeniem wtedy, gdy kształt, kontekst i założenia sprawiają, że takie przybliżenie jest rozsądne.

Spróbuj podobnego zadania

Zmień przykład na XN(100,152)X \sim N(100, 15^2) i oblicz z-score dla 130130. Następnie wyznacz przedział obejmujący około 95%95\% wartości. Wypróbowanie własnej wersji z inną średnią lub innym odchyleniem standardowym to dobry sposób, by zobaczyć, jak zmienia się krzywa dzwonowa.

Potrzebujesz pomocy z zadaniem?

Prześlij pytanie i otrzymaj zweryfikowane rozwiązanie krok po kroku w kilka sekund.

Otwórz GPAI Solver →