การแจกแจงปกติแบบเข้าใจง่ายคืออะไร?

การแจกแจงปกติเป็นแบบจำลองความน่าจะเป็นแบบต่อเนื่องที่มีความสมมาตร โดยค่าที่อยู่ใกล้ค่าเฉลี่ยจะพบได้บ่อยที่สุด และค่าที่อยู่ไกลออกไปจะพบได้น้อยลงในลักษณะโค้งรูปกระดิ่ง

z-score บอกอะไรได้บ้าง?

z-score บอกว่าค่าหนึ่งอยู่สูงกว่าหรือต่ำกว่าค่าเฉลี่ยกี่ส่วนเบี่ยงเบนมาตรฐาน มันบอกตำแหน่งสัมพัทธ์ ไม่ได้บอกความน่าจะเป็นที่แน่นอนด้วยตัวมันเอง

การแจกแจงปกติ — โค้งระฆัง, Z-Score และสูตร

การแจกแจงปกติเป็นแบบจำลองความน่าจะเป็นรูปโค้งระฆัง โดยค่าที่อยู่ใกล้ค่าเฉลี่ยจะพบได้บ่อยที่สุด และค่าที่อยู่ไกลออกไปจะพบได้น้อยลงอย่างสมมาตร หากคุณกำลังพยายามทำความเข้าใจโค้งระฆัง, z-score หรือสูตรการแจกแจงปกติ แนวคิดสำคัญนั้นง่ายมาก: ค่าเฉลี่ยกำหนดจุดกึ่งกลาง และส่วนเบี่ยงเบนมาตรฐานกำหนดการกระจาย

แบบจำลองนี้มีประโยชน์ก็ต่อเมื่อรูปร่างแบบปกติเหมาะสมกับข้อมูลหรือสถานการณ์นั้นจริง ๆ เมื่อเงื่อนไขนี้เป็นจริง คุณจะสามารถประมาณช่วงค่าทั่วไป เปรียบเทียบค่าด้วย z-score และตีความได้ว่าผลลัพธ์หนึ่งผิดปกติมากน้อยเพียงใด

โค้งระฆังหมายถึงอะไร

ถ้าตัวแปรหนึ่งเป็นไปตามการแจกแจงปกติ ค่าที่อยู่ใกล้ค่าเฉลี่ยจะพบได้บ่อยกว่าค่าที่อยู่ไกลออกไป ด้านซ้ายและด้านขวาจะสะท้อนกัน ดังนั้นการอยู่สูงกว่าค่าเฉลี่ย $2$ ส่วนเบี่ยงเบนมาตรฐาน จึงผิดปกติพอ ๆ กับการอยู่ต่ำกว่าค่าเฉลี่ย $2$ ส่วนเบี่ยงเบนมาตรฐาน

คุณมักจะเห็นสัญลักษณ์

X \sim N(\mu, \sigma^2)

ซึ่งหมายความว่าตัวแปรสุ่ม $X$ ถูกจำลองด้วยการแจกแจงปกติที่มีค่าเฉลี่ย $\mu$ และความแปรปรวน $\sigma^2$ เนื่องจากความแปรปรวนคือ $\sigma^2$ ส่วนเบี่ยงเบนมาตรฐานจึงเป็น $\sigma$ โดยที่ $\sigma > 0$

สูตรการแจกแจงปกติ แบบภาษาง่าย ๆ

สูตรความหนาแน่นของการแจกแจงปกติคือ

f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{-(x-\mu)^2/(2\sigma^2)}

คุณไม่จำเป็นต้องท่องจำทุกส่วนของสูตรเพื่อใช้งานแนวคิดนี้ให้ดี สิ่งที่สำคัญที่สุดคือ $\mu$ จะเลื่อนโค้งไปทางซ้ายหรือขวา ส่วน $\sigma$ จะทำให้โค้งแคบลงหรือกว้างขึ้น

สูตรนี้อธิบายความหนาแน่น ไม่ใช่ความน่าจะเป็นของค่าที่แน่นอนเพียงค่าเดียว สำหรับแบบจำลองต่อเนื่อง ความน่าจะเป็นจะมาจากช่วง เช่น $P(X < 80)$ หรือ $P(65 \le X \le 85)$

ค่าเฉลี่ย ส่วนเบี่ยงเบนมาตรฐาน และ z-score เชื่อมโยงกันอย่างไร

การเปลี่ยนค่าเฉลี่ยจะทำให้โค้งเลื่อนไปทางซ้ายหรือขวา การเปลี่ยนส่วนเบี่ยงเบนมาตรฐานจะทำให้โค้งแคบลงหรือกว้างขึ้น ค่า $\sigma$ ที่เล็กหมายความว่าค่าต่าง ๆ กระจุกตัวแน่นรอบค่าเฉลี่ย ส่วนค่า $\sigma$ ที่มากกว่าหมายความว่าค่าต่าง ๆ กระจายออกมากขึ้น

หากต้องการเปรียบเทียบค่าหนึ่งกับค่าที่เหลือในการแจกแจง ให้ใช้ z-score:

z = \frac{x - \mu}{\sigma}

ค่านี้บอกตำแหน่งสัมพัทธ์ในหน่วยของส่วนเบี่ยงเบนมาตรฐาน ถ้า $z = 1.5$ แปลว่าค่านั้นอยู่สูงกว่าค่าเฉลี่ย $1.5$ ส่วนเบี่ยงเบนมาตรฐาน ถ้า $z = -2$ แปลว่าอยู่ต่ำกว่าค่าเฉลี่ย $2$ ส่วนเบี่ยงเบนมาตรฐาน

สำหรับแบบจำลองปกติ ทางลัดที่ใช้ได้จริงอย่างหนึ่งคือกฎเชิงประจักษ์:

\text{ประมาณ } 68\% \text{ ของค่าทั้งหมดอยู่ในช่วง } \mu \pm \sigma

\text{ประมาณ } 95\% \text{ ของค่าทั้งหมดอยู่ในช่วง } \mu \pm 2\sigma

\text{ประมาณ } 99.7\% \text{ ของค่าทั้งหมดอยู่ในช่วง } \mu \pm 3\sigma

ควรใช้กฎนี้เฉพาะเมื่อแบบจำลองปกติเหมาะสมจริง ๆ เท่านั้น มันเป็นการประมาณที่มีประโยชน์ ไม่ใช่สิ่งที่รับประกันได้สำหรับข้อมูลจริงทุกชุด

ตัวอย่างพร้อมวิธีทำด้วย z-score และโค้งระฆัง

สมมติว่าคะแนนสอบถูกจำลองด้วย

X \sim N(70, 10^2)

ดังนั้นคะแนนเฉลี่ยคือ $70$ และส่วนเบี่ยงเบนมาตรฐานคือ $10$

ก่อนอื่น ใช้กฎเชิงประจักษ์ ประมาณ $68\%$ ของคะแนนควรอยู่ภายในหนึ่งส่วนเบี่ยงเบนมาตรฐานจากค่าเฉลี่ย:

70 \pm 10

ดังนั้นช่วงอย่างรวดเร็วคือ

60 \text{ to } 80

ประมาณ $95\%$ ของคะแนนควรอยู่ภายในสองส่วนเบี่ยงเบนมาตรฐาน:

70 \pm 2(10) = 70 \pm 20

ดังนั้นช่วงนั้นคือ

50 \text{ to } 90

ตอนนี้พิจารณานักเรียนคนหนึ่งที่ได้คะแนน $85$ ค่า z-score คือ

z = \frac{85 - 70}{10} = 1.5

นั่นหมายความว่าคะแนนนี้สูงกว่าค่าเฉลี่ย $1.5$ ส่วนเบี่ยงเบนมาตรฐาน นี่คือการตีความที่เร็วและมีประโยชน์ที่สุด: คะแนนนี้สูงกว่าค่าเฉลี่ยอย่างชัดเจน แต่ยังไม่ได้อยู่ลึกเข้าไปในหางการแจกแจงมากนัก

ข้อผิดพลาดที่พบบ่อยในโจทย์การแจกแจงปกติ

คิดว่ากราฟทรงระฆังทุกกราฟเป็นการแจกแจงปกติ

ข้อมูลบางชุดอาจเบ้ มีหางหนา หรือมีหลายยอด ในกรณีเหล่านี้ แบบจำลองปกติอาจไม่เหมาะ แม้ว่ากราฟจะดูโค้งมนคร่าว ๆ ก็ตาม

สับสนระหว่างความหนาแน่นกับความน่าจะเป็น

สูตร $f(x)$ ไม่ใช่ความน่าจะเป็นที่ $X$ จะเท่ากับค่าหนึ่งค่าที่แน่นอน สำหรับการแจกแจงแบบต่อเนื่อง ความน่าจะเป็นที่จุดเดียวมีค่าเป็น $0$ ดังนั้นจึงต้องพิจารณาเป็นช่วงแทน

ใช้กฎเชิงประจักษ์โดยไม่ตรวจสอบแบบจำลองก่อน

กฎ $68$ - $95$ - $99.7$ เป็นของการแจกแจงปกติ ไม่ควรนำไปใช้โดยอัตโนมัติกับข้อมูลทุกชุด

สับสนระหว่างความแปรปรวนกับส่วนเบี่ยงเบนมาตรฐาน

ความแปรปรวนคือ $\sigma^2$ ส่วน z-score ใช้ $\sigma$ ไม่ใช่ $\sigma^2$

การแจกแจงปกติถูกใช้เมื่อใด

การแจกแจงปกติมักปรากฏเมื่อค่าที่วัดได้กระจุกตัวอยู่รอบค่ากลาง และค่าที่สุดโต่งพบได้ค่อนข้างน้อย มันพบได้บ่อยในการจำลองความคลาดเคลื่อนของการวัด การตีความคะแนนสอบ การควบคุมคุณภาพ และการศึกษาค่าเฉลี่ยของกลุ่มตัวอย่าง

แต่นั่นไม่ได้หมายความว่าข้อมูลจริงทั้งหมดเป็นแบบปกติ มันหมายความว่าแบบจำลองปกติเป็นการประมาณที่มีประโยชน์ เมื่อรูปร่าง บริบท และสมมติฐานต่าง ๆ ทำให้การประมาณนั้นสมเหตุสมผล

ลองทำโจทย์ที่คล้ายกัน

เปลี่ยนตัวอย่างเป็น $X \sim N(100, 15^2)$ แล้วคำนวณ z-score ของ $130$ จากนั้นหาช่วงที่ครอบคลุมค่าประมาณ $95\%$ ของข้อมูล การลองทำเวอร์ชันของคุณเองด้วยค่าเฉลี่ยหรือส่วนเบี่ยงเบนมาตรฐานที่ต่างออกไป เป็นวิธีที่ดีในการเห็นว่าโค้งระฆังเปลี่ยนไปอย่างไร

ต้องการความช่วยเหลือในการแก้โจทย์?

อัปโหลดคำถามของคุณแล้วรับคำตอบแบบทีละขั้นตอนที่ผ่านการตรวจสอบในไม่กี่วินาที

เปิด GPAI Solver →