การแจกแจงปกติเป็นแบบจำลองความน่าจะเป็นรูปโค้งระฆัง โดยค่าที่อยู่ใกล้ค่าเฉลี่ยจะพบได้บ่อยที่สุด และค่าที่อยู่ไกลออกไปจะพบได้น้อยลงอย่างสมมาตร หากคุณกำลังพยายามทำความเข้าใจโค้งระฆัง, z-score หรือสูตรการแจกแจงปกติ แนวคิดสำคัญนั้นง่ายมาก: ค่าเฉลี่ยกำหนดจุดกึ่งกลาง และส่วนเบี่ยงเบนมาตรฐานกำหนดการกระจาย

แบบจำลองนี้มีประโยชน์ก็ต่อเมื่อรูปร่างแบบปกติเหมาะสมกับข้อมูลหรือสถานการณ์นั้นจริง ๆ เมื่อเงื่อนไขนี้เป็นจริง คุณจะสามารถประมาณช่วงค่าทั่วไป เปรียบเทียบค่าด้วย z-score และตีความได้ว่าผลลัพธ์หนึ่งผิดปกติมากน้อยเพียงใด

โค้งระฆังหมายถึงอะไร

ถ้าตัวแปรหนึ่งเป็นไปตามการแจกแจงปกติ ค่าที่อยู่ใกล้ค่าเฉลี่ยจะพบได้บ่อยกว่าค่าที่อยู่ไกลออกไป ด้านซ้ายและด้านขวาจะสะท้อนกัน ดังนั้นการอยู่สูงกว่าค่าเฉลี่ย 22 ส่วนเบี่ยงเบนมาตรฐาน จึงผิดปกติพอ ๆ กับการอยู่ต่ำกว่าค่าเฉลี่ย 22 ส่วนเบี่ยงเบนมาตรฐาน

คุณมักจะเห็นสัญลักษณ์

XN(μ,σ2)X \sim N(\mu, \sigma^2)

ซึ่งหมายความว่าตัวแปรสุ่ม XX ถูกจำลองด้วยการแจกแจงปกติที่มีค่าเฉลี่ย μ\mu และความแปรปรวน σ2\sigma^2 เนื่องจากความแปรปรวนคือ σ2\sigma^2 ส่วนเบี่ยงเบนมาตรฐานจึงเป็น σ\sigma โดยที่ σ>0\sigma > 0

สูตรการแจกแจงปกติ แบบภาษาง่าย ๆ

สูตรความหนาแน่นของการแจกแจงปกติคือ

f(x)=1σ2πe(xμ)2/(2σ2)f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{-(x-\mu)^2/(2\sigma^2)}

คุณไม่จำเป็นต้องท่องจำทุกส่วนของสูตรเพื่อใช้งานแนวคิดนี้ให้ดี สิ่งที่สำคัญที่สุดคือ μ\mu จะเลื่อนโค้งไปทางซ้ายหรือขวา ส่วน σ\sigma จะทำให้โค้งแคบลงหรือกว้างขึ้น

สูตรนี้อธิบายความหนาแน่น ไม่ใช่ความน่าจะเป็นของค่าที่แน่นอนเพียงค่าเดียว สำหรับแบบจำลองต่อเนื่อง ความน่าจะเป็นจะมาจากช่วง เช่น P(X<80)P(X < 80) หรือ P(65X85)P(65 \le X \le 85)

ค่าเฉลี่ย ส่วนเบี่ยงเบนมาตรฐาน และ z-score เชื่อมโยงกันอย่างไร

การเปลี่ยนค่าเฉลี่ยจะทำให้โค้งเลื่อนไปทางซ้ายหรือขวา การเปลี่ยนส่วนเบี่ยงเบนมาตรฐานจะทำให้โค้งแคบลงหรือกว้างขึ้น ค่า σ\sigma ที่เล็กหมายความว่าค่าต่าง ๆ กระจุกตัวแน่นรอบค่าเฉลี่ย ส่วนค่า σ\sigma ที่มากกว่าหมายความว่าค่าต่าง ๆ กระจายออกมากขึ้น

หากต้องการเปรียบเทียบค่าหนึ่งกับค่าที่เหลือในการแจกแจง ให้ใช้ z-score:

z=xμσz = \frac{x - \mu}{\sigma}

ค่านี้บอกตำแหน่งสัมพัทธ์ในหน่วยของส่วนเบี่ยงเบนมาตรฐาน ถ้า z=1.5z = 1.5 แปลว่าค่านั้นอยู่สูงกว่าค่าเฉลี่ย 1.51.5 ส่วนเบี่ยงเบนมาตรฐาน ถ้า z=2z = -2 แปลว่าอยู่ต่ำกว่าค่าเฉลี่ย 22 ส่วนเบี่ยงเบนมาตรฐาน

สำหรับแบบจำลองปกติ ทางลัดที่ใช้ได้จริงอย่างหนึ่งคือกฎเชิงประจักษ์:

ประมาณ 68% ของค่าทั้งหมดอยู่ในช่วง μ±σ\text{ประมาณ } 68\% \text{ ของค่าทั้งหมดอยู่ในช่วง } \mu \pm \sigma ประมาณ 95% ของค่าทั้งหมดอยู่ในช่วง μ±2σ\text{ประมาณ } 95\% \text{ ของค่าทั้งหมดอยู่ในช่วง } \mu \pm 2\sigma ประมาณ 99.7% ของค่าทั้งหมดอยู่ในช่วง μ±3σ\text{ประมาณ } 99.7\% \text{ ของค่าทั้งหมดอยู่ในช่วง } \mu \pm 3\sigma

ควรใช้กฎนี้เฉพาะเมื่อแบบจำลองปกติเหมาะสมจริง ๆ เท่านั้น มันเป็นการประมาณที่มีประโยชน์ ไม่ใช่สิ่งที่รับประกันได้สำหรับข้อมูลจริงทุกชุด

ตัวอย่างพร้อมวิธีทำด้วย z-score และโค้งระฆัง

สมมติว่าคะแนนสอบถูกจำลองด้วย

XN(70,102)X \sim N(70, 10^2)

ดังนั้นคะแนนเฉลี่ยคือ 7070 และส่วนเบี่ยงเบนมาตรฐานคือ 1010

ก่อนอื่น ใช้กฎเชิงประจักษ์ ประมาณ 68%68\% ของคะแนนควรอยู่ภายในหนึ่งส่วนเบี่ยงเบนมาตรฐานจากค่าเฉลี่ย:

70±1070 \pm 10

ดังนั้นช่วงอย่างรวดเร็วคือ

60 to 8060 \text{ to } 80

ประมาณ 95%95\% ของคะแนนควรอยู่ภายในสองส่วนเบี่ยงเบนมาตรฐาน:

70±2(10)=70±2070 \pm 2(10) = 70 \pm 20

ดังนั้นช่วงนั้นคือ

50 to 9050 \text{ to } 90

ตอนนี้พิจารณานักเรียนคนหนึ่งที่ได้คะแนน 8585 ค่า z-score คือ

z=857010=1.5z = \frac{85 - 70}{10} = 1.5

นั่นหมายความว่าคะแนนนี้สูงกว่าค่าเฉลี่ย 1.51.5 ส่วนเบี่ยงเบนมาตรฐาน นี่คือการตีความที่เร็วและมีประโยชน์ที่สุด: คะแนนนี้สูงกว่าค่าเฉลี่ยอย่างชัดเจน แต่ยังไม่ได้อยู่ลึกเข้าไปในหางการแจกแจงมากนัก

ข้อผิดพลาดที่พบบ่อยในโจทย์การแจกแจงปกติ

คิดว่ากราฟทรงระฆังทุกกราฟเป็นการแจกแจงปกติ

ข้อมูลบางชุดอาจเบ้ มีหางหนา หรือมีหลายยอด ในกรณีเหล่านี้ แบบจำลองปกติอาจไม่เหมาะ แม้ว่ากราฟจะดูโค้งมนคร่าว ๆ ก็ตาม

สับสนระหว่างความหนาแน่นกับความน่าจะเป็น

สูตร f(x)f(x) ไม่ใช่ความน่าจะเป็นที่ XX จะเท่ากับค่าหนึ่งค่าที่แน่นอน สำหรับการแจกแจงแบบต่อเนื่อง ความน่าจะเป็นที่จุดเดียวมีค่าเป็น 00 ดังนั้นจึงต้องพิจารณาเป็นช่วงแทน

ใช้กฎเชิงประจักษ์โดยไม่ตรวจสอบแบบจำลองก่อน

กฎ 6868-9595-99.799.7 เป็นของการแจกแจงปกติ ไม่ควรนำไปใช้โดยอัตโนมัติกับข้อมูลทุกชุด

สับสนระหว่างความแปรปรวนกับส่วนเบี่ยงเบนมาตรฐาน

ความแปรปรวนคือ σ2\sigma^2 ส่วน z-score ใช้ σ\sigma ไม่ใช่ σ2\sigma^2

การแจกแจงปกติถูกใช้เมื่อใด

การแจกแจงปกติมักปรากฏเมื่อค่าที่วัดได้กระจุกตัวอยู่รอบค่ากลาง และค่าที่สุดโต่งพบได้ค่อนข้างน้อย มันพบได้บ่อยในการจำลองความคลาดเคลื่อนของการวัด การตีความคะแนนสอบ การควบคุมคุณภาพ และการศึกษาค่าเฉลี่ยของกลุ่มตัวอย่าง

แต่นั่นไม่ได้หมายความว่าข้อมูลจริงทั้งหมดเป็นแบบปกติ มันหมายความว่าแบบจำลองปกติเป็นการประมาณที่มีประโยชน์ เมื่อรูปร่าง บริบท และสมมติฐานต่าง ๆ ทำให้การประมาณนั้นสมเหตุสมผล

ลองทำโจทย์ที่คล้ายกัน

เปลี่ยนตัวอย่างเป็น XN(100,152)X \sim N(100, 15^2) แล้วคำนวณ z-score ของ 130130 จากนั้นหาช่วงที่ครอบคลุมค่าประมาณ 95%95\% ของข้อมูล การลองทำเวอร์ชันของคุณเองด้วยค่าเฉลี่ยหรือส่วนเบี่ยงเบนมาตรฐานที่ต่างออกไป เป็นวิธีที่ดีในการเห็นว่าโค้งระฆังเปลี่ยนไปอย่างไร

ต้องการความช่วยเหลือในการแก้โจทย์?

อัปโหลดคำถามของคุณแล้วรับคำตอบแบบทีละขั้นตอนที่ผ่านการตรวจสอบในไม่กี่วินาที

เปิด GPAI Solver →