ทฤษฎีบทของเบย์แบบง่าย ๆ คืออะไร?

ทฤษฎีบทของเบย์บอกวิธีปรับปรุงความน่าจะเป็นของเหตุการณ์เมื่อเราเห็นหลักฐานใหม่ โดยรวมความน่าจะเป็นตั้งต้นของคุณ ความสอดคล้องของหลักฐานกับเหตุการณ์นั้น และความพบบ่อยของหลักฐานนั้นโดยรวมเข้าด้วยกัน

ทำไมทฤษฎีบทของเบย์จึงมักทำให้สับสน?

นักเรียนจำนวนมากมักสับสนระหว่าง $P(A \mid B)$ กับ $P(B \mid A)$ หรือมองข้ามอัตราฐาน ทฤษฎีบทของเบย์บังคับให้คุณคำนึงถึงทั้งสองอย่าง

ทฤษฎีบทของเบย์ — สูตร การพิสูจน์ และตัวอย่าง

ทฤษฎีบทของเบย์บอกวิธีอัปเดตความน่าจะเป็นหลังจากเห็นหลักฐานใหม่ ถ้า $P(B) > 0$ แล้ว

P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B)}

มันตอบคำถามที่เฉพาะมากว่า หลังจากเหตุการณ์ $B$ เกิดขึ้นแล้ว ตอนนี้เหตุการณ์ $A$ มีโอกาสเกิดมากน้อยแค่ไหน แนวคิดนี้สำคัญในงานตรวจทางการแพทย์ การกรองสแปม และทุกสถานการณ์ที่หลักฐานอาจทำให้เข้าใจผิดได้ หากเราไม่คำนึงด้วยว่าเหตุการณ์นั้นพบได้บ่อยแค่ไหนตั้งแต่แรก

สูตรทฤษฎีบทของเบย์แบบภาษาง่าย ๆ

ทฤษฎีบทของเบย์รวมองค์ประกอบ 3 อย่างเข้าด้วยกัน:

เริ่มจากสิ่งที่คุณเชื่อก่อนเห็นหลักฐาน คือ $P(A)$
ถามว่าหลักฐานสอดคล้องกับเหตุการณ์นั้นมากแค่ไหน คือ $P(B \mid A)$
ปรับด้วยความพบบ่อยของหลักฐานนั้นโดยรวม คือ $P(B)$

ผลลัพธ์ $P(A \mid B)$ เรียกว่า ความน่าจะเป็นแบบ posterior

แต่ละส่วนของสูตรหมายถึงอะไร

ในสูตร

P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B)}

$P(A)$ คือ prior เป็นความน่าจะเป็นตั้งต้นของ $A$ ก่อนที่คุณจะใช้หลักฐานใหม่

$P(B \mid A)$ คือ likelihood มันบอกว่าหลักฐาน $B$ มีโอกาสเกิดมากแค่ไหนถ้า $A$ เป็นจริง

$P(B)$ คือความน่าจะเป็นของหลักฐานโดยรวม พจน์นี้สำคัญ เพราะหลักฐานบางอย่างอาจพบได้บ่อยแม้ในกรณีที่ $A$ เป็นเท็จ

$P(A \mid B)$ คือ posterior เป็นความน่าจะเป็นของ $A$ ที่อัปเดตแล้วหลังจากรู้ว่า $B$ เกิดขึ้น

ทำไมตัวส่วนจึงเปลี่ยนคำตอบ

ทฤษฎีบทของเบย์ไม่ได้ให้ค่าน้ำหนักกับหลักฐานที่เข้ากับสมมติฐานของคุณเท่านั้น มันยังถามด้วยว่าหลักฐานแบบเดียวกันนี้เกิดขึ้นบ่อยอยู่แล้วหรือไม่

นั่นจึงเป็นเหตุผลว่าทำไมตัวส่วน $P(B)$ จึงสำคัญ ถ้าหลักฐานนี้พบได้ทั่วไปในหลายกรณี การเห็นมันไม่ควรเปลี่ยนความเชื่อของคุณมากนัก แต่ถ้าหลักฐานนี้พบได้น้อย ยกเว้นเมื่อ $A$ เป็นจริง มันก็อาจเปลี่ยนความเชื่อของคุณได้มาก

การพิสูจน์สั้น ๆ จากความน่าจะเป็นแบบมีเงื่อนไข

สมมติว่า $P(B) > 0$ และเมื่อจำเป็นให้มี $P(A) > 0$ จากนิยามของความน่าจะเป็นแบบมีเงื่อนไข

P(A \mid B) = \frac{P(A \cap B)}{P(B)}

และ

P(B \mid A) = \frac{P(A \cap B)}{P(A)}

จากสมการที่สอง

P(A \cap B) = P(B \mid A)P(A)

แทนค่านี้ลงในสมการแรก จะได้

P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B)}

นี่คือทฤษฎีบทของเบย์

ตัวอย่างทฤษฎีบทของเบย์: ผลตรวจโรคเป็นบวก

สมมติว่าโรคชนิดหนึ่งพบในประชากร $1\%$ การตรวจมีความไว $99\%$ และมีอัตราผลบวกลวง $5\%$

ให้

$D$ = บุคคลนั้นเป็นโรค
$+$ = ผลตรวจเป็นบวก

ดังนั้น

P(D) = 0.01

P(+ \mid D) = 0.99

P(+ \mid D^c) = 0.05

เราต้องการหา $P(D \mid +)$ ซึ่งคือความน่าจะเป็นที่บุคคลนั้นเป็นโรคจริง เมื่อทราบว่าผลตรวจเป็นบวก

ก่อนอื่นหาความน่าจะเป็นรวมของการได้ผลบวก ผลตรวจเป็นบวกเกิดได้ 2 ทาง คือ บุคคลนั้นเป็นโรคและตรวจออกมาเป็นบวก หรือบุคคลนั้นไม่ได้เป็นโรคแต่ยังตรวจออกมาเป็นบวก

P(+) = P(+ \mid D)P(D) + P(+ \mid D^c)P(D^c)

P(+) = (0.99)(0.01) + (0.05)(0.99) = 0.0594

ตอนนี้ใช้ทฤษฎีบทของเบย์:

P(D \mid +) = \frac{P(+ \mid D)P(D)}{P(+)} = \frac{(0.99)(0.01)}{0.0594}

P(D \mid +) = \frac{0.0099}{0.0594} = \frac{1}{6} \approx 0.167

ดังนั้นโอกาสที่จะเป็นโรคจริงหลังจากตรวจได้ผลบวก 1 ครั้ง คือประมาณ $16.7\%$ ไม่ใช่ $99\%$ แม้ว่าการตรวจจะมีประสิทธิภาพสูง แต่โรคนี้พบได้น้อย ดังนั้นผลบวกส่วนใหญ่จึงยังมาจากกลุ่มคนจำนวนมากกว่าที่ไม่ได้เป็นโรค

นี่คือบทเรียนสำคัญที่หลายคนมักพลาดไป: แม้การตรวจจะแม่นยำมาก แต่ความน่าจะเป็นแบบ posterior อาจยังไม่สูงมาก หากภาวะนั้นพบได้น้อยตั้งแต่แรก

รูปแบบสองกรณีที่มีประโยชน์ของทฤษฎีบทของเบย์

ถ้าหลักฐานเกิดได้จาก 2 กรณีที่เป็นส่วนเติมเต็มกัน คือ $A$ และ $A^c$ จะได้ว่า

P(B) = P(B \mid A)P(A) + P(B \mid A^c)P(A^c)

เมื่อนำไปใช้ในทฤษฎีบทของเบย์ จะได้

P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B \mid A)P(A) + P(B \mid A^c)P(A^c)}

รูปแบบนี้มักใช้งานได้จริงที่สุดในโจทย์ที่มีสองกรณี

ข้อผิดพลาดที่พบบ่อยในทฤษฎีบทของเบย์

สับสนระหว่าง $P(A \mid B)$ กับ $P(B \mid A)$

โดยทั่วไปความน่าจะเป็นสองค่านี้ไม่เท่ากัน ผลตรวจเป็นบวกอาจมีโอกาสสูงมากเมื่อมีโรคอยู่จริง แต่หลังจากได้ผลบวกแล้ว ความน่าจะเป็นที่จะเป็นโรคจริงก็อาจยังไม่สูงมากนัก

มองข้ามอัตราฐาน

prior หรือ $P(A)$ มีความสำคัญ ถ้า $A$ เกิดขึ้นได้น้อยมาก แม้จะมีหลักฐานที่แรง ก็อาจยังไม่ทำให้ posterior สูงอย่างที่สัญชาตญาณคาดไว้

คำนวณ $P(B)$ แคบเกินไป

ตัวส่วนไม่ใช่แค่พจน์ที่เหลือจากการจัดรูป แต่มันคือความน่าจะเป็นรวมของหลักฐาน และมักต้องรวมผลจากหลายกรณีเข้าด้วยกัน

ใช้สูตรเมื่อ $P(B) = 0$

ทฤษฎีบทของเบย์ในรูปนี้ต้องมีเงื่อนไขว่า $P(B) > 0$ ถ้าหลักฐานมีความน่าจะเป็นเป็น $0$ แล้ว ความน่าจะเป็นแบบมีเงื่อนไข $P(A \mid B)$ จะไม่ถูกนิยามด้วยสูตรพื้นฐานนี้

ทฤษฎีบทของเบย์ใช้เมื่อไร

ทฤษฎีบทของเบย์ปรากฏในงานตรวจทางการแพทย์ การกรองสแปม การวิเคราะห์ความน่าเชื่อถือ การเรียนรู้ของเครื่อง และการอนุมานทางวิทยาศาสตร์ ในทุกกรณี แนวคิดเดียวกันจะปรากฏขึ้นคือ อัปเดตความเชื่อเมื่อมีข้อมูลใหม่เข้ามา

มันมีประโยชน์เป็นพิเศษในสถานการณ์ที่ผู้คนมักตอบสนองต่อหลักฐานมากเกินไป โดยไม่ถามก่อนว่าเหตุการณ์นั้นพบได้บ่อยแค่ไหนตั้งแต่แรก

ลองทำโจทย์ทฤษฎีบทของเบย์ที่คล้ายกัน

ใช้การตรวจโรคแบบเดิม แต่เปลี่ยนอัตราการเกิดโรคจาก $1\%$ เป็น $10\%$ โดยที่ความไวและอัตราผลบวกลวงยังเท่าเดิม แต่ค่า posterior จะเปลี่ยนไปมาก การลองทำเวอร์ชันนี้สักครั้งเป็นวิธีเร็ว ๆ ที่ช่วยให้เห็นชัดว่าทำไม prior จึงสำคัญ

ต้องการความช่วยเหลือในการแก้โจทย์?

อัปโหลดคำถามของคุณแล้วรับคำตอบแบบทีละขั้นตอนที่ผ่านการตรวจสอบในไม่กี่วินาที

เปิด GPAI Solver →