ทฤษฎีบทของเบย์บอกวิธีอัปเดตความน่าจะเป็นหลังจากเห็นหลักฐานใหม่ ถ้า P(B)>0P(B) > 0 แล้ว

P(AB)=P(BA)P(A)P(B)P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B)}

มันตอบคำถามที่เฉพาะมากว่า หลังจากเหตุการณ์ BB เกิดขึ้นแล้ว ตอนนี้เหตุการณ์ AA มีโอกาสเกิดมากน้อยแค่ไหน แนวคิดนี้สำคัญในงานตรวจทางการแพทย์ การกรองสแปม และทุกสถานการณ์ที่หลักฐานอาจทำให้เข้าใจผิดได้ หากเราไม่คำนึงด้วยว่าเหตุการณ์นั้นพบได้บ่อยแค่ไหนตั้งแต่แรก

สูตรทฤษฎีบทของเบย์แบบภาษาง่าย ๆ

ทฤษฎีบทของเบย์รวมองค์ประกอบ 3 อย่างเข้าด้วยกัน:

  • เริ่มจากสิ่งที่คุณเชื่อก่อนเห็นหลักฐาน คือ P(A)P(A)
  • ถามว่าหลักฐานสอดคล้องกับเหตุการณ์นั้นมากแค่ไหน คือ P(BA)P(B \mid A)
  • ปรับด้วยความพบบ่อยของหลักฐานนั้นโดยรวม คือ P(B)P(B)

ผลลัพธ์ P(AB)P(A \mid B) เรียกว่า ความน่าจะเป็นแบบ posterior

แต่ละส่วนของสูตรหมายถึงอะไร

ในสูตร

P(AB)=P(BA)P(A)P(B)P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B)}

P(A)P(A) คือ prior เป็นความน่าจะเป็นตั้งต้นของ AA ก่อนที่คุณจะใช้หลักฐานใหม่

P(BA)P(B \mid A) คือ likelihood มันบอกว่าหลักฐาน BB มีโอกาสเกิดมากแค่ไหนถ้า AA เป็นจริง

P(B)P(B) คือความน่าจะเป็นของหลักฐานโดยรวม พจน์นี้สำคัญ เพราะหลักฐานบางอย่างอาจพบได้บ่อยแม้ในกรณีที่ AA เป็นเท็จ

P(AB)P(A \mid B) คือ posterior เป็นความน่าจะเป็นของ AA ที่อัปเดตแล้วหลังจากรู้ว่า BB เกิดขึ้น

ทำไมตัวส่วนจึงเปลี่ยนคำตอบ

ทฤษฎีบทของเบย์ไม่ได้ให้ค่าน้ำหนักกับหลักฐานที่เข้ากับสมมติฐานของคุณเท่านั้น มันยังถามด้วยว่าหลักฐานแบบเดียวกันนี้เกิดขึ้นบ่อยอยู่แล้วหรือไม่

นั่นจึงเป็นเหตุผลว่าทำไมตัวส่วน P(B)P(B) จึงสำคัญ ถ้าหลักฐานนี้พบได้ทั่วไปในหลายกรณี การเห็นมันไม่ควรเปลี่ยนความเชื่อของคุณมากนัก แต่ถ้าหลักฐานนี้พบได้น้อย ยกเว้นเมื่อ AA เป็นจริง มันก็อาจเปลี่ยนความเชื่อของคุณได้มาก

การพิสูจน์สั้น ๆ จากความน่าจะเป็นแบบมีเงื่อนไข

สมมติว่า P(B)>0P(B) > 0 และเมื่อจำเป็นให้มี P(A)>0P(A) > 0 จากนิยามของความน่าจะเป็นแบบมีเงื่อนไข

P(AB)=P(AB)P(B)P(A \mid B) = \frac{P(A \cap B)}{P(B)}

และ

P(BA)=P(AB)P(A)P(B \mid A) = \frac{P(A \cap B)}{P(A)}

จากสมการที่สอง

P(AB)=P(BA)P(A)P(A \cap B) = P(B \mid A)P(A)

แทนค่านี้ลงในสมการแรก จะได้

P(AB)=P(BA)P(A)P(B)P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B)}

นี่คือทฤษฎีบทของเบย์

ตัวอย่างทฤษฎีบทของเบย์: ผลตรวจโรคเป็นบวก

สมมติว่าโรคชนิดหนึ่งพบในประชากร 1%1\% การตรวจมีความไว 99%99\% และมีอัตราผลบวกลวง 5%5\%

ให้

  • DD = บุคคลนั้นเป็นโรค
  • ++ = ผลตรวจเป็นบวก

ดังนั้น

P(D)=0.01P(D) = 0.01 P(+D)=0.99P(+ \mid D) = 0.99 P(+Dc)=0.05P(+ \mid D^c) = 0.05

เราต้องการหา P(D+)P(D \mid +) ซึ่งคือความน่าจะเป็นที่บุคคลนั้นเป็นโรคจริง เมื่อทราบว่าผลตรวจเป็นบวก

ก่อนอื่นหาความน่าจะเป็นรวมของการได้ผลบวก ผลตรวจเป็นบวกเกิดได้ 2 ทาง คือ บุคคลนั้นเป็นโรคและตรวจออกมาเป็นบวก หรือบุคคลนั้นไม่ได้เป็นโรคแต่ยังตรวจออกมาเป็นบวก

P(+)=P(+D)P(D)+P(+Dc)P(Dc)P(+) = P(+ \mid D)P(D) + P(+ \mid D^c)P(D^c) P(+)=(0.99)(0.01)+(0.05)(0.99)=0.0594P(+) = (0.99)(0.01) + (0.05)(0.99) = 0.0594

ตอนนี้ใช้ทฤษฎีบทของเบย์:

P(D+)=P(+D)P(D)P(+)=(0.99)(0.01)0.0594P(D \mid +) = \frac{P(+ \mid D)P(D)}{P(+)} = \frac{(0.99)(0.01)}{0.0594} P(D+)=0.00990.0594=160.167P(D \mid +) = \frac{0.0099}{0.0594} = \frac{1}{6} \approx 0.167

ดังนั้นโอกาสที่จะเป็นโรคจริงหลังจากตรวจได้ผลบวก 1 ครั้ง คือประมาณ 16.7%16.7\% ไม่ใช่ 99%99\% แม้ว่าการตรวจจะมีประสิทธิภาพสูง แต่โรคนี้พบได้น้อย ดังนั้นผลบวกส่วนใหญ่จึงยังมาจากกลุ่มคนจำนวนมากกว่าที่ไม่ได้เป็นโรค

นี่คือบทเรียนสำคัญที่หลายคนมักพลาดไป: แม้การตรวจจะแม่นยำมาก แต่ความน่าจะเป็นแบบ posterior อาจยังไม่สูงมาก หากภาวะนั้นพบได้น้อยตั้งแต่แรก

รูปแบบสองกรณีที่มีประโยชน์ของทฤษฎีบทของเบย์

ถ้าหลักฐานเกิดได้จาก 2 กรณีที่เป็นส่วนเติมเต็มกัน คือ AA และ AcA^c จะได้ว่า

P(B)=P(BA)P(A)+P(BAc)P(Ac)P(B) = P(B \mid A)P(A) + P(B \mid A^c)P(A^c)

เมื่อนำไปใช้ในทฤษฎีบทของเบย์ จะได้

P(AB)=P(BA)P(A)P(BA)P(A)+P(BAc)P(Ac)P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B \mid A)P(A) + P(B \mid A^c)P(A^c)}

รูปแบบนี้มักใช้งานได้จริงที่สุดในโจทย์ที่มีสองกรณี

ข้อผิดพลาดที่พบบ่อยในทฤษฎีบทของเบย์

สับสนระหว่าง P(AB)P(A \mid B) กับ P(BA)P(B \mid A)

โดยทั่วไปความน่าจะเป็นสองค่านี้ไม่เท่ากัน ผลตรวจเป็นบวกอาจมีโอกาสสูงมากเมื่อมีโรคอยู่จริง แต่หลังจากได้ผลบวกแล้ว ความน่าจะเป็นที่จะเป็นโรคจริงก็อาจยังไม่สูงมากนัก

มองข้ามอัตราฐาน

prior หรือ P(A)P(A) มีความสำคัญ ถ้า AA เกิดขึ้นได้น้อยมาก แม้จะมีหลักฐานที่แรง ก็อาจยังไม่ทำให้ posterior สูงอย่างที่สัญชาตญาณคาดไว้

คำนวณ P(B)P(B) แคบเกินไป

ตัวส่วนไม่ใช่แค่พจน์ที่เหลือจากการจัดรูป แต่มันคือความน่าจะเป็นรวมของหลักฐาน และมักต้องรวมผลจากหลายกรณีเข้าด้วยกัน

ใช้สูตรเมื่อ P(B)=0P(B) = 0

ทฤษฎีบทของเบย์ในรูปนี้ต้องมีเงื่อนไขว่า P(B)>0P(B) > 0 ถ้าหลักฐานมีความน่าจะเป็นเป็น 00 แล้ว ความน่าจะเป็นแบบมีเงื่อนไข P(AB)P(A \mid B) จะไม่ถูกนิยามด้วยสูตรพื้นฐานนี้

ทฤษฎีบทของเบย์ใช้เมื่อไร

ทฤษฎีบทของเบย์ปรากฏในงานตรวจทางการแพทย์ การกรองสแปม การวิเคราะห์ความน่าเชื่อถือ การเรียนรู้ของเครื่อง และการอนุมานทางวิทยาศาสตร์ ในทุกกรณี แนวคิดเดียวกันจะปรากฏขึ้นคือ อัปเดตความเชื่อเมื่อมีข้อมูลใหม่เข้ามา

มันมีประโยชน์เป็นพิเศษในสถานการณ์ที่ผู้คนมักตอบสนองต่อหลักฐานมากเกินไป โดยไม่ถามก่อนว่าเหตุการณ์นั้นพบได้บ่อยแค่ไหนตั้งแต่แรก

ลองทำโจทย์ทฤษฎีบทของเบย์ที่คล้ายกัน

ใช้การตรวจโรคแบบเดิม แต่เปลี่ยนอัตราการเกิดโรคจาก 1%1\% เป็น 10%10\% โดยที่ความไวและอัตราผลบวกลวงยังเท่าเดิม แต่ค่า posterior จะเปลี่ยนไปมาก การลองทำเวอร์ชันนี้สักครั้งเป็นวิธีเร็ว ๆ ที่ช่วยให้เห็นชัดว่าทำไม prior จึงสำคัญ

ต้องการความช่วยเหลือในการแก้โจทย์?

อัปโหลดคำถามของคุณแล้วรับคำตอบแบบทีละขั้นตอนที่ผ่านการตรวจสอบในไม่กี่วินาที

เปิด GPAI Solver →