Định lý Bayes cho biết cách cập nhật một xác suất sau khi có bằng chứng mới. Nếu P(B)>0P(B) > 0, thì

P(AB)=P(BA)P(A)P(B)P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B)}

Nó trả lời một câu hỏi rất cụ thể: sau khi sự kiện BB đã xảy ra, bây giờ sự kiện AA có khả năng xảy ra đến mức nào? Ý tưởng này rất quan trọng trong xét nghiệm y khoa, lọc thư rác và mọi tình huống mà bằng chứng có thể gây hiểu lầm nếu bạn không tính đến việc sự kiện đó phổ biến đến đâu ngay từ đầu.

Công thức định lý Bayes theo cách dễ hiểu

Định lý Bayes kết hợp ba thành phần:

  • bắt đầu từ điều bạn tin trước khi có bằng chứng, P(A)P(A)
  • xem bằng chứng phù hợp với sự kiện đó đến mức nào, P(BA)P(B \mid A)
  • điều chỉnh theo mức độ phổ biến của bằng chứng nói chung, P(B)P(B)

Kết quả P(AB)P(A \mid B) được gọi là xác suất hậu nghiệm.

Ý nghĩa của từng phần trong công thức

Trong

P(AB)=P(BA)P(A)P(B)P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B)}

P(A)P(A) là xác suất tiên nghiệm. Đây là xác suất ban đầu của AA trước khi bạn dùng bằng chứng mới.

P(BA)P(B \mid A)likelihood. Nó cho biết bằng chứng BB có khả năng xuất hiện đến mức nào nếu AA là đúng.

P(B)P(B) là xác suất của bằng chứng xét trên toàn bộ các trường hợp. Thành phần này quan trọng vì có những bằng chứng vẫn thường xuất hiện ngay cả khi AA là sai.

P(AB)P(A \mid B) là xác suất hậu nghiệm. Đây là xác suất đã được cập nhật của AA sau khi biết rằng BB đã xảy ra.

Vì sao mẫu số làm thay đổi kết quả

Định lý Bayes không chỉ tăng trọng số cho những bằng chứng phù hợp với giả thuyết của bạn. Nó còn hỏi liệu chính bằng chứng đó có thường xảy ra dù sao đi nữa hay không.

Đó là lý do mẫu số P(B)P(B) rất quan trọng. Nếu bằng chứng phổ biến trong nhiều trường hợp, thì việc quan sát thấy nó không nên làm thay đổi niềm tin của bạn quá nhiều. Nếu bằng chứng hiếm, trừ khi AA là đúng, thì nó có thể làm thay đổi niềm tin của bạn rất mạnh.

Chứng minh ngắn từ xác suất có điều kiện

Giả sử P(B)>0P(B) > 0 và khi cần thì P(A)>0P(A) > 0. Theo định nghĩa của xác suất có điều kiện,

P(AB)=P(AB)P(B)P(A \mid B) = \frac{P(A \cap B)}{P(B)}

P(BA)=P(AB)P(A)P(B \mid A) = \frac{P(A \cap B)}{P(A)}

Từ phương trình thứ hai,

P(AB)=P(BA)P(A)P(A \cap B) = P(B \mid A)P(A)

Thế vào phương trình thứ nhất:

P(AB)=P(BA)P(A)P(B)P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B)}

Đó chính là định lý Bayes.

Ví dụ định lý Bayes có lời giải: xét nghiệm y khoa dương tính

Giả sử một căn bệnh ảnh hưởng đến 1%1\% dân số. Một xét nghiệm có độ nhạy 99%99\% và tỷ lệ dương tính giả là 5%5\%.

Đặt

  • DD = người đó mắc bệnh
  • ++ = kết quả xét nghiệm dương tính

Khi đó

P(D)=0.01P(D) = 0.01 P(+D)=0.99P(+ \mid D) = 0.99 P(+Dc)=0.05P(+ \mid D^c) = 0.05

Ta cần tìm P(D+)P(D \mid +), tức xác suất một người thực sự mắc bệnh khi biết rằng kết quả xét nghiệm là dương tính.

Trước hết, hãy tìm xác suất tổng thể để có kết quả dương tính. Một kết quả dương tính có thể xảy ra theo hai cách: người đó mắc bệnh và xét nghiệm dương tính, hoặc người đó không mắc bệnh nhưng vẫn cho kết quả dương tính.

P(+)=P(+D)P(D)+P(+Dc)P(Dc)P(+) = P(+ \mid D)P(D) + P(+ \mid D^c)P(D^c) P(+)=(0.99)(0.01)+(0.05)(0.99)=0.0594P(+) = (0.99)(0.01) + (0.05)(0.99) = 0.0594

Bây giờ áp dụng định lý Bayes:

P(D+)=P(+D)P(D)P(+)=(0.99)(0.01)0.0594P(D \mid +) = \frac{P(+ \mid D)P(D)}{P(+)} = \frac{(0.99)(0.01)}{0.0594} P(D+)=0.00990.0594=160.167P(D \mid +) = \frac{0.0099}{0.0594} = \frac{1}{6} \approx 0.167

Vậy xác suất thực sự mắc bệnh sau một lần xét nghiệm dương tính chỉ khoảng 16.7%16.7\%, chứ không phải 99%99\%. Xét nghiệm này mạnh, nhưng bệnh lại hiếm, nên phần lớn kết quả dương tính vẫn đến từ nhóm đông hơn nhiều là những người không mắc bệnh.

Đây là bài học chính mà nhiều người bỏ sót: ngay cả một xét nghiệm tốt cũng có thể cho xác suất hậu nghiệm không quá cao nếu tình trạng đó vốn hiếm ngay từ đầu.

Một dạng hai trường hợp hữu ích của định lý Bayes

Nếu bằng chứng có thể đến từ hai trường hợp bù nhau là AAAcA^c, thì

P(B)=P(BA)P(A)+P(BAc)P(Ac)P(B) = P(B \mid A)P(A) + P(B \mid A^c)P(A^c)

Dùng biểu thức đó trong định lý Bayes, ta được

P(AB)=P(BA)P(A)P(BA)P(A)+P(BAc)P(Ac)P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B \mid A)P(A) + P(B \mid A^c)P(A^c)}

Dạng này thường là dạng thực tế nhất trong các bài toán chỉ có hai trường hợp.

Những lỗi thường gặp khi dùng định lý Bayes

Nhầm lẫn giữa P(AB)P(A \mid B)P(BA)P(B \mid A)

Hai xác suất này thường không bằng nhau. Một kết quả xét nghiệm dương tính có thể rất dễ xảy ra khi có bệnh, nhưng sau khi có kết quả dương tính thì khả năng mắc bệnh vẫn có thể khá thấp.

Bỏ qua tỷ lệ nền

Xác suất tiên nghiệm P(A)P(A) rất quan trọng. Nếu AA rất hiếm, thì ngay cả bằng chứng mạnh cũng có thể không đẩy xác suất hậu nghiệm lên cao như trực giác mong đợi.

Tính P(B)P(B) quá hẹp

Mẫu số không chỉ là một thành phần còn sót lại. Nó là xác suất tổng thể của bằng chứng và thường cần cộng các đóng góp từ nhiều trường hợp.

Dùng công thức khi P(B)=0P(B) = 0

Định lý Bayes ở dạng này yêu cầu P(B)>0P(B) > 0. Nếu bằng chứng có xác suất bằng 00, thì xác suất có điều kiện P(AB)P(A \mid B) không được xác định theo công thức cơ bản.

Khi nào định lý Bayes được sử dụng

Định lý Bayes xuất hiện trong xét nghiệm y khoa, lọc thư rác, phân tích độ tin cậy, học máy và suy luận khoa học. Trong mỗi trường hợp, cùng một ý tưởng được dùng: cập nhật niềm tin khi có thông tin mới.

Nó đặc biệt hữu ích khi con người có xu hướng phản ứng quá mức với bằng chứng mà không tự hỏi sự kiện đó phổ biến đến đâu ngay từ đầu.

Hãy thử một bài toán định lý Bayes tương tự

Giữ nguyên xét nghiệm y khoa như trên, nhưng đổi tỷ lệ mắc bệnh từ 1%1\% thành 10%10\%. Độ nhạy và tỷ lệ dương tính giả vẫn giữ nguyên, nhưng xác suất hậu nghiệm sẽ thay đổi rất nhiều. Tự làm phiên bản này một lần là cách nhanh để cảm nhận vì sao xác suất tiên nghiệm lại quan trọng.

Cần trợ giúp giải bài?

Tải câu hỏi lên và nhận lời giải từng bước đã được xác minh trong vài giây.

Mở GPAI Solver →