Teorema Bayes memberi tahu cara memperbarui suatu probabilitas setelah melihat bukti baru. Jika P(B)>0P(B) > 0, maka

P(AB)=P(BA)P(A)P(B)P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B)}

Teorema ini menjawab pertanyaan yang sangat spesifik: setelah kejadian BB terjadi, seberapa besar kemungkinan kejadian AA sekarang? Gagasan ini penting dalam tes medis, penyaringan spam, dan situasi apa pun ketika bukti bisa menyesatkan jika Anda tidak memperhitungkan seberapa umum kejadian itu sejak awal.

Rumus teorema Bayes dalam bahasa sederhana

Teorema Bayes menggabungkan tiga unsur:

  • mulai dari apa yang Anda yakini sebelum melihat bukti, P(A)P(A)
  • tanyakan seberapa sesuai bukti itu dengan kejadian tersebut, P(BA)P(B \mid A)
  • sesuaikan dengan seberapa umum bukti itu secara keseluruhan, P(B)P(B)

Hasilnya, P(AB)P(A \mid B), disebut probabilitas posterior.

Arti setiap bagian dalam rumus

Dalam

P(AB)=P(BA)P(A)P(B)P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B)}

P(A)P(A) adalah prior. Ini adalah probabilitas awal Anda untuk AA sebelum menggunakan bukti baru.

P(BA)P(B \mid A) adalah likelihood. Ini memberi tahu seberapa mungkin bukti BB muncul jika AA benar.

P(B)P(B) adalah probabilitas bukti secara keseluruhan. Suku ini penting karena beberapa bukti umum terjadi bahkan ketika AA salah.

P(AB)P(A \mid B) adalah posterior. Ini adalah probabilitas AA yang telah diperbarui setelah mengetahui bahwa BB terjadi.

Mengapa penyebut mengubah jawabannya

Teorema Bayes tidak hanya memberi bobot lebih pada bukti yang cocok dengan hipotesis Anda. Teorema ini juga menanyakan apakah bukti yang sama memang sering muncul.

Itulah sebabnya penyebut P(B)P(B) penting. Jika bukti itu umum di banyak kasus, melihatnya seharusnya tidak banyak mengubah keyakinan Anda. Jika bukti itu jarang muncul kecuali saat AA benar, bukti tersebut bisa sangat menggeser keyakinan Anda.

Pembuktian singkat dari probabilitas bersyarat

Asumsikan P(B)>0P(B) > 0 dan P(A)>0P(A) > 0 bila diperlukan. Berdasarkan definisi probabilitas bersyarat,

P(AB)=P(AB)P(B)P(A \mid B) = \frac{P(A \cap B)}{P(B)}

dan

P(BA)=P(AB)P(A)P(B \mid A) = \frac{P(A \cap B)}{P(A)}

Dari persamaan kedua,

P(AB)=P(BA)P(A)P(A \cap B) = P(B \mid A)P(A)

Substitusikan ke persamaan pertama:

P(AB)=P(BA)P(A)P(B)P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B)}

Itulah teorema Bayes.

Contoh teorema Bayes: hasil tes medis positif

Misalkan suatu penyakit menyerang 1%1\% dari suatu populasi. Sebuah tes memiliki sensitivitas 99%99\% dan tingkat positif palsu 5%5\%.

Misalkan

  • DD = orang tersebut memiliki penyakit
  • ++ = hasil tes positif

Maka

P(D)=0.01P(D) = 0.01 P(+D)=0.99P(+ \mid D) = 0.99 P(+Dc)=0.05P(+ \mid D^c) = 0.05

Kita ingin mencari P(D+)P(D \mid +), yaitu probabilitas bahwa seseorang benar-benar memiliki penyakit jika hasil tesnya positif.

Pertama, cari probabilitas keseluruhan dari hasil positif. Hasil tes positif bisa terjadi dengan dua cara: orang tersebut memiliki penyakit dan hasil tesnya positif, atau orang tersebut tidak memiliki penyakit tetapi tetap mendapat hasil positif.

P(+)=P(+D)P(D)+P(+Dc)P(Dc)P(+) = P(+ \mid D)P(D) + P(+ \mid D^c)P(D^c) P(+)=(0.99)(0.01)+(0.05)(0.99)=0.0594P(+) = (0.99)(0.01) + (0.05)(0.99) = 0.0594

Sekarang terapkan teorema Bayes:

P(D+)=P(+D)P(D)P(+)=(0.99)(0.01)0.0594P(D \mid +) = \frac{P(+ \mid D)P(D)}{P(+)} = \frac{(0.99)(0.01)}{0.0594} P(D+)=0.00990.0594=160.167P(D \mid +) = \frac{0.0099}{0.0594} = \frac{1}{6} \approx 0.167

Jadi peluang benar-benar memiliki penyakit setelah satu hasil tes positif adalah sekitar 16.7%16.7\%, bukan 99%99\%. Tesnya memang kuat, tetapi penyakitnya jarang, sehingga sebagian besar hasil positif tetap berasal dari kelompok yang jauh lebih besar, yaitu orang yang tidak memiliki penyakit.

Inilah pelajaran utama yang sering terlewat: bahkan tes yang kuat pun bisa menghasilkan probabilitas posterior yang tidak terlalu besar ketika kondisi tersebut memang langka sejak awal.

Versi teorema Bayes dua kasus yang berguna

Jika bukti dapat berasal dari dua kasus yang saling komplemen, AA dan AcA^c, maka

P(B)=P(BA)P(A)+P(BAc)P(Ac)P(B) = P(B \mid A)P(A) + P(B \mid A^c)P(A^c)

Menggunakan ini dalam teorema Bayes menghasilkan

P(AB)=P(BA)P(A)P(BA)P(A)+P(BAc)P(Ac)P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B \mid A)P(A) + P(B \mid A^c)P(A^c)}

Bentuk ini sering menjadi yang paling praktis dalam soal dua kasus.

Kesalahan umum dalam teorema Bayes

Tertukar antara P(AB)P(A \mid B) dan P(BA)P(B \mid A)

Probabilitas ini biasanya tidak sama. Hasil tes positif bisa sangat mungkin terjadi ketika penyakit ada, tetapi penyakit itu sendiri tetap bisa cukup tidak mungkin setelah hasil tes positif.

Mengabaikan base rate

Prior P(A)P(A) itu penting. Jika AA sangat jarang, maka bahkan bukti yang kuat pun mungkin tidak mendorong posterior setinggi yang diperkirakan intuisi.

Menghitung P(B)P(B) terlalu sempit

Penyebut bukan sekadar suku sisa. Ini adalah probabilitas total dari bukti dan sering kali memerlukan penjumlahan kontribusi dari beberapa kasus.

Menggunakan rumus saat P(B)=0P(B) = 0

Teorema Bayes dalam bentuk ini mensyaratkan P(B)>0P(B) > 0. Jika bukti memiliki probabilitas 00, maka probabilitas bersyarat P(AB)P(A \mid B) tidak terdefinisi oleh rumus dasar.

Kapan teorema Bayes digunakan

Teorema Bayes muncul dalam tes medis, penyaringan spam, analisis keandalan, machine learning, dan inferensi ilmiah. Dalam setiap kasus, gagasan yang sama muncul: perbarui keyakinan ketika informasi baru datang.

Teorema ini sangat berguna ketika orang cenderung bereaksi berlebihan terhadap bukti tanpa menanyakan seberapa umum kejadian itu sejak awal.

Coba soal teorema Bayes yang mirip

Gunakan tes medis yang sama, tetapi ubah tingkat penyakit dari 1%1\% menjadi 10%10\%. Sensitivitas dan tingkat positif palsu tetap sama, tetapi posterior berubah banyak. Mengerjakan versi ini sekali adalah cara cepat untuk merasakan mengapa prior itu penting.

Butuh bantuan mengerjakan soal?

Unggah pertanyaanmu dan dapatkan solusi terverifikasi langkah demi langkah dalam hitungan detik.

Buka GPAI Solver →