Twierdzenie Bayesa mówi, jak zaktualizować prawdopodobieństwo po zaobserwowaniu nowych danych. Jeśli , to
Odpowiada na bardzo konkretne pytanie: jeśli zaszło zdarzenie , to jak prawdopodobne jest teraz zdarzenie ? Ta idea ma znaczenie w testach medycznych, filtrowaniu spamu i w każdej sytuacji, w której dane mogą wprowadzać w błąd, jeśli nie uwzględnisz też tego, jak częste było dane zdarzenie na początku.
Wzór na twierdzenie Bayesa prostym językiem
Twierdzenie Bayesa łączy trzy elementy:
- zacznij od tego, w co wierzyłeś przed pojawieniem się danych, czyli
- sprawdź, jak dobrze dane pasują do tego zdarzenia, czyli
- przeskaluj wynik przez to, jak często dane występują ogólnie, czyli
Wynik, czyli , nazywa się posterior, czyli prawdopodobieństwem a posteriori.
Co oznacza każda część wzoru
We wzorze
to prior. Jest to początkowe prawdopodobieństwo zdarzenia przed uwzględnieniem nowych danych.
to likelihood. Mówi, jak prawdopodobne są dane , jeśli jest prawdziwe.
to prawdopodobieństwo danych ogółem. Ten składnik jest ważny, ponieważ niektóre dane są częste nawet wtedy, gdy jest fałszywe.
to posterior. Jest to zaktualizowane prawdopodobieństwo zdarzenia po uzyskaniu informacji, że zaszło .
Dlaczego mianownik zmienia odpowiedź
Twierdzenie Bayesa nie tylko premiuje dane, które pasują do Twojej hipotezy. Pyta też, czy te same dane i tak nie pojawiają się często.
Dlatego mianownik ma znaczenie. Jeśli dane są częste w wielu przypadkach, ich zaobserwowanie nie powinno bardzo zmieniać Twojego przekonania. Jeśli dane są rzadkie, z wyjątkiem sytuacji, gdy jest prawdziwe, mogą mocno przesunąć Twoją ocenę.
Krótki dowód z prawdopodobieństwa warunkowego
Załóżmy, że oraz tam, gdzie potrzeba, . Z definicji prawdopodobieństwa warunkowego mamy
oraz
Z drugiego równania wynika, że
Podstaw to do pierwszego równania:
To właśnie jest twierdzenie Bayesa.
Przykład twierdzenia Bayesa: dodatni wynik testu medycznego
Załóżmy, że pewna choroba dotyczy populacji. Test ma czułość i odsetek wyników fałszywie dodatnich równy .
Niech
- = osoba ma chorobę
- = wynik testu jest dodatni
Wtedy
Szukamy , czyli prawdopodobieństwa, że osoba rzeczywiście ma chorobę przy dodatnim wyniku testu.
Najpierw wyznaczmy całkowite prawdopodobieństwo wyniku dodatniego. Dodatni wynik może pojawić się na dwa sposoby: osoba ma chorobę i test wychodzi dodatni albo osoba nie ma choroby, a test mimo to wychodzi dodatni.
Teraz zastosujmy twierdzenie Bayesa:
Zatem prawdopodobieństwo rzeczywistego występowania choroby po jednym dodatnim wyniku testu wynosi około , a nie . Test jest dobry, ale choroba jest rzadka, więc większość dodatnich wyników nadal pochodzi z dużo większej grupy osób bez choroby.
To jest główna lekcja, którą wiele osób pomija: nawet dobry test może dawać umiarkowane prawdopodobieństwo a posteriori, jeśli dana choroba jest na początku rzadka.
Przydatna wersja twierdzenia Bayesa dla dwóch przypadków
Jeśli dane mogą pochodzić z dwóch dopełniających się przypadków, oraz , to
Po użyciu tego we wzorze Bayesa otrzymujemy
Ta postać jest często najbardziej praktyczna w zadaniach z dwoma przypadkami.
Typowe błędy w twierdzeniu Bayesa
Mylenie z
Te prawdopodobieństwa zwykle nie są równe. Dodatni wynik testu może być bardzo prawdopodobny przy obecności choroby, a mimo to sama choroba może nadal być dość mało prawdopodobna po dodatnim wyniku.
Pomijanie częstości bazowej
Prior ma znaczenie. Jeśli jest bardzo rzadkie, to nawet mocne dane mogą nie podnieść posterior tak wysoko, jak podpowiada intuicja.
Zbyt wąskie liczenie
Mianownik nie jest tylko „pozostałym” składnikiem. To całkowite prawdopodobieństwo danych i często wymaga zsumowania wkładów z wielu przypadków.
Używanie wzoru, gdy
Twierdzenie Bayesa w tej postaci wymaga, aby . Jeśli dane mają prawdopodobieństwo , to prawdopodobieństwo warunkowe nie jest określone przez podstawowy wzór.
Kiedy stosuje się twierdzenie Bayesa
Twierdzenie Bayesa pojawia się w testach medycznych, filtrowaniu spamu, analizie niezawodności, uczeniu maszynowym i wnioskowaniu naukowym. W każdym z tych przypadków pojawia się ta sama idea: aktualizacja przekonania po otrzymaniu nowych informacji.
Jest szczególnie przydatne wtedy, gdy ludzie mają tendencję do zbyt silnego reagowania na dane bez pytania, jak częste było dane zdarzenie na początku.
Spróbuj podobnego zadania z twierdzeniem Bayesa
Zachowaj ten sam test medyczny, ale zmień częstość choroby z na . Czułość i odsetek wyników fałszywie dodatnich pozostają takie same, ale posterior zmienia się bardzo wyraźnie. Przepracowanie tej wersji to szybki sposób, by poczuć, dlaczego prior ma znaczenie.
Potrzebujesz pomocy z zadaniem?
Prześlij pytanie i otrzymaj zweryfikowane rozwiązanie krok po kroku w kilka sekund.
Otwórz GPAI Solver →