Der Satz von Bayes zeigt dir, wie du eine Wahrscheinlichkeit nach dem Beobachten neuer Hinweise aktualisierst. Wenn gilt, dann
Er beantwortet eine sehr konkrete Frage: Wie wahrscheinlich ist Ereignis jetzt, nachdem Ereignis eingetreten ist? Die Idee ist wichtig bei medizinischen Tests, Spam-Filtern und in jeder Situation, in der Hinweise irreführend sein können, wenn man nicht auch berücksichtigt, wie häufig das Ereignis von Anfang an war.
Die Formel des Satzes von Bayes einfach erklärt
Der Satz von Bayes kombiniert drei Bestandteile:
- beginne mit dem, was du vor dem Hinweis geglaubt hast,
- frage, wie gut der Hinweis zu diesem Ereignis passt,
- skaliere mit der Gesamtwahrscheinlichkeit des Hinweises,
Das Ergebnis heißt Posterior-Wahrscheinlichkeit.
Was die einzelnen Teile der Formel bedeuten
In
ist die Prior-Wahrscheinlichkeit. Sie ist deine Ausgangswahrscheinlichkeit für , bevor du den neuen Hinweis verwendest.
ist die Likelihood. Sie sagt dir, wie wahrscheinlich der Hinweis ist, wenn wahr ist.
ist die Wahrscheinlichkeit des Hinweises insgesamt. Dieser Term ist wichtig, weil manche Hinweise häufig auftreten, selbst wenn falsch ist.
ist die Posterior-Wahrscheinlichkeit. Sie ist die aktualisierte Wahrscheinlichkeit von , nachdem du erfahren hast, dass eingetreten ist.
Warum der Nenner die Antwort verändert
Der Satz von Bayes belohnt nicht einfach nur Hinweise, die zu deiner Hypothese passen. Er fragt auch, ob derselbe Hinweis ohnehin oft auftritt.
Deshalb ist der Nenner wichtig. Wenn der Hinweis in vielen Fällen häufig vorkommt, sollte seine Beobachtung deine Einschätzung nicht stark verändern. Wenn der Hinweis selten ist, außer wenn wahr ist, kann er deine Einschätzung stark verschieben.
Kurzer Beweis aus der bedingten Wahrscheinlichkeit
Nimm an, dass gilt und wo nötig auch . Nach der Definition der bedingten Wahrscheinlichkeit gilt
und
Aus der zweiten Gleichung folgt
Setze das in die erste Gleichung ein:
Das ist der Satz von Bayes.
Durchgerechnetes Beispiel zum Satz von Bayes: ein positiver medizinischer Test
Angenommen, eine Krankheit betrifft einer Bevölkerung. Ein Test hat eine Sensitivität von und eine Falsch-Positiv-Rate von .
Sei
- = die Person hat die Krankheit
- = der Test ist positiv
Dann gilt
Gesucht ist , also die Wahrscheinlichkeit, dass eine Person die Krankheit tatsächlich hat, wenn der Test positiv ist.
Bestimme zuerst die Gesamtwahrscheinlichkeit eines positiven Ergebnisses. Ein positiver Test kann auf zwei Arten entstehen: Die Person hat die Krankheit und testet positiv, oder die Person hat die Krankheit nicht und testet trotzdem positiv.
Wende jetzt den Satz von Bayes an:
Die Wahrscheinlichkeit, nach einem positiven Test die Krankheit tatsächlich zu haben, liegt also bei etwa und nicht bei . Der Test ist stark, aber die Krankheit ist selten, daher stammen die meisten positiven Ergebnisse trotzdem aus der viel größeren Gruppe ohne Krankheit.
Das ist die wichtigste Lehre, die viele Menschen übersehen: Selbst ein guter Test kann nur zu einer mäßigen Posterior-Wahrscheinlichkeit führen, wenn die Krankheit von vornherein selten ist.
Eine nützliche Zwei-Fälle-Version des Satzes von Bayes
Wenn der Hinweis aus zwei komplementären Fällen, und , stammen kann, dann gilt
Setzt man das in den Satz von Bayes ein, erhält man
Diese Form ist in Aufgaben mit zwei Fällen oft die praktischste.
Häufige Fehler beim Satz von Bayes
und verwechseln
Diese Wahrscheinlichkeiten sind normalerweise nicht gleich. Ein positiver Test kann sehr wahrscheinlich sein, wenn eine Krankheit vorliegt, während die Krankheit nach einem positiven Test trotzdem noch eher unwahrscheinlich sein kann.
Die Basisrate ignorieren
Die Prior-Wahrscheinlichkeit ist wichtig. Wenn sehr selten ist, dann bringt selbst starke Evidenz die Posterior-Wahrscheinlichkeit vielleicht nicht so weit nach oben, wie man intuitiv erwartet.
zu eng berechnen
Der Nenner ist nicht nur ein übrig gebliebener Term. Er ist die Gesamtwahrscheinlichkeit des Hinweises und erfordert oft, Beiträge aus mehreren Fällen zu addieren.
Die Formel verwenden, wenn
Der Satz von Bayes in dieser Form setzt voraus. Wenn der Hinweis die Wahrscheinlichkeit hat, ist die bedingte Wahrscheinlichkeit durch die Grundformel nicht definiert.
Wann der Satz von Bayes verwendet wird
Der Satz von Bayes taucht bei medizinischen Tests, Spam-Filtern, Zuverlässigkeitsanalysen, maschinellem Lernen und wissenschaftlicher Inferenz auf. In jedem Fall erscheint dieselbe Idee: Aktualisiere eine Einschätzung, wenn neue Informationen eintreffen.
Er ist besonders nützlich, wenn Menschen dazu neigen, auf Hinweise überzureagieren, ohne zu fragen, wie häufig das Ereignis überhaupt von Anfang an war.
Probiere eine ähnliche Aufgabe zum Satz von Bayes
Behalte denselben medizinischen Test bei, aber ändere die Krankheitsrate von auf . Sensitivität und Falsch-Positiv-Rate bleiben gleich, aber die Posterior-Wahrscheinlichkeit ändert sich stark. Diese Variante einmal durchzurechnen ist ein schneller Weg, um zu spüren, warum die Prior-Wahrscheinlichkeit wichtig ist.
Brauchst du Hilfe bei einer Aufgabe?
Lade deine Frage hoch und erhalte in Sekunden eine verifizierte Schritt-für-Schritt-Lösung.
GPAI Solver öffnen →