Die logistische Regression ist ein Modell für die binäre Klassifikation. Sie kombiniert die Eingangsmerkmale zu einem linearen Score, schickt diesen Score durch die Sigmoidfunktion und erzeugt eine Zahl zwischen und , die unter dem angepassten Modell als geschätzte Wahrscheinlichkeit der positiven Klasse interpretiert wird.
Trotz ihres Namens wird die logistische Regression meist verwendet, um zwischen zwei Klassen zu entscheiden, etwa bestanden/nicht bestanden, Spam/kein Spam oder Kreditausfall/kein Kreditausfall. Das Wort „Regression“ bezieht sich auf die lineare Formel im Modell, nicht auf die Vorhersage eines kontinuierlichen Werts.
Formel der logistischen Regression im Überblick
Die binäre logistische Regression verwendet
mit der Sigmoidfunktion
Der lineare Teil kann jede reelle Zahl sein. Die Sigmoidfunktion presst diesen Wert in das Intervall , weshalb die Ausgabe als Wahrscheinlichkeitsschätzung verwendet werden kann.
Warum die Sigmoidfunktion wichtig ist
Wenn du den rohen linearen Score als Wahrscheinlichkeit verwenden würdest, könntest du unmögliche Werte wie oder erhalten. Die Sigmoidfunktion behebt das, indem sie große negative Scores nahe an , große positive Scores nahe an und Scores nahe nahe an abbildet.
Das ergibt eine praktische Deutung:
- wenn stark negativ ist, tendiert das Modell zu Klasse
- wenn nahe liegt, ist das Modell unsicher
- wenn stark positiv ist, tendiert das Modell zu Klasse
Die Kurve ist in der Nähe von am steilsten. Deshalb kann eine kleine Änderung im Score die Wahrscheinlichkeit nahe stark verändern, aber deutlich weniger, wenn die Wahrscheinlichkeit bereits nahe oder liegt.
Durchgerechnetes Beispiel zur logistischen Regression
Angenommen, ein Modell verwendet ein Merkmal und hat
Du kannst dir als Testergebnis und als „bestanden“ vorstellen. Die Koeffizienten sind hier nur ein Beispiel, um die Mechanik zu zeigen.
Wenn , dann gilt
Die vorhergesagte Wahrscheinlichkeit ist also
Wenn , dann gilt
und
Dasselbe Modell ergibt also bei eine Bestehenswahrscheinlichkeit von etwa und bei von etwa . Der Score ist um gestiegen, aber die endgültige Ausgabe blieb zwischen und , weil die Sigmoidfunktion das Ergebnis zu einer Wahrscheinlichkeit krümmt.
Wenn du nun einen Schwellenwert von wählst, wird der erste Fall als Klasse und der zweite als Klasse klassifiziert. Dieser letzte Schritt hängt vom Schwellenwert ab. Die Wahrscheinlichkeitsschätzung selbst nicht.
Eine nützliche Abkürzung: Bei einem Schwellenwert von wechselt die Klasse genau dann, wenn ist, denn .
Wie logistische Regression zu einem Klassifikator wird
Die Modellausgabe ist eine Wahrscheinlichkeitsschätzung. Eine Klassifikationsregel wird erst danach hinzugefügt.
Zum Beispiel mit dem Schwellenwert :
- sage Klasse vorher, wenn
- sage Klasse vorher, wenn
Aber ist nicht immer der richtige Schwellenwert. Wenn falsch positive und falsch negative Vorhersagen unterschiedliche Kosten haben oder die Klassen stark unausgeglichen sind, kann ein anderer Schwellenwert besser funktionieren.
Was die Koeffizienten bedeuten
Das Vorzeichen eines Koeffizienten zeigt dir die Richtung des Effekts auf den linearen Score :
- wenn , erhöht eine Zunahme von den Wert von und erhöht tendenziell
- wenn , verringert eine Zunahme von den Wert von und verringert tendenziell
Dieser Teil ist einfach. Der feinere Punkt ist, dass sich die Wahrscheinlichkeit nicht linear mit dem Merkmal ändert, weil die Sigmoidkurve keine Gerade ist.
Bei der Standardform der logistischen Regression liegt das lineare Modell auf der Log-Odds-Skala:
Das bedeutet: Jede Erhöhung eines Merkmals um eine Einheit verändert die Log-Odds linear, wenn die anderen Merkmale konstant gehalten werden. Das ist präziser, als zu sagen, dass sich die Wahrscheinlichkeit um einen festen Betrag ändert.
Häufige Fehler bei der logistischen Regression
Die Ausgabe als sichere Klasse behandeln
Eine Vorhersage wie bedeutet nicht, dass das Ereignis sicher eintreten wird. Sie bedeutet, dass das Modell für diese Eingabe der positiven Klasse eine geschätzte Wahrscheinlichkeit von etwa zuordnet.
Annehmen, dass der Schwellenwert sein muss
ist üblich, aber es ist eine Wahl und kein Gesetz. Der beste Schwellenwert hängt von der Anwendung ab.
Denken, dass sich die Wahrscheinlichkeit linear ändert
Der Score ist linear in den Eingaben, die Wahrscheinlichkeit aber nicht. Eine Änderung eines Merkmals um eine Einheit kann nahe einen anderen Effekt haben als nahe .
Vergessen, dass das Modell binär ist, sofern es nicht erweitert wird
Die grundlegende logistische Regression behandelt zwei Klassen. Es gibt Mehrklassen-Versionen, aber das sind Erweiterungen und nicht dieselbe binäre Struktur in anderer Schreibweise.
Wann logistische Regression verwendet wird
Logistische Regression wird oft verwendet, wenn die Zielvariable Ja/Nein ist, etwa bei Spam-Erkennung, dem Vorliegen einer Krankheit, Kundenabwanderung, Kreditausfall oder bestanden/nicht bestanden.
Sie ist weiterhin beliebt, weil sie einfach, schnell und einigermaßen gut interpretierbar ist. Besonders nützlich ist sie, wenn du einen Basis-Klassifikator möchtest, wenn der Datensatz nicht riesig ist oder wenn du geschätzte Wahrscheinlichkeiten statt nur harter Labels brauchst.
Eine einfache Vorstellung davon
Stell dir die logistische Regression als eine Maschine mit zwei Schritten vor:
- Hinweise mit einem linearen Score aufsummieren.
- Diesen Score mit der Sigmoidfunktion in eine Wahrscheinlichkeit umwandeln.
Dieses Bild reicht aus, um die meisten Einführungsbeispiele zu verstehen und zu sehen, warum die logistische Regression zwischen linearen Modellen und Klassifikationsaufgaben steht.
Probiere eine ähnliche Aufgabe zur logistischen Regression aus
Wähle einen einfachen Score wie
Berechne für einige Werte von , zum Beispiel , und . Beobachte, wie sich der lineare Score gleichmäßig ändert, während sich die Wahrscheinlichkeit entlang einer S-förmigen Kurve krümmt. Probiere dann einen anderen Schwellenwert aus und schau, wann sich die vorhergesagte Klasse ändert.
Brauchst du Hilfe bei einer Aufgabe?
Lade deine Frage hoch und erhalte in Sekunden eine verifizierte Schritt-für-Schritt-Lösung.
GPAI Solver öffnen →