Regresja logistyczna to model do klasyfikacji binarnej. Łączy cechy wejściowe w wynik liniowy, przepuszcza ten wynik przez funkcję sigmoidalną i daje liczbę między a , którą w dopasowanym modelu interpretuje się jako oszacowane prawdopodobieństwo klasy pozytywnej.
Mimo nazwy regresja logistyczna jest zwykle używana do rozstrzygania między dwiema klasami, takimi jak zaliczenie/niezaliczenie, spam/nie spam czy niewypłacalność/brak niewypłacalności. Słowo „regresja” odnosi się do liniowego wzoru wewnątrz modelu, a nie do przewidywania ciągłej wartości wyjściowej.
Wzór regresji logistycznej w skrócie
Binarna regresja logistyczna używa zależności
z funkcją sigmoidalną
Część liniowa może być dowolną liczbą rzeczywistą. Funkcja sigmoidalna ściska tę wartość do przedziału , dlatego wynik można wykorzystać jako oszacowanie prawdopodobieństwa.
Dlaczego funkcja sigmoidalna jest ważna
Gdyby użyć surowego wyniku liniowego jako prawdopodobieństwa, można by otrzymać niemożliwe wartości, takie jak albo . Funkcja sigmoidalna naprawia ten problem, odwzorowując duże ujemne wyniki na wartości bliskie , duże dodatnie wyniki na wartości bliskie , a wyniki bliskie na wartości bliskie .
Daje to praktyczną interpretację:
- jeśli jest bardzo ujemne, model skłania się ku klasie
- jeśli jest bliskie , model jest niepewny
- jeśli jest bardzo dodatnie, model skłania się ku klasie
Krzywa jest najbardziej stroma w pobliżu . To znaczy, że mała zmiana wyniku może mocno zmienić prawdopodobieństwo w okolicy , ale znacznie mniej wtedy, gdy prawdopodobieństwo jest już bliskie albo .
Przykład regresji logistycznej krok po kroku
Załóżmy, że model używa jednej cechy i ma postać
Możesz myśleć o jako o wyniku testu, a o jako o „zaliczeniu”. Współczynniki są tu tylko przykładem pokazującym mechanikę działania.
Jeśli , to
Zatem przewidywane prawdopodobieństwo wynosi
Jeśli , to
oraz
Ten sam model daje więc około szans na zaliczenie przy i około przy . Wynik wzrósł o , ale końcowa wartość nadal pozostała między a , ponieważ funkcja sigmoidalna wygina wynik do postaci prawdopodobieństwa.
Jeśli teraz wybierzesz próg , pierwszy przypadek zostanie sklasyfikowany jako klasa , a drugi jako klasa . Ten ostatni krok zależy od progu. Samo oszacowanie prawdopodobieństwa już nie.
Przydatny skrót myślowy: przy progu klasa zmienia się dokładnie wtedy, gdy , ponieważ .
Jak regresja logistyczna staje się klasyfikatorem
Wynik modelu jest oszacowaniem prawdopodobieństwa. Regułę klasyfikacji dodaje się dopiero później.
Na przykład przy progu :
- przewiduj klasę , jeśli
- przewiduj klasę , jeśli
Ale nie zawsze jest właściwym progiem. Jeśli fałszywie dodatnie i fałszywie ujemne wyniki mają różne koszty albo klasy są silnie niezrównoważone, lepszy może być inny próg.
Co oznaczają współczynniki
Znak współczynnika mówi o kierunku wpływu na wynik liniowy :
- jeśli , zwiększenie podnosi i zwykle zwiększa
- jeśli , zwiększenie obniża i zwykle zmniejsza
Ta część jest prosta. Bardziej subtelne jest to, że prawdopodobieństwo nie zmienia się liniowo wraz z cechą, ponieważ krzywa sigmoidalna nie jest linią prostą.
W standardowej regresji logistycznej model liniowy działa na skali logarytmu ilorazu szans:
Oznacza to, że wzrost cechy o jedną jednostkę liniowo zmienia logarytm ilorazu szans, gdy pozostałe cechy są utrzymywane na stałym poziomie. To bardziej precyzyjne niż stwierdzenie, że prawdopodobieństwo zmienia się o stałą wartość.
Częste błędy w regresji logistycznej
Traktowanie wyniku jako pewnej klasy
Przewidywanie takie jak nie oznacza, że zdarzenie na pewno zajdzie. Oznacza, że model przypisuje temu wejściu około oszacowanego prawdopodobieństwa klasy pozytywnej.
Założenie, że próg musi wynosić
jest częste, ale to wybór, a nie prawo. Najlepszy próg zależy od zastosowania.
Myślenie, że prawdopodobieństwo zmienia się liniowo
Wynik jest liniowy względem danych wejściowych, ale prawdopodobieństwo już nie. Zmiana cechy o jedną jednostkę może mieć inny efekt w pobliżu niż w pobliżu .
Zapominanie, że model jest binarny, chyba że zostanie rozszerzony
Podstawowa regresja logistyczna obsługuje dwie klasy. Istnieją wersje wieloklasowe, ale są to rozszerzenia, a nie ten sam binarny układ zapisany inaczej.
Kiedy stosuje się regresję logistyczną
Regresję logistyczną często stosuje się wtedy, gdy zmienna docelowa ma postać tak/nie, na przykład przy wykrywaniu spamu, obecności choroby, odejściu klienta, niewypłacalności kredytu albo wynikach zaliczenie/niezaliczenie.
Model ten pozostaje popularny, ponieważ jest prosty, szybki i dość łatwy do interpretacji. Jest szczególnie przydatny, gdy chcesz mieć klasyfikator bazowy, gdy zbiór danych nie jest bardzo duży albo gdy potrzebujesz oszacowanych prawdopodobieństw, a nie tylko twardych etykiet.
Prosty sposób, by to sobie wyobrazić
Pomyśl o regresji logistycznej jak o maszynie działającej w dwóch krokach:
- Zsumuj dowody w postaci wyniku liniowego.
- Zamień ten wynik na prawdopodobieństwo za pomocą funkcji sigmoidalnej.
Taki obraz wystarcza, by zrozumieć większość przykładów wprowadzających i zobaczyć, dlaczego regresja logistyczna leży na styku modeli liniowych i zadań klasyfikacyjnych.
Spróbuj podobnego zadania z regresji logistycznej
Wybierz prosty wynik, na przykład
Oblicz dla kilku wartości , takich jak , i . Zobacz, jak wynik liniowy zmienia się równomiernie, podczas gdy prawdopodobieństwo wygina się w krzywą w kształcie litery S. Następnie wypróbuj inny próg i sprawdź, kiedy zmienia się przewidywana klasa.
Potrzebujesz pomocy z zadaniem?
Prześlij pytanie i otrzymaj zweryfikowane rozwiązanie krok po kroku w kilka sekund.
Otwórz GPAI Solver →