Teoria gier bada decyzje, w których twój najlepszy ruch zależy od tego, co zrobią inni. Macierz wypłat pokazuje wynik dla każdej kombinacji wyborów, a równowaga Nasha to taki zestaw wyborów, przy którym żaden gracz nie może poprawić swojej sytuacji, zmieniając decyzję samodzielnie.
Te trzy pojęcia — strategia, wypłata i równowaga — stanowią podstawę większości wprowadzających zadań z teorii gier. Gdy je zrozumiesz, wiele przykładów z podręczników staje się dużo łatwiejszych do odczytania.
Definicja teorii gier: jakie pytanie zadaje?
W zwykłym zadaniu optymalizacyjnym wybierasz najlepszą opcję w ustalonej sytuacji. W teorii gier sytuacja może się zmieniać, ponieważ inni gracze także dokonują wyborów — jednocześnie z tobą albo w odpowiedzi na ciebie.
Dlatego pytanie zmienia się z „Jaki jest mój najlepszy ruch?” na „Jaki jest mój najlepszy ruch, biorąc pod uwagę to, co mogą zrobić inni?”. Ta zmiana jest główną ideą interakcji strategicznej.
Strategie i wypłaty prostym językiem
Strategia to dostępny wybór gracza albo reguła działania w grze. W prostej grze jednorazowej strategia może być po prostu jednym działaniem, takim jak współpraca albo zdrada.
Wypłata to wynik, jaki gracz otrzymuje dla danej kombinacji wyborów. Może oznaczać pieniądze, punkty, użyteczność albo dowolny ranking, w którym większa liczba oznacza lepszy wynik dla tego gracza.
W grze dwuosobowej takie wyniki często porządkuje się w macierzy wypłat. Każda komórka łączy jedną strategię Gracza A z jedną strategią Gracza B.
Jak czytać macierz wypłat
Oto standardowa macierz wypłat w stylu dylematu więźnia. Pierwsza liczba w każdej komórce to wypłata Gracza A, a druga to wypłata Gracza B.
Czytaj każdą komórkę jako jeden pełny wynik:
- Jeśli obaj współpracują, każdy dostaje .
- Jeśli jeden zdradza, a drugi współpracuje, zdradzający dostaje , a współpracujący .
- Jeśli obaj zdradzają, każdy dostaje .
Dokładne liczby nie są żadnym prawem teorii gier. To tylko jeden wzorzec wypłat. Liczy się struktura bodźców: każdy gracz ma pokusę, by zdradzić, mimo że obaj woleliby skończyć na wzajemnej współpracy niż na wzajemnej zdradzie.
Równowaga Nasha: stabilny wynik
Równowaga Nasha to taki zestaw strategii, przy którym żaden gracz nie może poprawić swojej wypłaty, zmieniając strategię samodzielnie, podczas gdy pozostali gracze nie zmieniają swoich strategii.
Można też powiedzieć, że wybór każdego gracza jest najlepszą odpowiedzią na wybory pozostałych.
Nie oznacza to, że wynik jest najlepszy dla wszystkich. Oznacza tylko, że nikt nie ma jednostronnej motywacji, by od niego odejść.
Przykład krok po kroku: znajdowanie równowagi Nasha
Użyj macierzy powyżej.
Jeśli Gracz B współpracuje, Gracz A porównuje współpracę dającą ze zdradą dającą . Zdrada jest lepsza.
Jeśli Gracz B zdradza, Gracz A porównuje współpracę dającą ze zdradą dającą . Zdrada nadal jest lepsza.
Zatem dla Gracza A zdrada jest najlepszą odpowiedzią w obu przypadkach. Ze względu na symetrię to samo dotyczy Gracza B.
To oznacza, że jest równowagą Nasha. Gdy obaj gracze już się tam znajdują, żaden z nich nie może poprawić swojego wyniku, zmieniając decyzję samodzielnie.
Ale nie jest to najlepszy wspólny wynik. Łączna wypłata w punkcie wynosi , podczas gdy łączna wypłata w punkcie to tylko .
To jest kluczowa intuicja: równowaga Nasha może być stabilna, nie będąc jednocześnie najlepsza dla całej grupy.
Typowe błędy popełniane przez uczniów
Częstym błędem jest myślenie, że równowaga Nasha oznacza najlepszy możliwy wynik dla wszystkich. Tak nie jest. Oznacza tylko, że żaden gracz nie zyskuje na samodzielnej zmianie strategii.
Innym błędem jest odczytywanie macierzy wypłat tylko z perspektywy jednego gracza. Każdą komórkę trzeba sprawdzić z punktu widzenia każdego gracza.
Uczniowie czasem zapominają też, że model zależy od struktury wypłat. Jeśli wypłaty się zmienią, najlepsze odpowiedzi i równowaga także mogą się zmienić.
Gdzie stosuje się teorię gier
Teoria gier jest stosowana w ekonomii, aukcjach, ustalaniu cen, negocjacjach, głosowaniu, projektowaniu sieci i biologii ewolucyjnej. Szczegóły różnią się w zależności od dziedziny, ale stale wraca to samo podstawowe pytanie: jak powinien działać jeden podmiot, gdy inni także dokonują wyborów?
W bardziej zaawansowanych ujęciach teoria gier bada też strategie mieszane, gry powtarzane i gry z więcej niż dwoma graczami. Na początek jednak strategie czyste i macierz wypłat wystarczą, by zbudować główną intuicję.
Spróbuj podobnego zadania
Spróbuj własnej wersji, zmieniając jedną wypłatę w macierzy i ponownie wyznaczając najlepsze odpowiedzi. Na przykład sprawdź, co się stanie, jeśli wzajemna współpraca daje albo jeśli wzajemna zdrada daje . To jeden z najszybszych sposobów, by zobaczyć, że równowaga zależy od bodźców, a nie od etykiet przypisanych strategiom.
Jeśli chcesz pójść o krok dalej, porównaj ten układ z grą koordynacyjną, w której gracze zyskują na dopasowaniu swoich wyborów. Zobaczenie obu przypadków obok siebie znacznie ułatwia rozpoznawanie równowagi Nasha.
Potrzebujesz pomocy z zadaniem?
Prześlij pytanie i otrzymaj zweryfikowane rozwiązanie krok po kroku w kilka sekund.
Otwórz GPAI Solver →