Behawioralna teoria gier
Behawioralna teoria gier analizuje interaktywne decyzje strategiczne i zachowania przy użyciu metod teorii gier[1], ekonomii eksperymentalnej i psychologii eksperymentalnej. Eksperymenty obejmują testowanie odchyleń od typowych uproszczeń teorii ekonomicznej, takich jak aksjomat niezależnośc[2] i pominięcie altruizmu[3], uczciwości[4], i efektów kadrowania[5]. Problemy behawioralnej teorii gier rozwijane są od trzech dekad[6].
Tradycyjna teoria gier koncentruje się na matematycznej strukturze równowagi i korzysta z teorii racjonalnego wyboru konsumenta obejmującego maksymalizację użyteczności. Natomiast teoria gier behawioralnych koncentruje się na tym, jak rzeczywiste zachowanie zwykle odbiega od standardowych przewidywań: w jaki sposób możemy wyjaśnić i modelować te odchylenia oraz w jaki sposób możemy poprawić przewidywania przy użyciu dokładniejszych modeli?[7] Wybory badane w behawioralnej teorii gier nie zawsze są racjonalne i nie zawsze reprezentują wybór maksymalizujący użyteczność[8].
Behawioralna teoria gier wykorzystuje eksperymenty laboratoryjne i terenowe, a także modelowanie teoretyczne i obliczeniowe[8]. Dodatkowo metody uczenia maszynowego zostały zastosowane w pracy na styku ekonomii, psychologii i informatyki w celu poprawy zarówno przewidywania, jak i zrozumienia zachowania w grach[9][10].
Historia
[edytuj | edytuj kod]Teoria gier behawioralnych rozpoczęła się od pracy Allaisa w 1953 r. I Ellsberga w 1961 r. Odkryli oni odpowiednio paradoks Allaisa i paradoks Ellsberga[7]. Oba paradoksy pokazują, że wybory dokonywane przez uczestników gry nie odzwierciedlają korzyści, jakich oczekują oni od dokonania tych wyborów. W latach 70. praca Vernona Smitha pokazała, że rynki gospodarcze można badać nie tylko teoretycznie, ale też eksperymentalnie. W tym samym czasie kilku ekonomistów przeprowadziło eksperymenty, które odkryły odmiany tradycyjnych modeli decyzyjnych, takich jak teoria żalu , teoria perspektyw i dyskontowanie hiperboliczne. Te odkrycia pokazały, że faktyczni decydenci biorą pod uwagę wiele czynników przy dokonywaniu wyborów. Na przykład osoba może starać się zminimalizować ilość żalu, którą poczuje po podjęciu decyzji, i rozważyć swoje opcje na podstawie o ilość żalu, której oczekuje otrzymać od każdej z nich. Ponieważ nie były one wcześniej badane przez tradycyjną teorię ekonomii, czynniki takie jak żal wraz z wieloma innymi podsycały kolejne badania.
Od lat 80. eksperymentatorzy zaczęli badać warunki, które powodują rozbieżność z racjonalnym wyborem. Ultimatum i gry przetargowe badały wpływ emocji na przewidywania zachowania przeciwnika. Jednym z najbardziej znanych przykładów gry ultimatum jest program telewizyjny Deal or No Deal, w którym uczestnicy muszą podjąć decyzję o sprzedaży lub kontynuowaniu gry na podstawie ultimatum pieniężnego postawionego im przez „bankiera”. Te gry badały również wpływ zaufania na wyniki podejmowania decyzji i zachowanie maksymalizujące użyteczność[11]. W celu eksperymentalnego przetestowania, w jaki sposób współpraca i pożądanie społeczne wpływają na wybory badanego, zastosowano wspólne gry z zasobami. Przykładem typowej gry z zasobami może być decyzja gościa, który chce wziąć z półmiska z jedzeniem. Decyzje gości miałyby wpływ nie tylko na to, jak bardzo są głodne, ale miałyby również wpływ na to, ile pozostało z dzielonych zasobów, jedzenia, i jeśli gość uważa, że inni oceniliby je za wzięcie większej ilości. Eksperymentatorzy w tym okresie badali zachowania, które nie maksymalizowały użyteczności w wyniku błędnego rozumowania uczestnika[7]. Na przełomie wieków ekonomiści i psychologowie rozszerzyli te badania. Modele oparte na teorii racjonalnego wyboru zostały dostosowane w celu odzwierciedlenia preferencji podejmujących decyzje i próby racjonalizacji wyborów, które nie maksymalizowałyby użyteczności.
Porównanie do tradycyjnej teorii gier
[edytuj | edytuj kod]Tradycyjna teoria gier wykorzystuje modele teoretyczne, aby określić najkorzystniejszy wybór wszystkich graczy w grze[12]. Teoria gier wykorzystuje teorię racjonalnego wyboru wraz z założeniami powszechnej wiedzy graczy, aby przewidzieć decyzje maksymalizujące użyteczność. Pozwala także graczom przewidywać strategie przeciwników[13]. Tradycyjna teoria gier jest przede wszystkim teorią normatywną, ponieważ ma na celu wskazanie decyzji, którą racjonalni gracze powinni wybrać, ale nie próbuje wyjaśnić, dlaczego ta decyzja została podjęta. Racjonalność jest podstawowym założeniem teorii gier, więc nie wyjaśnia różnych form racjonalnych decyzji lub nieracjonalnych decyzji.
Behawioralna teoria gier jest przede wszystkim teorią pozytywną, a nie teorią normatywną[13]. Pozytywna teoria ma na celu raczej opisanie zjawisk niż zalecenie prawidłowego działania. Pozytywne teorie muszą być sprawdzalne i mogą być udowodnione jako prawdziwe lub fałszywe. Teoria normatywna jest subiektywna i oparta na opiniach. Z tego powodu teorie normatywne nie mogą być udowodnione jako prawdziwe lub fałszywe. Behawioralna teoria gier próbuje wyjaśnić podejmowanie decyzji na podstawie danych eksperymentalnych. Teoria ta pozwala na racjonalne i irracjonalne decyzje, ponieważ obie są badane za pomocą eksperymentów z prawdziwego życia. Behawioralna teoria gier próbuje wyjaśnić czynniki wpływające na decyzje podejmowane w świecie rzeczywistym. Czynniki te nie są badane w obszarze tradycyjnej teorii gier, ale można je postulować i obserwować na podstawie danych empirycznych. Ustalenia z behawioralnej teorii gier będą miały zwykle większą wiarygodność zewnętrzną i mogą być lepiej zastosowane w zachowaniach decyzyjnych w świecie rzeczywistym.
Przykłady gier wykorzystywanych w badaniach behawioralnych teorii gier
[edytuj | edytuj kod]- Gra sygnalizacyjna
- Gra dyktatora[14][15]
- Ultimatum Game[16]
- Keynesowski konkurs piękności
- Normalna gra formalna
- Gra kooperacyjna
- Gra wymiany prezentów
Czynniki wpływające na racjonalność w grach
[edytuj | edytuj kod]Wierzenia
[edytuj | edytuj kod]Oczekiwania o innych ludziach w grze decyzyjnej powinny wpływać na zdolność dokonywania racjonalnych wyborów. Jednak przekonania innych mogą również powodować, że wyniki eksperymentów będą odbiegać od równowagi i podejmować decyzje maksymalizujące użyteczność. W eksperymencie Costa-Gomeza (2008) uczestnicy zostali zapytani o przekonania pierwszego rzędu o działaniach przeciwnika przed ukończeniem serii normalnych gier z innymi uczestnikami[17]. Uczestnicy przestrzegali Nash Equilibrium tylko w 35% przypadków. Co więcej, uczestnicy wyrazili jedynie przekonanie, że ich przeciwnicy przestrzegają tradycyjnej teorii gier w 15% przypadków. Oznacza to, że uczestnicy wierzyli, że ich przeciwnicy będą mniej racjonalni niż byli w rzeczywistości. Wyniki tego badania pokazują, że uczestnicy nie wybierają akcji maksymalizującej użyteczność i oczekują, że ich przeciwnicy zrobią to samo. Pokazują one również, że uczestnicy nie wybrali akcji maksymalizującej użyteczność, która odpowiadałaby ich przekonaniom na temat działania przeciwnika. Chociaż uczestnicy mogli sądzić, że ich przeciwnik był bardziej skłonny do podjęcia określonej decyzji, nadal podejmowali decyzje, jakby ich przeciwnik dokonywał wyboru losowo. W innym badaniu, w którym zbadano uczestników programu telewizyjnego Deal or No Deal, stwierdzono rozbieżność w stosunku do racjonalnego wyboru[18]. Podczas gry uczestnicy częściej opierali swoje decyzje na wcześniejszych wynikach. Awersja do ryzyka spadła, gdy oczekiwania uczestników nie zostały spełnione w grze. Na przykład podmiot, który doświadczył szeregu pozytywnych wyników, był mniej skłonny zaakceptować umowę i zakończyć grę. To samo dotyczyło podmiotu, który doświadczył przede wszystkim negatywnych wyników we wczesnej fazie gry.
Współpraca społeczna
[edytuj | edytuj kod]Zachowania społeczne i współpraca z innymi uczestnikami to dwa czynniki, które nie są modelowane w tradycyjnej teorii gier, ale często są obserwowane w środowisku eksperymentalnym. Ewolucja norm społecznych została zaniedbana w modelach decyzyjnych, ale normy te wpływają na sposoby interakcji między prawdziwymi ludźmi i dokonywania wyborów[11]. Jedną z tendencji jest chęć silnego odwzajemniania się. Ten typ gracza wchodzi w grę z predyspozycjami do współpracy z innymi graczami. Zwiększy poziom współpracy w odpowiedzi na współpracę innych graczy i obniży poziom współpracy, nawet na własny koszt, aby ukarać graczy, którzy nie współpracują. Nie jest to zachowanie maksymalizujące wypłatę, ponieważ gracz silnie odwzajemniający gotów jest zmniejszyć wypłatę innych graczy swoim kosztem, aby tylko zachęcić innych graczy do współpracy.
Dufwenberg i Kirchsteiger (2004) opracowali model oparty na wzajemności zwany sekwencyjną równowagą wzajemności. Ten model dostosowuje tradycyjną logikę teorii gier do idei, że gracze odwzajemniają działania w celu współpracy[19]. Model został wykorzystany do dokładniejszego przewidywania wyników eksperymentów klasycznych gier, takich jak dylemat więźnia i gra stonoga. Rabin (1993) stworzył także równowagę sprawiedliwości, która mierzy wpływ altruizmu na wybory[20]. Odkrył, że gdy gracz jest altruistyczny wobec innego gracza, drugi gracz ma większą szansę odwzajemnić ten altruizm. Wynika to z idei uczciwości. Równowagi sprawiedliwości przyjmują formę wzajemnego maksimum, w którym obaj gracze wybierają wynik, który najbardziej obdarzy oby z nich, lub wzajemnego minimum, w którym obaj gracze wybierają wynik, który najbardziej boli obu z nich. Równowagi te są również równowagami Nasha, ale uwzględniają chęć uczestników do współpracy i uczciwości.
Zachęty, konsekwencje i oszustwo
[edytuj | edytuj kod]Rola zachęt i konsekwencji w podejmowaniu decyzji jest interesująca dla behawioralnych teoretyków gier, ponieważ wpływa na racjonalne zachowanie. Post (2008) przeanalizował zachowania uczestnika Deal or no Deal w celu wyciągnięcia wniosków na temat podejmowania decyzji, gdy stawki są wysokie[18]. Badanie wyborów zawodnika doprowadziło do wniosku, że w sekwencyjnej grze z wysokimi stawkami decyzje opierały się raczej na wcześniejszych wynikach niż na racjonalności. Gracze, którzy stoją w szeregu dobrych wyników, w tym przypadku eliminują przypadki niskiej wartości z gry lub gracze, którzy doświadczyli szeregu słabych wyników, stają się mniej niechętni do ryzyka. Oznacza to, że gracze, którzy mają wyjątkowo dobre lub wyjątkowo złe wyniki, są bardziej skłonni do gry i kontynuowania gry niż przeciętni gracze. Gracze, którzy mieli szczęście lub pecha, byli gotowi odrzucić oferty w wysokości ponad stu procent oczekiwanej wartości swojej sprawy, aby kontynuować grę. To pokazuje przejście od zachowania unikania ryzyka do zachowania poszukiwania ryzyka. Badanie to uwypukla uprzedzenia behawioralne, których nie uwzględnia tradycyjna teoria gier. Bardziej ryzykowne zachowanie u pechowych zawodników można przypisać efektowi progu rentowności, który stanowi, że gracze będą nadal podejmować ryzykowne decyzje w celu odzyskania pieniędzy. Z drugiej strony bardziej ryzykowne zachowanie szczęśliwych zawodników można wyjaśnić efektem kasyna, który stwierdza, że wygrywający gracze są bardziej skłonni do podejmowania ryzykownych decyzji, ponieważ uważają, że nie grają własnymi pieniędzmi. Ta analiza pokazuje, że zachęty wpływają na racjonalny wybór, szczególnie gdy gracze podejmują szereg decyzji.
Bodźce i konsekwencje również odgrywają dużą rolę w oszukiwaniu w grach. Gneezy (2005) badał podstęp przy użyciu gry nadawca-odbiorca[21]. W tym typie gry, gracz otrzymuje informacje o wypłatach opcji A i B. Następnie gracz pierwszy daje graczowi drugiemu zalecenie dotyczące wyboru opcji. Gracz jeden może oszukać gracza drugiego, a gracz drugi może odrzucić jego rady. Gneezy stwierdził, że uczestnicy byli bardziej wrażliwi na zysk z kłamstwa niż na stratę przeciwnika. Odkrył również, że uczestnicy nie byli całkowicie samolubni i troszczyli się o to, jak bardzo ich przeciwnicy stracili z powodu oszustwa, ale efekt ten słabł wraz ze wzrostem ich własnych wypłat. Ustalenia te pokazują, że decydenci badają zarówno bodźce do kłamstwa, jak i konsekwencje kłamstwa, aby zdecydować, czy kłamać, czy nie. Zasadniczo ludzie są przeciwni kłamaniu, ale przy odpowiednich zachętach ignorują konsekwencje. Wang (2009) użył również gry rozmowy, aby zbadać oszustwo u uczestników z zachętą do oszukiwania[22]. Za pomocą śledzenia wzroku odkrył, że uczestnicy, którzy otrzymywali informacje o wypłatach, koncentrowali się na własnej wypłacie dwa razy częściej niż ich przeciwnicy. Sugeruje to minimalne myślenie strategiczne. Co więcej, źrenice uczestników rozszerzały się tym bardziej im większe kłamstwo powiedzieli. Poprzez te fizyczne wskazówki Wang doszedł do wniosku, że oszustwo jest trudne poznawczo. Odkrycia te pokazują, że takie czynniki, jak zachęty, konsekwencje i oszustwa mogą tworzyć nieracjonalne decyzje i wpływać na rozwój gier.
Decyzje grupowe
[edytuj | edytuj kod]Behawioralna teoria gier uwzględnia wpływ grup na racjonalność. W prawdziwym świecie wiele decyzji jest podejmowanych przez zespoły, ale tradycyjna teoria gier wykorzystuje osobę jako decydenta. Stwarza to potrzebę modelowania zachowań grupowych w podejmowaniu decyzji. Bornstein i Yaniv (1998) badali różnicę w racjonalności między grupami i jednostkami w grze ultimatum[23]. W tej grze gracz jeden (lub grupa jeden) decyduje, jaki procent wypłaty ma dać graczowi dwa (lub grupa druga), a następnie gracz drugi decyduje, czy przyjąć lub odrzucić tę ofertę. Uczestnicy w warunkach grupowych zostali podzieleni na trzyosobowe grupy i pozwolono im obradować nad ich decyzjami. Idealna racjonalność w tej grze polegałaby na tym, że gracz jeden nie oferowałby żadnej wypłaty, ale prawie nigdy tak nie jest w przypadku obserwowanych ofert. Bornstein i Yaniv odkryli, że grupy były mniej hojne, chętne do rezygnacji z mniejszej części swojej wypłaty, pod jednym warunkiem gracza. W przypadku gracza drugiego były bardziej skłonne do akceptacji niskich ofert niż w przypadku jednej osoby. Wyniki te sugerują, że grupy są bardziej racjonalne niż jednostki.
Kocher i Sutter (2005) wykorzystali grę w konkursach piękności, aby zbadać i porównać zachowania indywidualne i grupowe[24]. Konkurs piękności to taka, w której wszyscy uczestnicy wybierają liczbę od zera do stu. Zwycięzcą zostaje uczestnik, który wybierze liczbę najbliższą do dwóch trzecich średniej liczby. W pierwszej rundzie rozsądny wybór wynosiłby trzydzieści trzy, ponieważ jest to dwie trzecie średniej liczby, która wyniosła by pięćdziesiąt. Biorąc pod uwagę nieskończoną liczbę rund, wszyscy uczestnicy powinni jednak wybrać zero zgodnie z teorią gier. Kocher i Sutter odkryli, że grupy nie działały bardziej racjonalnie niż jednostki w pierwszej rundzie gry. Jednak grupy działały bardziej racjonalnie niż pojedyncze osoby w kolejnych rundach. To pokazuje, że grupy są w stanie nauczyć się gry i dostosować swoją strategię szybciej niż poszczególne osoby.
Zobacz też
[edytuj | edytuj kod]Przypisy
[edytuj | edytuj kod]- ↑ R. J. Aumann (2008). „game theory,” The New Palgrave Dictionary of Economics, 2nd Edition. Abstract.
- ↑ Colin F. Camerer , Teck-Hua Ho , Violations of the betweenness axiom and nonlinearity in probability, „Journal of Risk and Uncertainty”, 8 (2), 1994, s. 167–196, DOI: 10.1007/BF01065371 [dostęp 2024-03-25] (ang.).
- ↑ James Andreoni et al. (2008). „altruism in experiments,” The New Palgrave Dictionary of Economics, 2nd Edition. Abstract.
- ↑ H. Peyton Young (2008). „social norms,” The New Palgrave Dictionary of Economics, 2nd Edition. Abstract.
- ↑ Progress in behavioral game theory. „Journal of Economic Perspectives”. DOI: 10.1257/jep.11.4.167. Pdf version.
- ↑ _____, George Loewenstein, and Matthew Rabin, ed. (2003). Advances in Behavioral Economics, Princeton. 1986–2003 papers. Description, contents, and preview. * Drew Fudenberg (2006). „Advancing Beyond Advances in Behavioral Economics,” Journal of Economic Literature, 44(3), pp. 694–711. * Vincent P. Crawford (1997). „Theory and Experiment in the Analysis of Strategic Interaction,” in Advances in Economics and Econometrics: Theory and Applications, pp. 206–242. Cambridge. Reprinted in Camerer et al. (2003), Advances in Behavioral Economics, Princeton, ch. 12. * Martin Shubik (2002). „Game Theory and Experimental Gaming,” in R. Aumann and S. Hart, ed., Handbook of Game Theory with Economic Applications, Elsevier, v. 3, s. 2327–2351. Abstract. • Charles R. Plott and Vernon L. Smith, ed. (2008). Handbook of Experimental Economics Results, v. 1, Elsevier, Part 4, Games preview and ch. 45–66 preview links. * Games and Economic Behavior, Elsevier. Aims and scope.
- ↑ a b c Gintis, H. (2005). Behavioral game theory and contemporary economic theory. Analyse & Kritik, 27(1), 48-72.
- ↑ a b Camerer, C. (2003). Behavioral game theory: Experiments in strategic interaction. Princeton University Press.
- ↑ Level-0 meta-models for predicting human behavior in games. „ACM Confrence”.
- ↑ Predicting and Understanding Initial Play. „American Economic Review”. DOI: 10.1257/aer.20180654. ISSN 0002-8282.
- ↑ a b Gintis, H. (2009). The bounds of reason: Game theory and the unification of the behavioral sciences. Princeton University Press.
- ↑ Osborne, M. J., & Rubinstein, A. (1994). A course in game theory. MIT press.
- ↑ a b Colman, A. M. (2003). Cooperation, psychological game theory, and limitations of rationality in social interaction. Behavioral and Brain Sciences, 26(02), 139-153.
- ↑ Behavioral Game Theory.
- ↑ Progress in Behavioral Game Theory. [zarchiwizowane z tego adresu (2018-12-19)].
- ↑ (Behavioral) Game theory.
- ↑ Costa-Gomes, M. A., & Weizsäcker, G. (2008). Stated beliefs and play in normal-form games. The Review of Economic Studies, 75(3), 729-762.
- ↑ a b Post, T., Van den Assem, M. J., Baltussen, G., & Thaler, R. H. (2008). Deal or no deal? Decision making under risk in a large-payoff game show. The American economic review, 38-71.
- ↑ Dufwenberg, M., & Kirchsteiger, G. (2004). A theory of sequential reciprocity. Games and economic behavior, 47(2), 268-298.
- ↑ Rabin, M. (1993). Incorporating fairness into game theory and economics. The American economic review, 1281-1302. (Incorporates social motives into game theory decision making).
- ↑ Gneezy, U. (2005). Deception: The role of consequences. American Economic Review, 384-394.
- ↑ Wang, J. T. Y., Spezio, M., & Camerer, C. (2009). Pinocchio’s pupil: Using eyetracking and pupil dilation to understand truth-telling and deception in sender-receiver game. American Economic Review, Forthcoming.
- ↑ Bornstein, G., & Yaniv, I. (1998). Individual and group behavior in the ultimatum game: Are groups more “rational” players?. Experimental Economics, 1(1), 101-108.
- ↑ Kocher, M. G., & Sutter, M. (2005). The Decision Maker Matters: Individual Versus Group Behaviour in Experimental Beauty-Contest Games*. The Economic Journal, 115(500), 200-223.