Post on 07-Jun-2018
transcript
Recap: tipologia
jocurilor
Cu sumă nulă / nenulă
Cu informaţie perfectă / imperfectă
Cu informaţie completă / incompletă
Cooperative
/ non-coperative
Strategice / secvenţiale
Cu strategii pure / mixte
Caracterizaţi jocurile din imaginile următoare.
Există jocuri obiectiv cooperative sau non-cooperative?
Care este rolul reprezentărilor, percepţiilor şi atitudinilor participanţilor?
“I just have a hunch that Stalin is not that kind of a man. ... I
think that if I give him everything I possibly can and ask for nothing from
him in return, noblesse oblige, he won't try to annex anything and will work with me for a world of democracy and peace.”
–
F. D. Roosevelt, 1943
Teoria
jocurilor
Solution concept. Tipuri
de soluţii.
Solution concept
În teoria jocurilor, solution concept este un criteriu sau un algoritm pe baza căruia se pot face predicţii cu privire la alternativele selectate de jucători şi desfăşurarea viitoare a jocului.
Atenţie, termenul de “soluţie”
nu trebuie înţeles în sens matematic –
diferitele solution
concepts propuse în teoria jocurilor au zone limitate de aplicabilitate şi nu oferă garanţia selectării unui anumit curs al jocului.
Soluţii
Optimizarea paretiană
Eliminarea strategiilor dominate
Echilibrul Nash
Inducţia
regresivă; subgame perfect equilibrium
Inducţia progresivă
Optimul Pareto
Conceptul vizează modul de alocare a unor resurse limitate între mai mulţi participanţi. O alocare este ineficientă atâta vreme cât pot fi făcute ajustări ale distribuţiei care îmbunătăţesc situaţia unuia sau a mai multor participanţi, fără să-i dezavantajeze pe ceilalţi.
În mod normal există multe îmbunătăţiri Pareto posibile, ceea ce ridică problema alegerii celor adecvate (şi a criteriului de alegere). Atunci când nu pot fi făcute îmbunătăţiri suplimentare fără a dezavantaja pe cineva, este atins un punct de eficienţă Pareto.
Optimul Pareto
Probleme:
Favorizarea status quo-ului
Sunt posibile distribuţii inechitabile
Probleme de evaluare inter-personală a utilităţii optimizărilor paretiene
Optimul ParetoCriteriul Kaldor-Kicks
Acesta renunţă la cerinţa identificării unor criterii de ierarhizare a utilităţilor participanţilor, înlocuind-o cu un principiu de compensare: cei aflaţi într-o poziţie privilegiată trebuie să fie dispuşi, în principiu, să-i compenseze pe cei dezavantajaţi.
Compensările trebuie să fie posibil de realizat (în sensul că există atât disponibilitatea celor avantajaţi, cât şi mecanismul de redistribuire necesar).
Comparaţie cu politicile redistributive, în cazul cărora nu există, în general, acordul celor care plătesc un cost suplimentar. Ele implică un
principiu de solidaritate postulat, însă imposibil de verificat la nivelul unui grup numeros.
Optimul ParetoCriteriul Kaldor-Kicks oferă două avantaje:
În primul rând, eficienţa poate fi verificată empiric: participanţii pot dovedi
că
sunt dispuşi să ofere compensaţie. Deciziile colective sunt rezultatul deliberării şi al negocierii, nu al aplicării unui set de criterii rigide.
În al doilea rând, estimarea
utilităţilor ia în calcul
modul
în care participanţii
percep alocarea resurselor şi propria înzestrare.Problemă: participanţii percep redistribuţia
prin raportare la propria alocare iniţială, dar şi prin raportare la alocările celorlalţi. Posibilii indicatori ai bunăstării –
evaluaţi
comparativ şi contextual.
The tragedy
of commons
Analogie folosită pentru a ilustra conflictul dintre interesele individuale şi beneficiile colective, cu privire la distribuirea resurselor sau accesul la acestea.
Termenul a fost folosit pentru prima oară de Garret
Hardin
într-un articol din 1968 apărut în revista Science
şi intitulat chiar “The Tragedy
of Commons”. Hardin se referă în primul rând la probleme legate de creşterea demografică, însă şi la accesul
la resurse
precum
aerul sau apa potabilă.
Hardin oferă exemplul ipotetic al exploatării unei păşuni de către mai mulţi crescători de vite. Fiecare doreşte să-şi maximizeze profitul, ca atare fiecare este motivat să-şi mărească turma. Fiecare animal suplimentar aduce un avantaj (alocat integral proprietarului animalului) şi un dezavantaj colectiv (degradarea păşunii prin suprapopulare). În oricare moment, avantajul adus de adăugarea unui animal va fi mai mare decât dezavantajul individual legat de deteriorarea păşunii.
Ca atare, fiecare este motivat să adauge câte un animal la propria turmă, chiar dacă în acest fel contribuie la degradarea accelerată a păşunii.
Există o limită dincolo de care degradarea bunului colectiv este
suficient de mare pentru a-l face inutilizabil, însă în general indivizii vor continua să pluseze, urmărind obţinerea unui avantaj cât mai consistent înainte de atingerea acestui punct.
negociere
vs. reglementare
The tragedy of commons
P2
Adaugă un animal Nu adăuga
P1
Adaugă un animal
8,
8 la momentul n17, 7 la momentul n2...
10,
2
Nu adăuga 2,
10 2,
2
Eliminarea succesivă a strategiilor dominate
Strategia dominantă este cea care oferă un beneficiu superior oricare ar fi strategia aleasă de ceilalţi participanţi.
Asumând faptul că decidenţii sunt raţionali, strategiile strict dominate pot fi eliminate de la bun început: decidentul nu are niciun motiv să urmeze o strategie care oferă beneficii sistematic inferioare unei alte strategii disponibile.
Eliminarea strategiilor dominate simplifică desfăşurarea jocului şi facilitează procesarea informaţiilor relevante (cele care vizează alternative credibile).
Eliminarea succesivă a strategiilor dominate
Cu toate acestea, ea nu oferă garanţia optimizării distribuţiei beneficiilor:
Într-un joc tip dilema prizonierilor, eliminarea strategiei dominate (cooperare) închide posibilitatea coordonării strategiilor cooperative, în vederea obţinerii unor beneficii superioare celor care ar fi obţinute pe baza unei strategii conflictuale (trădare).
Deşi adoptarea unilaterală a strategiei dominate oferă, în tabelul distribuţiei utilităţilor, beneficii inferioare, coordonarea strategiilor dominate poate oferi un beneficiu superior adoptării strategiilor dominante.
Assurance
(pasagerul clandestin)
P2
Contribuie Nu contribuie
P1Contribuie [2…5], [2…5] 2, 4
Nu contribuie 4, 2 2, 2
Eliminarea strategiilor dominate -
consecinţe
Fiecare participant ştie că utilitatea obţinută de fiecare în parte e cu atât mai mare cu cât există mai multe persoane care contribuie. E o motivaţie suficient de puternică pentru a contribui?
Costuri
vs. beneficii private/sociale
Assurance
Probabilitatea obţinerii unor beneficii (sau valoarea lor) creşte odată cu numărul jucătorilor care cooperează
Dificultatea obţinerii unui acord în cazul unor grupuri mari
Self-reinforcing disadvantage: într-un grup în care majoritea nu
cooperează pare preferabil să nu cooperezi –
ceea ce reduce dramatic şansele vreunui proiect colectiv; fiecare persoană care decide să nu coopereze subminează odată în plus posibilitatea cooperării şi le oferă celor indecişi un motiv în plus să nu coopereze.
Echilibrul Nash
Una din contribuţiile importante la discuţia cu privire la modul de coordonare a strategiilor în situaţii de interdependenţă a fost adusă de John Nash, într-un articol din 1951, “Non-cooperative games”.
Spre deosebire de John von Neumann şi Oskar Morgenstern, care definiseră deja conceptul în 1944, însă doar cu referire la jocurile cu sumă nulă, Nash a demonstrat faptul că există un echilibru Nash pentru orice joc cu un număr finit de mutări.
Echilibrul Nash
Dacă există un set de strategii
cu
proprietatea că nici unul
dintre
jucători
nu poate
obţine
un beneficiu
superior
prin
schimbarea unilaterală a propriei strategii, atunci
setul respectiv
şi
utilitaţile
asociate
constituie
un punct de echilibru Nash
Rezultatul unui joc în care jucătorul A alege strategia optimă, dată fiind strategia aleasă de B, iar B alege strategia optimă dată fiind strategia aleasă de A
Echilibrul
Nash
Echilibrele
Nash nu reprezinta
cu necesitate
puncte
de optim
paretian
O alocare este ineficientă paretian atâta vreme cât pot fi făcute ajustări ale distribuţiei care îmbunătăţesc situaţia unuia sau a mai multor participanţi, fără să înrăutăţească situaţia celorlalţi
Echilibru
al selectării
strategiilor vs. “echilibru”
al distribuţiei beneficiilor; problema consecinţelor neintenţionate şi a “efectelor perverse”
Ex. Boudon: creşterea semnificativă a cererii de educaţie în vestul Europei, după al doilea război mondial, care a antrenat o creştere a costurilor legate de educaţie, formare şi acces la piaţa muncii (Boudon vorbeşte despre „creşterea preţului de cumpărare a statutului social”).
Echilibrul
Nash
Identificarea strategiilor dominante ale fiecărui participant (acolo unde există), urmată de identificarea punctelor de intersecţie
Doar pentru strategii pure: identificarea câmpurilor din tabel în cazul cărora valoarea beneficiilor reprezintă valoarea maximă pe coloana şi rândul respective
Strategii
pure si
mixte: Matching pennies
P2
Cap Pajură
P1Cap 1,-1 -1,1
Pajură -1,1 1,-1
Dacă monedele arată ambele cap sau ambele pajură, atunci P1 câştigă un punct. Dacă monedele arată cap şi pajură, atunci punctul este câştigat de P2.
Există un echilibru Nash
în situaţia în care ambii jucători aleg strategii pure?
Strategii
pure si
mixte: Matching pennies
P2
Cap Pajură
P1Cap 1,-1 -1,1
Pajură -1,1 1,-1
În situaţia dată, P1 poate face următorul raţionament: dacă voi alege ca moneda mea să arate „pajură”
cu o probabilitate mai mare de 50%, atunci P2 va avea mai multe şanse de câştig, putând să aleagă „cap” cu probabilitate 100%. Dacă aleg ca moneda mea să arate „pajură” cu o probabilitate mai mică de 50%, atunci P2 are mai multe şanse de câştig, dacă arată „pajură”
cu probabilitate 100%. Singurul fel în care pot avea şanse egale de câştig este să aleg în mod aleator
„cap”
sau „pajură”
cu o probabilitate de 50%.
Jocul are un echilibru Nash
pentru strategii mixte, nu şi pentru strategii pure.
Strategii
pure şi mixte
John Nash, “Non-cooperative games" (1951) – fiecare joc finit are cel puţin un echilibru Nash, însă
unele echilibre există doar pentru strategii mixte (cazuri în care cel puţin un jucător selectează o
strategie mixtă).
Pot fi identificate echilibre Nash
doar pentru strategii pure, doar pentru strategii mixte, sau pentru ambele.
Strategii pure şi mixte – driving game
Strategii pure: există 2 echilibre Nash, când ambii şoferi decid să conducă pe stânga sau pe dreapta
Strategii mixte, avem 3 echilibre Nash:
(0%,100%) pt
şoferul 1, (0%, 100%) pt
şoferul 2,
(100%, 0%) pt
şoferul 1, (100%, 0%) pt
şoferul 2,
(50%, 50%)
pentru ambii şoferi
Direcţia
de
deplasarePe stânga
Pe dreapta
Pe stânga 100, 100 0,0
Pe dreapta 0,0 100, 100
Raţionalitate
Dacă un joc are un singur echilibru Nash
şi sunt îndeplinite o serie de condiţii, toţi jucătorii vor alege strategia adecvată atingerii acelui echilibru.
Condiţiile sunt următoarele:
Jucătorii urmăresc exclusiv maximizarea propriei utilităţi estimate, în cadrul jocului,
Ei sunt suficient de inteligenţi pentru a identifica soluţia corectă,
Procesarea informaţiei şi alegerea mutărilor se desfăşoară fără erori,
Ei cunosc strategiile optime ale celorlalţi jucători,
Toţi jucătorii cunosc aceste condiţii, inclusiv condiţia de faţă.
presupoziţii de raţionalitate aplicate decidentului generic al teoriei jocurilor –
în ce măsură sunt ele relevante pentru decidentul real? Sunt ele utile, chiar dacă nu oferă o descriere realistă a deciziilor efective?
Informaţie imperfectă şi incompletă, timp limitat, complexitate decizională.
Echilibrul
Nash
Deţinut 2
Cooperează Trădează
Deţinut 1 Cooperează 3,
3 1,
5
Trădează 5, 1 2, 2
(valorile reprezintă beneficii, nu ani de închisoare)
Dilema
prizonierilor
Strategia
globală optimă nu corespunde echilibrului Nash. De ce?
Echilibre stabile
În jocuri cu strategii mixte, un echilibru Nash este stabil dacă:
O schimbare infinitezimală a probabilităţilor alocate strategiilor unui jucător
nu îmbunătăţeşte situaţia
celuilalt jucător (nu are la dispoziţie o strategie mai avantajoasă),
Jucătorul care a modificat alocarea propriilor probabilităţi este dezavantajat.
Ex: în matching pennies şi driving game ce tipuri de echilibre Nash există?
Bibliografie
Textele lui Nash:
"Equilibrium points in n-person games" Proceedings of the National Academy of Sciences 36(1):48-49.
"Non-Cooperative Games" The Annals of Mathematics 54(2):286-295.
McCain, Roger (2003) Game Theory: A Non-Technical Introduction to the Analysis of Strategy, South-Western College Pub
Williams, John Davis (1954) (PDF), The Complete Strategyst: Being a Primer on the Theory of Games of Strategy, Santa Monica: RAND Corp.
Kreps, David
M. (1990)
Game theory and economic modelling, Oxford University Press
Von Neumann, John & Morgenstern, Oskar (1943)
The Theory of Games and Economic Behavior, Princeton: Princeton University Press
Fudenberg, Drew & Tirole, Jean (1991)
Game theory, Cambridge, MIT Press
Rubinstein, Ariel; Osborne, Martin J. (1994), A course in game theory, MIT Press