Recap: tipologia jocurilor - Photography and more – My … · · 2011-01-15În teoria...

transcript

Recap: tipologia

jocurilor

Cu sumă nulă / nenulă

Cu informaţie perfectă / imperfectă

Cu informaţie completă / incompletă

Cooperative

/ non-coperative

Strategice / secvenţiale

Cu strategii pure / mixte

Caracterizaţi jocurile din imaginile următoare.

Există jocuri obiectiv cooperative sau non-cooperative?

Care este rolul reprezentărilor, percepţiilor şi atitudinilor participanţilor?

“I just have a hunch that Stalin is not that kind of a man. ... I

think that if I give him everything I possibly can and ask for nothing from

him in return, noblesse oblige, he won't try to annex anything and will work with me for a world of democracy and peace.”

F. D. Roosevelt, 1943

Teoria

jocurilor

Solution concept. Tipuri

de soluţii.

Solution concept

În teoria jocurilor, solution concept este un criteriu sau un algoritm pe baza căruia se pot face predicţii cu privire la alternativele selectate de jucători şi desfăşurarea viitoare a jocului.

Atenţie, termenul de “soluţie”

nu trebuie înţeles în sens matematic –

diferitele solution

concepts propuse în teoria jocurilor au zone limitate de aplicabilitate şi nu oferă garanţia selectării unui anumit curs al jocului.

Soluţii

Optimizarea paretiană

Eliminarea strategiilor dominate

Echilibrul Nash

Inducţia

regresivă; subgame perfect equilibrium

Inducţia progresivă

Optimul Pareto

Conceptul vizează modul de alocare a unor resurse limitate între mai mulţi participanţi. O alocare este ineficientă atâta vreme cât pot fi făcute ajustări ale distribuţiei care îmbunătăţesc situaţia unuia sau a mai multor participanţi, fără să-i dezavantajeze pe ceilalţi.

În mod normal există multe îmbunătăţiri Pareto posibile, ceea ce ridică problema alegerii celor adecvate (şi a criteriului de alegere). Atunci când nu pot fi făcute îmbunătăţiri suplimentare fără a dezavantaja pe cineva, este atins un punct de eficienţă Pareto.

Optimul Pareto

Probleme:

Favorizarea status quo-ului

Sunt posibile distribuţii inechitabile

Probleme de evaluare inter-personală a utilităţii optimizărilor paretiene

Optimul ParetoCriteriul Kaldor-Kicks

Acesta renunţă la cerinţa identificării unor criterii de ierarhizare a utilităţilor participanţilor, înlocuind-o cu un principiu de compensare: cei aflaţi într-o poziţie privilegiată trebuie să fie dispuşi, în principiu, să-i compenseze pe cei dezavantajaţi.

Compensările trebuie să fie posibil de realizat (în sensul că există atât disponibilitatea celor avantajaţi, cât şi mecanismul de redistribuire necesar).

Comparaţie cu politicile redistributive, în cazul cărora nu există, în general, acordul celor care plătesc un cost suplimentar. Ele implică un

principiu de solidaritate postulat, însă imposibil de verificat la nivelul unui grup numeros.

Optimul ParetoCriteriul Kaldor-Kicks oferă două avantaje:

În primul rând, eficienţa poate fi verificată empiric: participanţii pot dovedi

sunt dispuşi să ofere compensaţie. Deciziile colective sunt rezultatul deliberării şi al negocierii, nu al aplicării unui set de criterii rigide.

În al doilea rând, estimarea

utilităţilor ia în calcul

în care participanţii

percep alocarea resurselor şi propria înzestrare.Problemă: participanţii percep redistribuţia

prin raportare la propria alocare iniţială, dar şi prin raportare la alocările celorlalţi. Posibilii indicatori ai bunăstării –

evaluaţi

comparativ şi contextual.

The tragedy

of commons

Analogie folosită pentru a ilustra conflictul dintre interesele individuale şi beneficiile colective, cu privire la distribuirea resurselor sau accesul la acestea.

Termenul a fost folosit pentru prima oară de Garret

Hardin

într-un articol din 1968 apărut în revista Science

şi intitulat chiar “The Tragedy

of Commons”. Hardin se referă în primul rând la probleme legate de creşterea demografică, însă şi la accesul

la resurse

precum

aerul sau apa potabilă.

Hardin oferă exemplul ipotetic al exploatării unei păşuni de către mai mulţi crescători de vite. Fiecare doreşte să-şi maximizeze profitul, ca atare fiecare este motivat să-şi mărească turma. Fiecare animal suplimentar aduce un avantaj (alocat integral proprietarului animalului) şi un dezavantaj colectiv (degradarea păşunii prin suprapopulare). În oricare moment, avantajul adus de adăugarea unui animal va fi mai mare decât dezavantajul individual legat de deteriorarea păşunii.

Ca atare, fiecare este motivat să adauge câte un animal la propria turmă, chiar dacă în acest fel contribuie la degradarea accelerată a păşunii.

Există o limită dincolo de care degradarea bunului colectiv este

suficient de mare pentru a-l face inutilizabil, însă în general indivizii vor continua să pluseze, urmărind obţinerea unui avantaj cât mai consistent înainte de atingerea acestui punct.

negociere

vs. reglementare

The tragedy of commons

Adaugă un animal Nu adăuga

Adaugă un animal

8 la momentul n17, 7 la momentul n2...

Nu adăuga 2,

Eliminarea succesivă a strategiilor dominate

Strategia dominantă este cea care oferă un beneficiu superior oricare ar fi strategia aleasă de ceilalţi participanţi.

Asumând faptul că decidenţii sunt raţionali, strategiile strict dominate pot fi eliminate de la bun început: decidentul nu are niciun motiv să urmeze o strategie care oferă beneficii sistematic inferioare unei alte strategii disponibile.

Eliminarea strategiilor dominate simplifică desfăşurarea jocului şi facilitează procesarea informaţiilor relevante (cele care vizează alternative credibile).

Eliminarea succesivă a strategiilor dominate

Cu toate acestea, ea nu oferă garanţia optimizării distribuţiei beneficiilor:

Într-un joc tip dilema prizonierilor, eliminarea strategiei dominate (cooperare) închide posibilitatea coordonării strategiilor cooperative, în vederea obţinerii unor beneficii superioare celor care ar fi obţinute pe baza unei strategii conflictuale (trădare).

Deşi adoptarea unilaterală a strategiei dominate oferă, în tabelul distribuţiei utilităţilor, beneficii inferioare, coordonarea strategiilor dominate poate oferi un beneficiu superior adoptării strategiilor dominante.

Assurance

(pasagerul clandestin)

Contribuie Nu contribuie

P1Contribuie [2…5], [2…5] 2, 4

Nu contribuie 4, 2 2, 2

Eliminarea strategiilor dominate -

consecinţe

Fiecare participant ştie că utilitatea obţinută de fiecare în parte e cu atât mai mare cu cât există mai multe persoane care contribuie. E o motivaţie suficient de puternică pentru a contribui?

Costuri

vs. beneficii private/sociale

Assurance

Probabilitatea obţinerii unor beneficii (sau valoarea lor) creşte odată cu numărul jucătorilor care cooperează

Dificultatea obţinerii unui acord în cazul unor grupuri mari

Self-reinforcing disadvantage: într-un grup în care majoritea nu

cooperează pare preferabil să nu cooperezi –

ceea ce reduce dramatic şansele vreunui proiect colectiv; fiecare persoană care decide să nu coopereze subminează odată în plus posibilitatea cooperării şi le oferă celor indecişi un motiv în plus să nu coopereze.

Echilibrul Nash

Una din contribuţiile importante la discuţia cu privire la modul de coordonare a strategiilor în situaţii de interdependenţă a fost adusă de John Nash, într-un articol din 1951, “Non-cooperative games”.

Spre deosebire de John von Neumann şi Oskar Morgenstern, care definiseră deja conceptul în 1944, însă doar cu referire la jocurile cu sumă nulă, Nash a demonstrat faptul că există un echilibru Nash pentru orice joc cu un număr finit de mutări.

Echilibrul Nash

Dacă există un set de strategii

proprietatea că nici unul

dintre

jucători

nu poate

obţine

un beneficiu

superior

schimbarea unilaterală a propriei strategii, atunci

setul respectiv

utilitaţile

asociate

constituie

un punct de echilibru Nash

Rezultatul unui joc în care jucătorul A alege strategia optimă, dată fiind strategia aleasă de B, iar B alege strategia optimă dată fiind strategia aleasă de A

Echilibrul

Echilibrele

Nash nu reprezinta

cu necesitate

puncte

de optim

paretian

O alocare este ineficientă paretian atâta vreme cât pot fi făcute ajustări ale distribuţiei care îmbunătăţesc situaţia unuia sau a mai multor participanţi, fără să înrăutăţească situaţia celorlalţi

Echilibru

al selectării

strategiilor vs. “echilibru”

al distribuţiei beneficiilor; problema consecinţelor neintenţionate şi a “efectelor perverse”

Ex. Boudon: creşterea semnificativă a cererii de educaţie în vestul Europei, după al doilea război mondial, care a antrenat o creştere a costurilor legate de educaţie, formare şi acces la piaţa muncii (Boudon vorbeşte despre „creşterea preţului de cumpărare a statutului social”).

Echilibrul

Identificarea strategiilor dominante ale fiecărui participant (acolo unde există), urmată de identificarea punctelor de intersecţie

Doar pentru strategii pure: identificarea câmpurilor din tabel în cazul cărora valoarea beneficiilor reprezintă valoarea maximă pe coloana şi rândul respective

Strategii

pure si

mixte: Matching pennies

Cap Pajură

P1Cap 1,-1 -1,1

Pajură -1,1 1,-1

Dacă monedele arată ambele cap sau ambele pajură, atunci P1 câştigă un punct. Dacă monedele arată cap şi pajură, atunci punctul este câştigat de P2.

Există un echilibru Nash

în situaţia în care ambii jucători aleg strategii pure?

Strategii

pure si

mixte: Matching pennies

Cap Pajură

P1Cap 1,-1 -1,1

Pajură -1,1 1,-1

În situaţia dată, P1 poate face următorul raţionament: dacă voi alege ca moneda mea să arate „pajură”

cu o probabilitate mai mare de 50%, atunci P2 va avea mai multe şanse de câştig, putând să aleagă „cap” cu probabilitate 100%. Dacă aleg ca moneda mea să arate „pajură” cu o probabilitate mai mică de 50%, atunci P2 are mai multe şanse de câştig, dacă arată „pajură”

cu probabilitate 100%. Singurul fel în care pot avea şanse egale de câştig este să aleg în mod aleator

„cap”

sau „pajură”

cu o probabilitate de 50%.

Jocul are un echilibru Nash

pentru strategii mixte, nu şi pentru strategii pure.

Strategii

pure şi mixte

John Nash, “Non-cooperative games" (1951) – fiecare joc finit are cel puţin un echilibru Nash, însă

unele echilibre există doar pentru strategii mixte (cazuri în care cel puţin un jucător selectează o

strategie mixtă).

Pot fi identificate echilibre Nash

doar pentru strategii pure, doar pentru strategii mixte, sau pentru ambele.

Strategii pure şi mixte – driving game

Strategii pure: există 2 echilibre Nash, când ambii şoferi decid să conducă pe stânga sau pe dreapta

Strategii mixte, avem 3 echilibre Nash:

(0%,100%) pt

şoferul 1, (0%, 100%) pt

şoferul 2,

(100%, 0%) pt

şoferul 1, (100%, 0%) pt

şoferul 2,

(50%, 50%)

pentru ambii şoferi

Direcţia

deplasarePe stânga

Pe dreapta

Pe stânga 100, 100 0,0

Pe dreapta 0,0 100, 100

Raţionalitate

Dacă un joc are un singur echilibru Nash

şi sunt îndeplinite o serie de condiţii, toţi jucătorii vor alege strategia adecvată atingerii acelui echilibru.

Condiţiile sunt următoarele:

Jucătorii urmăresc exclusiv maximizarea propriei utilităţi estimate, în cadrul jocului,

Ei sunt suficient de inteligenţi pentru a identifica soluţia corectă,

Procesarea informaţiei şi alegerea mutărilor se desfăşoară fără erori,

Ei cunosc strategiile optime ale celorlalţi jucători,

Toţi jucătorii cunosc aceste condiţii, inclusiv condiţia de faţă.

presupoziţii de raţionalitate aplicate decidentului generic al teoriei jocurilor –

în ce măsură sunt ele relevante pentru decidentul real? Sunt ele utile, chiar dacă nu oferă o descriere realistă a deciziilor efective?

Informaţie imperfectă şi incompletă, timp limitat, complexitate decizională.

Echilibrul

Deţinut 2

Cooperează Trădează

Deţinut 1 Cooperează 3,

Trădează 5, 1 2, 2

(valorile reprezintă beneficii, nu ani de închisoare)

Dilema

prizonierilor

Strategia

globală optimă nu corespunde echilibrului Nash. De ce?

Echilibre stabile

În jocuri cu strategii mixte, un echilibru Nash este stabil dacă:

O schimbare infinitezimală a probabilităţilor alocate strategiilor unui jucător

nu îmbunătăţeşte situaţia

celuilalt jucător (nu are la dispoziţie o strategie mai avantajoasă),

Jucătorul care a modificat alocarea propriilor probabilităţi este dezavantajat.

Ex: în matching pennies şi driving game ce tipuri de echilibre Nash există?

Bibliografie

Textele lui Nash:

"Equilibrium points in n-person games" Proceedings of the National Academy of Sciences 36(1):48-49.

"Non-Cooperative Games" The Annals of Mathematics 54(2):286-295.

McCain, Roger (2003) Game Theory: A Non-Technical Introduction to the Analysis of Strategy, South-Western College Pub

Williams, John Davis (1954) (PDF), The Complete Strategyst: Being a Primer on the Theory of Games of Strategy, Santa Monica: RAND Corp.

Kreps, David

M. (1990)

Game theory and economic modelling, Oxford University Press

Von Neumann, John & Morgenstern, Oskar (1943)

The Theory of Games and Economic Behavior, Princeton: Princeton University Press

Fudenberg, Drew & Tirole, Jean (1991)

Game theory, Cambridge, MIT Press

Rubinstein, Ariel; Osborne, Martin J. (1994), A course in game theory, MIT Press

Recap: tipologia jocurilor - Photography and more – My … · · 2011-01-15În teoria...

Documents