čtvrtek 21. srpna 2008

Jestřábi a hrdličky

Příklad jsem převzal z Dawkinsova Sobeckého genu, přičemž jsem provedl výpočty, které Dawkins ve své knize neuvedl. Představme si, že jedinci v nějaké populaci mezi sebou bojují, přičemž každý jedinec má dvě možnosti, jakým způsobem s tím druhým bojovat. První způsob – Dawkins ho nazývá hrdliččím (H) – je bojovat jenom symbolicky. Dawkins dává příklad takovéhoto souboje jako dlouhého zírání do oka soupeře, přičemž prohraje ten, kdo první uhne pohledem. Druhý způsob – Dawkins ho nazývá jestřábím (J) – je bojovat doopravdy všemi silami. Výhoda prvního způsobu je, že jedinec, i když v boji prohraje, neutrpí fyzickou újmu. Velká nevýhoda prvního je, že sok může namísto symbolického boje nepřipraveného jedince porazit a těžce zranit. Dawkins předepisuje ocenění výhry 50ti body a za prohru dává 0 bodů. Ztráta času při boji způsobem H je trestána odnětím 10 bodů. Vážné zranění při boji způsobem J je trestáno odnětím 100 bodů. Dále budu předpokládat, že zvolí-li sokové stejný způsob boje, je pravděpodobnost jejich vítězství 1/2. Bojují-li oba sokové způsobem H, pak je jejich průměrný zisk (50 - 10)/2 + (-10)/2 = 20 - 5 = 15. Bojují-li oba sokové způsobem J, pak je jejich průměrný zisk 50/2 + (-100)/2 = -25. Bojuje-li jeden sok způsobem H a druhý způsobem J, pak druhý vždy zvítězí, ale první není zraněn. Zisk prvního je tedy průměrně 0 a druhého průměrně 50. Budu používat ne obyčejnou strategii, ale strategii rozšířenou. Rozšířená strategie S je reprezentována číslem p(S) představující pravděpodobnost zvolení způsobu H. Pravděpodobnost zvolení způsobu J je 1 – p(S). Jednotliví sokové vzájemně o svých strategiích nevědí. Průměrný zisk soka se strategií p(A) bojujícího se sokem se strategií p(B) je dáno následující formulí:

z(p(A),p(B)) = 15 p(A) p(B) + 50 (1-p(A)) p(B) + 0 p(A) (1-p(B)) + (-25) (1-p(A)) (1-p(B)) = = 75 p(B) + (25 - 60 p(B)) p(A) - 25.

Nejprve se pokusím vypočítat optimální strategii p(OS). Optimální strategie p(OS) maximalizuje průměrný zisk, pokud je tato strategie zaujata veškerou populací, neboli

z(p(OS), p(OS)) = max{z(p,p)} = max{(-60) p . p + 100 p - 25}.

Funkce z(p,p) je kvadratická funkce a proto má jen jediný extrém a protože nejvyšší koeficient je záporný, je tímto extrémem maximum. Proto platí:

d z(p,p) / d p = -120 p(OS) + 100 = 0.

Výsledek je p(OS) = 5/6. V tomto případě je průměrný zisk roven 16,666... . Nyní se pokusím odvodit evolučně stabilní strategii p(ESS). Strategie je evolučně stabilní, jestliže nejvýnosnější strategie prvního soka p(A) za předpokladu, že druhý sok má strategii p(ESS), je rovna právě p(ESS). Evolučně stabilní strategie je výsledkem rovnice

d z(p(A),p(ESS)) / d p(A) = -60 p(ESS) + 25 = 0.

Výsledek je p(ESS) = 5/12. V tomto případě je průměrný zisk roven 6,25. Optimální strategie tedy není evolučně stabilní. Protože rovnice evolučně stabilní strategie má pouze jedno řešení, bude populace ve svém vývoji konvergovat právě k této strategii. Oproti optimální strategii, je evolučně stabilní strategie o polovinu menší. To znamená, že oproti optimální strategii přibude v populaci tvrdých soubojů spojených s těžkými zraněními. Proto tato hra slouží Dawkinsovy jako příklad šíření agresivity.

Žádné komentáře: