Регіональна та національна економіка / Аналіз фінансово-господарської діяльності підприємства / Орендні відносини / Аудит / Бізнес-планування / Бухгалтерський облік і контроль / Бюджетна система / Інвестування / Інноваційна діяльність / Інформаційні системи в економіці / Кризова економіка / Лізинг / Логістика / Математичні методи та та моделювання в економіці / Організація виробництва / Оцінка і оціночна діяльність / Споживча кооперація / Страхова справа / Теорія управління економічними системами / Теорія економіки / Управління фінансами на підприємстві / Економіка гірської промисловості / Економіка міського і сільського господарства / Економіка нерухомості / Економіка нафтогазових галузей промисловості / Економіка природокористування та природоохоронної діяльності / Економіка, організація і управління підприємствами / Економічна статистики / Економічний аналіз / Економічне прогнозування
ГоловнаЕкономіка та управління народним господарствомЕкономіка, організація і управління підприємствами → 
« Попередня Наступна »
С. Л. Печерський, А. А. Бєляєва. Теорія ігор для економістів. Вступний курс. Навчальний посібник. - СПб.: Вид-во Європ. Ун-ту в С. Петербурзі. - 342 с., 2001 - перейти до змісту підручника

1.11. Доповнення. Рішення біматричних ігор 2x2

У цьому параграфі ми докладно зупинимося на аналізі рішень біматричних ігор, в яких у кожного з гравців є тільки дві стратегії. Зрозуміло, ці ігри являють собою окремий випадок розглянутих раніше ігор, але тут з'являється можливість дати наочну графічну інтерпретацію пошуку рівноважних ситуацій у грі. (Наше виклад тут слід книзі Воробйова, 1985.)

Розглянемо біматричних гру 2 X 2 з матрицею

/ (ац, Ьц) («12, ^ 12) А V («21, ^ 21) (« 22, ^ 22) /

або, як ми вже відзначали, гру, виграші в якій можна задати за допомогою двох матриць:

/ an, ai2 \ (Ьц, Ь12 \ V «21,« 22 / 'V Ь21, Ь22 /'

перший з яких описує виграші гравця 1, а друга - виграші гравця 2.

Очевидно, що змішані стратегії гравців у випадку ігор 2x2 повністю описуються ймовірностями р і q вибору гравцями своїх перших чистих стратегій. (Другі чисті стратегії вибираються, відповідно, з вірогідністю 1-р та 1 - q.) Тому, оскільки 0 <р, q <1, кожна ситуація в змішаних стратегіях в біматричних грі 2x2 представляється як точка на одиничному квадраті.

Нагадаємо, що пара змішаних стратегій а ^ = (р *, 1-р *) і <72 = (q *, 1 - q *) є рівновагою Неша, якщо змішана стратегія а * одного гравця є найкращою відповіддю на змішану стратегію а * іншого гравця, тобто виконуються наступні нерівності :

MI (cti, а2) ^ 2 (0-1,0-2) < Z7i (cr *, cT2) Vo-2-

Розглянемо вже знайомий нам приклад «Орел або Решка» (див. рис. 23, п. 1.8). Нехай гравець 1 вважає, що гравець 2 вибиратиме «Орла» з імовірністю q і «решка» з імовірністю 1 - q. Очікуваний виграш гравця 1 від розігрування «Орла» буде (- 1) д + Г (1 - q) = 1 - 2q, а від розігрування «решка »l-g + (-l) - (lg) = 2g-1. Якщо 1 - 2g> 2g-1, тобто q <\

ТО

2 '

кращою чистої стратегією гравця 1 буде Орел, а якщо q> ^, то Решка, і гравцеві 1 буде все одно, що розігрувати, якщо q = i. Розглянемо можливі змішані стратегії гравця 1. Нехай (р, 1 - р) позначає змішану стратегію, в якій гравець 1 розігрує «Орла» з імовірністю р. Для кожного значення q ми можемо обчислити значення р = p * (q), такі що (р, 1 - р ) буде найкращою відповіддю гравця 1 на (q, 1 - q) гравця 2.

Очікуваний виграш гравця 1 від розігрування (р, 1 - р), коли гравець 2 розігрує (q, 1 - q), буде

(-l) p - q + 1 - р - (1 - q) + 1 - (1 - р)? q + (-1) - (1 - р ) {1 - q) =

= (2g - 1) + p - (2 - 4g).

Очікуваний виграш гравця 1 підвищується (залежно від р), якщо 2 - 4д> 0 і зменшується, якщо 2 - 4д <0, тому кращий відповідь гравця 1 (серед усіх стратегій, як чистих, так і змішаних) є р = 1 (тобто Орел), якщо q <^, але р = 0 (тобто Решка), якщо q> Цим значенням р відповідають два горизонтальних відрізка на рис. 29.

Так як при q = \ очікуваний виграш гравця 1 не залежить від його стратегії, ми отримуємо, що гравцеві 1 байдуже, чи вибрати одну зі своїх чистих стратегій, або ж вибрати яку-небудь змішану стратегію ( р, 1 - р). орел 1

решка

решка

1

орел

Рис. 29.

Ве відображення (оскільки при q = \ ми маємо цілий відрізок) кращих відповідей (залежно від q).

Це означає, що якщо g = ^, то змішана стратегія (р, 1-р) є найкращою відповіддю на змішану стратегію (q, 1 - q) при будь-якому значенні р від 0 до 1. Тому р * {\) являє собою вертикальний відрізок, зображений на рис.29. Таким чином, ламана лінія на рис. 29 являє собою багатозначний-Схожими міркуваннями і в силу симетрії матриці виграшів гравця 2 отримуємо аналогічне відображення кращих відповідей гравця 2. На рис. 30 це ламана q * (p).

Орел

q * (p)

2 січня

решка

Рис. 30 показує, що рівновага Неша в грі «Орел або Решка» виникає, якщо гравець 1 розігрує змішану стратегію - 1 U "2

q

1

орел

V2, 2у і гравець розігрує таку ж стратегію, що, мабуть, було природно очікувати в силу симетричності гри.

Решка

Рис. 30.

Важливо зауважити, що цей приклад ілюструє, що невипадково, якщо один з гравців вибирає свої стратегії равновероятно (тобто дотримується своєї рівноважної стратегії), то другому гравцеві при цьому абсолютно байдуже, як грати. Це випливає з властивості, доведеного раніше (див. п. 1.7) у загальному випадку:

U1 (s1, a *) = t / lK, CT2 *),

(11.1)

^ (a *, s2) = t / iK, ^) для тих Si, які входять до рівноважну ситуацію з ненульовими ймовірностями. Для тих же si, які входять до рівноважну ситуацію з нульовою ймовірністю, вірні нерівності:

Ui (s't, a *) ( 11.2)

Ui (a *, st) Формули (11.1), (11-2) дають дієвий спосіб визначення рівноважних ситуацій в довільних біматричних іграх 2x2.

Очікуваний виграш гравця 1 від розігрування про \ = (р, 1 - р), коли гравець 2 розігрує а2 = (q, l - q):

Ui (oi, <т2) = p {anq + (1 - q) a2i + a22)) (p - 1),

? M Введемо позначення: С = ац-а \ 2 - a2i + a22, а = <222 - «12 -

Найкраща відповідь гравця 1 на довільну стратегію а2 гравця 2 можна отримати з умов невід'ємності:

Ui (oi, o2) -? / i (si, <т2)> 0;

Ui (oi, o2) - f / i (s2, <т2)> 0 .

З урахуванням введених позначень вони виглядають таким чином:

(р-1) (Cq - а)> 0,

( 11.3)

p (C'q - а)> 0.

Аналогічно можна поступити для знаходження кращої відповіді гравця 2.

Очікуваний виграш гравця 2 від гри = (q, 1 - q), коли гравець 1 грає а \ = (р, 1 - р):

U2 { = Ь22 + (b12 - b22) p + (621 - ь22 + p (bu - Ь \ 2 - Ь21 + b22)) q.

З умов (неотрицательности)

и2 (аг, а2) - C / I (cti, SI)> О,

Ui (oi, а2) -? / 1 (0-1, s2)> О,

позначивши D = Ьц - Ь \ 2 - Ь2 \ + Ь22, / 3 = Ь22 - Ь2 \ , отримуємо аналогічні нерівності для знаходження кращої відповіді гравця 2 на довільну стратегію а = (р, 1 - р) гравця 1:

(ql) (Dp-(i)> О,

(11.4)

q (Dp - (3)> 0.

Тоді, для того щоб пара о \ = (р, 1 - р), а2 = (q, 1 - q) визначала рівноважну ситуацію, необхідно і достатньо одночасне виконання систем нерівностей (11.3), (11.4), а також 0 <р <1, 0 Розглянемо кращі відповіді кожного гравця, які, зрозуміло, залежать від того, як влаштовані матриці виграшів гравця 1 і гравця 2. Почнемо з нерівностей (11.3).

Можливі три випадки: 1)

р = 1, C'q> а, 2)

0 <р <1, Cq = а; (11.5) 3)

р = 0, C'q <а.

У свою чергу, залежно від співвідношень між С і а можливі наступні випадки і відповідні кращі відповіді гравця 1 в кожному з них. рис. 31-33: Р

I. Якщо С> 0, а> 0, то кращі відповіді зображені на

Р а / С = 1 Рис. 32.

q

1 а / С а / С> 1 Рис. 31.

р

q

А / С <1 Рис. 33.

II. Якщо С <0, а <0, то кращі відповіді зображені на рис. 34-36: р

р

а / С> 1 Рис. 34.

1 а / С q

1 Ч

а / С = 1 Рис. 35. Р

а / С <1 q

а / С 1 Рис. 36. III. При С> 0, а <О кращий відповідь гравця 1 зображений на рис. 37, якщо, навпаки, С <0, а> 0, то цієї нагоди відповідає рис. 38: Р

Р

q

q

а / С

а / С Рис. 38.

Рис. 37. Розгляд випадків, коли або С, або а, або вони разом дорівнюють нулю, ми залишаємо читачеві.

Аналогічно можна побудувати кращі відповіді гравця 2.

Рівноважним ситуацій графічно відповідають точки перетинів множин кращих відповідей гравців. Поєднуючи графіки кращих відповідей гравця 1 з будь-яким графіком найкращих відповідей гравця 2, можна отримати всілякі варіанти множин рівноважних ситуацій біматричних гри 2x2.

Розглянемо геометричний зміст умов (11.3) і (11.4) на прикладі описаної вище гри «Дилема ув'язненого».

Нагадаємо, що ситуація, що склалася в цій грі, задається матрицею Мовчати Зізнатися

мовчати зізнатися (-1, -1) (-10,0) (0, -10) (-6-6) Маємо С = -1 - (-10) -0 + (-6) = 3, ot = -6 - (-10) = 4, D = -1 - 0 - (- 10) + (-6) = 3, / 3 = -6 = (-10) = 4.

Тоді умови (11.3), (11.4) виглядають наступним чином:

(р-1) (3д-4)> 0, (q - 1) ( 3р - 4)> 0,

p (3q - 4)> 0, q (3p - 4)> 0.

Звідси отримуємо, що при р = 1 q> |, при 0 <р <1 q = |, при р = 0 q <|; при q = 1 р> |, при 0 < д <1 р = |, при g = 0 g <|. Отримані кращі відповіді зображені на рис. 39.

Рис. 39.

З малюнка видно, що існує єдина ситуація рівноваги р = 0, q = 0. Це ситуація, в якій кожен з гравців вибирає друге чисту стратегію - Зізнатися.

Відзначимо кілька можливих якісних особливостей існуючих рівноваг.

1) Існує єдине рівновагу Неша в чистих стратегіях - наприклад, рис. 40 дає рівноважну точку р = 1, q = 0. «Дилема Ув'язненого» відноситься до такої нагоди (тут р = 1, q = 1).

Р

? D

q С

Рис. 40. 2) Існує єдине рівновагу Неша в змішаних стратегіях. Гра «Орел» або «Решка» є прикладом такого випадку (див. рис.30). 3)

Існує три рівноваги Неша - два в чистих стратегіях і одне - в змішаних. Такого типу ситуація виникає в грі «Сімейний суперечка» (див. рис. 41).

Р q

а / С Рис. 41. 4) Існує два рівноваги Неша в чистих стратегіях. Така ситуація виникає, зокрема, коли в матриці А виграшів гравця 1 = «22> а в матриці В виграшів гравця 2612 = 622 (див. ріс.42).

Р С> Про

Рис. 42.

5) Існує континуум рівноваг Неша (у змішаних стратегіях). Прикладів такого роду рівноваг можна запропонувати дуже багато (див. ріс.43).

А / С; Ч

Рис. 43.

Зауваження 1.11.1. Слід зазначити цікаву властивість, властиве деяким типам рівноваг. А саме, у випадках 1), 2), 3), коли рівноважних ситуацій у грі непарне число, при досить малих змінах елементів матриць виграшів зигзаги також злегка «поворухнуться», але їх загальна форма і характер їх взаємного розташування не зміняться, а значить , не зміниться і число рівноважних ситуацій.

Цього не можна сказати про випадки парного і нескінченного числа рівноважних ситуацій. У цих випадках найменша зміна елементів матриць виграшів може призводити до зовсім інших якісним ситуацій. Наприклад, ситуація, зображена на рис. 42, може перейти в ситуацію або з одним чистим рівновагою, якщо а = О, / 3 <О (622 <621) (див. рис. 44)> або в ситуацію з трьома рівновагами, якщо а> О, / 3> Про («22 О, / 3 = 0 (див. ріс.46).

Р

Р

q

1 Рис. 44

Рис. 45.

Р

Рис. 46

Зауваження 1.11.2

випадок, коли З

Розглянемо найбільш цікавий і D не дорівнюють нулю. Тоді рівноважна ситуація визначається двома формулами р = q = ^, з яких випливає, що в рівноважної ситуації вибір гравця 1 визначається елементами матриці виграшів гравця 2 і не залежить від елементів власної матриці, а вибір гравця 2 в рівноважної ситуації повністю визначається елементами матриці гравця 1 і не залежить від елементів власної матриці. Іншими словами, рівноважна стратегія обох гравців визначається не стільки прагненням збільшити власний виграш, скільки тримати під контролем виграш іншого гравця (мінімізувати його). Таким чином, в біматричних грі ми зіштовхуємося з антагонізмом інтересів, а з антагонізмом поведінки.

 « Попередня  Наступна »
 = Перейти до змісту підручника =
 Інформація, релевантна "1.11. Доповнення. Рішення біматричних ігор 2x2"
  1.  1.2. Світові тенденції розвитку малого підприємництва
      додаток А. Маршалла до теорії підприємництва? Опишіть методологічний підхід до сутності підприємництва І. Шумпетера. У чому особливості теорії підприємництва австрійської економічної школи? Як визначали соціально-економічні інститути представники «старого» і «нового» інституціоналізму? У чому суть підприємництва як категорії інституціональної економічної теорії?
  2.  3.1. Венчурний механізм підтримки малого бізнесу
      доповнень у частину другу Податкового кодексу Російської Федерації і деякі інші акти законодавства Російської Федерації про податки і збори, а також про визнання такими, що втратили чинність окремих актів (положень актів) законодавства Російської Федерації про податки і збори », скасовано пільги з податку на прибуток, у тому числі і для малих підприємств. Витрати на НДДКР повністю включаються до
  3.  ЗАБЕЗПЕЧЕННЯ PUBLICITY, ТЕКУЩАЯ РОБОТА І фонової інформації
      доповнення, уточнення тощо Варто тільки пам'ятати про золоте правило логіки спору - не сперечатися, а якщо вже вас втягують в полеміку, то мовчати до останнього. Тому ніколи не варто поспішати з спростуваннями, навіть якщо керівництво, під впливом перших емоцій вимагає такого спростування і негайно. Сперечатися, доводити, вимагати спростувань - означає демонструвати, що вас це зачепило,
  4.  ПРЕДСТАВНИЦЬКИЙ ПРИЙОМ
      доповненням до сувеніра, який може бути і менше, і більш дорогим у порівнянні з ними, але саме він залишиться. Критерій наочності (попадання на очі). Тут, по-перше, оцінюється, як часто клієнт, який отримав сувенір, буде тримати його в полі зору. По-друге, яка аудиторія, на очі якої потрапить сувенір, коли клієнт буде користуватися ним. Припустимо, автомобільна компанія дарує
  5.  Благодійність: проблеми та організація
      додаток до стабілізаційним кредитом Центрального банку. Картини поки висять у банківських офісах, але під контролем позикодавця. Іноді навколо таких колекцій розпалюються неабиякі скандали. Вони можуть використовуються для дозволу серйозних проблем. Наприклад, сумно відомий Інкомбанк, як і інші великі приватні російські банки, почав збирати свою колекцію в 1992 році. Вже до 1998-у році він
  6.  4.6. Креативні технології в PR
      доповнення попереднього прийому. Вибрані слова можна спробувати з'єднати різними приводами: в, на, з, під, над, of, через. Вийде, як мінімум, смішно: шафа в тигре або тигр в шафі, шафа на тигрі або тигр на шафі, тигр з шафою і т. д. "Нісенітниця" - відома дитяча гра, коли учасники по черзі пишуть слово, закривши для кожного наступного раніше написане, а потім, розгорнувши лист
  7.  КОДЕКС ПРОФЕСІЙНОЇ ПОВЕДІНКИ ІНСТИТУТУ PR (ІПР)
      додаток до нього Асоціація консультантів з проблем PR розробила Кодекс консультативної практики, що має відношення до діяльності консультаційних фірм, що входять в цю асоціацію. Так само, як і інші професійні організації, зобов'язані дотримуватися етичних норм, практик PR або організація PR беруть на себе зобов'язання дотримуватися певних правил, що служить гарантією гідного
  8.  2.1 Постановка та математична модель задачі
      додаток до (2.1) - (2.2) накладаються наступні умови, пов'язані зі значенням прибутку від одиниці продукції, що випускається на t-му інтервалі часу: Г? min * qlt *, / = 1, - - -, n, [xmaX = ft ( qu), де q / min - мінімальне значення прибутку від одиниці /-го продукту на t-му інтервалі часу; qmax - максимальне значення прибутку від одиниці /-го продукту на t-му інтервалі часу; ft (q / t) - значення
  9.  3.1. Трудові ресурси некомерційних організацій.
      доповнення до Закону «Про благодійну діяльність та благодійні організації», насамперед, змінити формулювання «безоплатного праці», що виключає будь-які форми матеріального і нематеріального заохочення волонтерів, а також визначити механізми стимулювання і контролю праці добровольців. Крім того, необхідно вирішення питання про можливість компенсації витрат добровольців будь
  10.  список літератури
      доповнень до Закону Російської Федерації "Про освіту" »від 13.01.1996 № 12-ФЗ. Федеральний закон «Про вищу і післявузівську професійну освіту» від 22.08.1996 № 125-ФЗ. Федоров В. А. Професійно-педагогічна освіта: теорія, емпірика, практика. Єкатеринбург: Изд-во Урал. держ. проф.-пед. ун-ту, 2001. 330 с. Федоров В. А., Коллегова Е.Д. Інноваційні технології в управлінні
енциклопедія  млинці  глінтвейн  кабачки  медовуха