Большая Энциклопедия Рефератов - Ігри з природою - скачать рефераты, бесплатно рефераты

Рефераты. Ігри з природою

1.2.2 Принципи вибору стратегій в статистичних іграх

Принципом вибору називають правило, що дозволяє визначити якнайкращу змішану стратегію статистика. В різних випадках статистик може користуватися різними принципами вибору своєї стратегії.

Одним з можливих принципів вибору стратегії може бути принцип мінімакса, який успішно застосовують в стратегічних іграх, коли гра ведеться проти розумного супротивника, охочого заподіяти нам найбільшого збитку. Проте у ряді випадків доцільно використовувати цей принцип і в статистичних іграх. Згідно принципу мінімакса статистик вибирає таку змішану стратегію , при якій середні втрати будуть мінімальні при якнайгіршому для нього стані природи . Найгіршим випадком буде таке , коли величина приймає максимальне значення. Цю величину статистик і повинен мінімізувати, тобто вибирати стратегію , яка забезпечує умову:

Іноді доцільно вибирати стратегію, виходячи не з повних втрат L(, а), а з додаткових L’(, а), що визначаються із співвідношень:

L’(, а)= L(, а) - .

Мінімаксні принципи, що витікають з припущення, що природа діє якнайгіршим для статистика чином, є виправданими в стратегічних іграх, але в статистичних іграх вони виражають точку зору дуже обережної людини, що прагне отримати доступне і що не ганяється за нездійсненним, щоб не зазнати випадково великого збитку. Недоліком мінімаксних принципів слід вважати також те, що вони не враховують апріорної інформації про стани природи і тим самим обмежують той виграш, який ця інформація може дати.

Тому мінімаксні принципи можна рекомендувати в тих випадках, коли відсутня апріорна інформація про стани природи або є підстави сумніватися в достовірності цієї інформації. Іншим принципом вибору стратегії, що враховує апріорний розподіл вірогідності , є байесовський принцип. Згідно байесовському принципу змішану стратегію статистика (а) оцінюють шляхом усереднювання втрат по всіх можливих станах природи з урахуванням апріорного розподілу вірогідностей , тобто по величині:

Якнайкращою стратегією (а) при цьому буде така, яка дає мінімум величини . Цю якнайкращу стратегію називають байесовською стратегією.[5] Байесовський принцип, природно, можна застосовувати як до повних, так і до додаткових втрат. Проте в більшості випадків застосовують байесовський принцип до повних втрат.

1.2.3 Допустимі стратегії в статистичних іграх

Припустимо, що розглядаємо змішану стратегію статистика (а). Можуть зустрітися два випадки.

1. Не можна знайти жодній стратегії, кращої ніж (а). Це означає, що не існує такої стратегії (а), для якої:

(1.2.3.1)

при всіх , хоча для деяких співвідношення (1.2.3.1) буде справедливе. В цьому випадку стратегію (а) можна назвати допустимою, але вона може і не бути бажаною, оскільки можуть бути і інші стратегії, які також мають право на увагу.

2. Існує стратегія (а), краща ніж (а). Це означає, що співвідношення (1.2.3.1) для стратегії (а) буде справедливе при всіх . В цьому випадку стратегію (а) потрібно виключити з розгляду на користь стратегії (а), тобто вважати її неприпустимою. Допустимі стратегії зручно розглядати в термінах S-гри. Оскільки в S-грі стратегія статистика визначається точкою S опуклої оболонки S*, а втрати при різних визначаються координатами цієї точки, то стратегія, що визначається точкою S, буде допустимою, якщо не існує іншої точки , у якої всі координати будуть менше відповідних координат точки S. Метод знаходження допустимих стратегій розберемо для випадку, коли простір станів природи складається з елементів і . На мал. 1.2.3.1 показана опукла область S*, що відповідає цьому випадку.

Розглянемо стратегію, що визначається точкою , яка розташовується всередині області S*. Ця стратегія не є допустимою, оскільки всі точки, що лежать на відрізку OS1 усередині S*, визначають кращі стратегії, ніж . Якнайкращою з них є стратегія S, що належить нижній лівій межі області S*. [5]

Тому всі внутрішні точки можна виключити на користь точок, що належать нижній лівій межі області S*, відзначеної на малюнку жирною лінією. Проте зсув точки уздовж цієї межі не дає яких-небудь переваг, оскільки при цьому зменшуються втрати, що відповідають одному стану природи, але збільшуються втрати, що відповідають іншому стану природи. Тому точки, що належать нижній лівій межі області S* і визначають допустимі стратегії статистика.

Мал.1.2.2.1 Допустимі стратегії в S-грі

1.3 Принципи розв’язання статистичних задач

Розглянемо гру з природою: у нас (сторона А) є т можливих стратегій ; що стосується обстановки, то про неї можна зробити п припущень: . Розглянемо їх як «стратегії природи». Наш виграш при кожній парі стратегій заданий матрицею (таблиця 1.3.1).[2, c. 196-199]

Таблиця 1.3.1

Необхідно вибрати таку стратегію гравця А (чисту, або можливо, змішану, якщо це можливо), яка є більш вигідною в порівнянні з іншими.

Найпростіший випадок вибору розв’язку в грі з природою — це випадок коли якась із стратегій гравця А перевершує інші («домінує» над ними), як, наприклад, стратегія А2 в таблиці 1.3.2.

Тут виграш при стратегії А2 при будь-якому стані природи не менше ніж при інших стратегіях, а при деяких — більше; значить потрібний вибирати саме цю стратегію.

Таблиця 1.3.2

Якщо навіть в матриці гри з природою немає однієї домінуючій над всіма іншими стратегії, все ж таки корисно подивитися, чи немає в ній дублюючих стратегій і поступливих іншим за всіх умов. Але тут є одна тонкість: так ми можна зменшити тільки число стратегій гравця А, але не гравця П. Припустимо, що «чищення» матриці проведено, і ні дублюючих, ні явно невигідних гравцю А стратегій в ній немає. Припустимо, що виграш при нашій стратегії Ai і стані природа більше, ніж при нашій стратегії Ak і стані природи : >. Але за рахунок чого більше? За рахунок того, що вдало вибрали стратегію Ai? Необов'язково. Можливо, просто стан природи вигідніше, ніж . Наприклад, стан природи «нормальні умови» для будь-якої операції вигідніше, ніж «повінь», «землетрус» і т.п. Бажано ввести такі показники, які не просто давали б виграш при даній стратегії в кожній ситуації, але відображали б «вдачність» або «невдачність» вибору даної стратегії в даній ситуації. З цією метою в теорії рішень вводиться поняття «ризику». Ризиком гравця А при користуванні стратегією Ai в умовах називається різниця між виграшем, який ми отримали б, якби знали умови , і виграшем, який ми отримаємо, не знаючи їх і вибираючи стратегію Ai :

Для прикладу візьмемо матрицю виграшів ()(таблиця 1.3.3) і побудуємо для неї матрицю ризиків () (таблиця 1.3.4). При погляді на матрицю ризиків (таблиця 1.3.4) стають яснішими деякі риси даної «гри з природою». Так, в матриці виграшів () (таблиця 1.3.3) в другому рядку перший і останній елементи були рівні один одному: .

Таблиця 1.3.3

Таблиця 1.3.4

Проте ці виграші зовсім не рівноцінні в значенні вдалого вибору стратегії: при стані природи могли виграти найбільше 4, і вибір стратегії А2 майже абсолютно добрий; а ось при стані могли б, вибравши стратегію А1 отримати на цілі 6 одиниць більше, тобто вибір стратегії А2 дуже поганий. Ризик — це «платня за відсутність інформації»: в таблиці 1.3.4 r21 = 1, r24= 6. Природно, хотілося б мінімізувати ризик, супроводжуючий вибір розв’язку.

Найпростіший випадок невизначеності — це «доброякісна або стохастична невизначеність», коли стани природи мають якісь вірогідності і цю вірогідності нам відомі. Тоді вибираємо ту стратегію, для якої середнє значення виграшу, узяте по рядку, максимально:

А середній ризик повинен бути мінімальним:

Припустимо, що вірогідність у принципі існує, але невідомі. Іноді в цьому випадку припускають всі стани природи рівноімовірними (так званий «принцип недостатньої підстави» Лапласа), але взагалі-то це робити не рекомендується. Все-таки звичайно більш менш ясно, які стани більш, а які — менш вірогідні. Для того, щоб знайти орієнтовні значення вірогідностей , можна, наприклад, скористатися методом експертних оцінок.

Страницы: 1, 2, 3, 4