Диференціальні ігри
Завантажити презентаціюПрезентація по слайдам:
Основні компоненти диференціальної гри: ігровий елемент x(t)=(x1,x2,…xn) у кожний момент t перший та другий гравець вибирають керуючий вектор: чисту стратегію u=(u1,u2,…up), ai≤ui≤bi, i=1,…,p; ui=ui(t), та чисту стратегію w=(w1, w2,…wq), cj≤wj≤dj, j=1,…,q, wj=wj(t), відповідно.
3. Вектори x, u, w задовольняють системи диференціальних рівнянь (10.1) де - права похідна xi по t, fi - задані функції від змінних x, u, w. 4. Вибір керуючих дій u та w в будь-який момент часу t приводить до вибору вектора х, що задовольняє рівняння (10.1). Гра продовжується у проміжку часу 0≤t≤T до тих пір, поки точка х не досягне межі С деякої замкненої множини А. Ця межа називається термінальною поверхнею.
5. Виграш першого гравця визначається формулою (10.2) Де k(x1,…xn) - щільність виграшу першого гравця в залежності від стану ігрового елементу х; функція G(x*) - це виграш, який одержує перший гравець за рахунок досягнення термінальної поверхні С; точка x* належить термінальній поверхні С.
Економічна інтерпретація диференціальної гри. Підприємство оцінює свою діяльність за наступними показниками: об’єм виробленої продукції, прибуток, рентабельність, зар. плата (ігровий елемент ) x=(x1, x2, x3, x4) Керівництво підприємства може використовувати керуючі дії: премії, норми виготовлення…(вектор управління u) Зовнішнє середовище застосовує свої(ант агоніcтичні) впливи на роботу підприємства: постачання сировини, рівень конкуренції, інфляція…(вектор управління w)
В залежності від досягнутих показників Х підприємство одержує бонуси для свого розвитку К(x1, x2, x3, x4). Крім того, перевиконавши план, підприємство додатково одержує оплату G(x*). Ця задача формалізується як гра двох гравців (підприємство, зовнішнє середовище) з нульовою сумою, у якій потрібно знайти такі u та w, для яких справедливо: v- ціна гри
Метод розв’язання диференціальних ігор полягає у заміні ігрових елементів їх цінами та розв’язанням рівнянь(10.1)
Нехай v(x)=v(x1,…xn) – ціна гри, що починається у точці x=(x1,…xn) у момент часу t=0. Тоді 1 гравець вибирає управління u1 , а другий – w1. Розвиток гри під час ∆t: Інтегральний виграш:
Ігровий вектор: Загальний виграш першого гравця: (10.3) (10.4) Підставивши (10.4) у (10.3) одержимо: (10.5) (10.5) – основне рівняння
Одержимо рівняння траєкторії: Диференціюємо (10.5) по xj: Введемо позначення: (10.6) Рівняння (10.6) та (10.1) називаються рівняннями траєкторії диференціальної гри.
Приклад (х, у) – ігровий момент u≥0, w≥0 Задано рівняння станів: Термінальна поверхня – вісь ОХ Виграш дорівнює: x0- абсциса точки, у якій закінчується партія.
Основне рівняння (10.5) має вигляд: y(v1cosu1+v2sinu1)+(x+y)(v1cosw1+v2sinw1)=-1 Оптимальні значення u1 та w1 знайдемо з умови max по u одержимо, коли: min по w одержимо, коли: cos w1=-cos u1, sin w1=-sin u1
Рівняння траєкторій: Розв’язки шукаємо на термінальній поверхні, тому Ƭ=T-t: Початкові умови:
Схожі презентації
Категорії