Смекни!
smekni.com

Теория принятий решений (стр. 10 из 11)

Формализация. Первый игрок имеет две чистые стратегии: покупать и не покупать специализированное ремонтное оборудование. У природы - второго игрока - четыре состояния: станок не выйдет из строя, выйдет один раз, сломается два раза и три раза. Функция выигрыша - затраты фирмы на покупку и ремонт станка, задается платежной матрицей:

Выход станка из строя

Ремонтное оборудование

ни разу

1 раз

2 раза

3 раза

не купить

-100

-140

-180

-220

купить

-150

-160

-170

-180

Решение. Рассмотрим сначала эту задачу как антагонистическую игру.

В матрице методом минимакса находим седловую точку: (2,4), таким образом, x* = ( 0, 1 ), y* = ( 0, 0, 0, 1 ), v* = - 180 ден.ед.

Ответ: нужно купить специализированное оборудование.

Однако в играх с природой положение коренным образом меняется: уже в условии заложена устойчивая смешанная стратегия природы: у = ( 0,3; 0,4; 0,2; 0,1) и мы знаем, что именно этой стратегии придерживается природа.

Если же человек - первый игрок - будет продолжать играть оптимально, то его выигрыш составит v(x*) = - 150 0,3 - 160 0,4 - 170 0,2 - 180 0,1 = - 161 , а если применит первую, неоптимальную стратегию, то математическое ожидание его выигрыша составит v(x') = - 100 0,3 - 140 0,4 - 180 0,2 - 220 0,1 = - 144 .

Таким образом, первому игроку выгодно играть неоптимально !

Ответ: не покупать специализированное оборудование.

Существенное различие между значениями v(x*) и v(x') обьясняется тем, что смешанная стратегия природы неоптимальна и она, "отклоняясь" от своей оптимальной стратегии "недополучает" 36 ден.единиц выигрыша.

2. Игры с природой в условиях неопределенности.

Если распределение вероятностей будущих состояний природы не известно, вся информация о природе сводится к перечню ее возможных состояний.

Пример. Игра "Поставщик".

Выпуск продукции фирмы существенно зависит от скоропортящегося материала, например, молока или ягод, поставляемого партиями стоимостью 100ед. Если поставка не прибывает в срок, фирма теряет 400 ед. от недовыпуска продукции. Фирма может послать к поставщику свой транспорт (расходы 50 ед.), однако опыт показывает, что в половине случаев транспорт возвращается ни с чем. Можно увеличить вероятность получения материала до 80%, если предварительно послать своего представителя, но расходы увеличатся еще на 50 ед. Существует возможность приобретать более дорогой (на 50%) материал-заменитель у другого, вполне надежного поставщика, однако, кроме расходов на транспорт (50 ед.) возможны дополнительные издержки хранения материала в размере 30 ед., если его количество на складе превысит допустимую норму, равную одной партии.

Какой стратегии должен придерживаться завод в сложившейся ситуации?

Формализация. У природы два состояния: поставщик надежный и поставщик ненадежный. У фирмы - четыре стратегии: 1) не осуществлять никаких дополнительных действий, 2) послать к поставщику свой транстпорт, 3) послать к поставщику представителя и транстпорт, 4) купить и привезти материал-заменитель от другого поставщика.

Составим таблицу расчетов:

Затраты и убытки фирмы-изготовителя

Ситуация

Стоимость материала

Недовыпуск продукции

Транспорт

Команди-ровочные расходы

Издержки хранения

Общая сумма

1 1

- 100

0

0

0

0

- 100

1 2

0

- 400

0

0

0

- 400

2 1

- 100

0

- 50

0

0

- 150

2 2

- 50

- 200

- 50

0

0

- 300

3 1

- 100

0

- 50

- 50

0

- 200

3 2

- 80

- 80

- 50

- 50

0

- 260

4 1

- 250

0

- 50

0

- 30

- 330

4 2

- 150

0

- 50

0

0

- 200

Решение. На основе полученных результатов вычислений можно составить платежную матрицу:

min

max

- 100

- 400

- 400

- 150

- 300

- 300

- 200

- 260

- 260

- 260

- 330

- 200

- 330

Ответ. Нужно придерживаться третьей стратегии и затраты не превысят 260 ед., если послать к поставщику представителя и транстпорт.

1. Рассмотренный способ поиска оптимального решения называется критерием Вальда (Максиминный критерий принятия решения). Выбирается решение, гарантирующее получение выигрыша не меньше, чем maxmin:

vW = maxi minj aij = -260 ед.

Применяя этот критерий мы представляем на месте природы активного и злонамеренного противника. Это пессимистичный подход.

2. Максимаксный критерий. Самый благоприятный случай:

vM = maximaxj aij = -100 ед.

Если фирма ничего не предпримет, то потратит не больше 100 единиц. Это критерий абсолютного оптимизма.

3. Критерий пессимизма-оптимизма Гурвица.

Представляется логичным, что при выборе решения вместо двух крайностей в оценке ситуации придерживаться некоторой промежуточной позиции, учитывающей возможность как наихудшего, так и наилучшего, благоприятного поведения природы. Такой компромиссный вариант и был предложен Гурвицем. Согласно этому подходу для каждого решения необходимо определить линейную комбинацию min и max выигрыша и взять ту стратегию, для которой эта величина окажется наибольшей:

vH = maxi [a maxi aij + (1-a) minj aij ], где a - “степень оптимизма” , 0£ a £1.

При a = 0 критерий Гурвица тождественен критерию Вальда, а при a =1 совпадает с максиминным решением.

На выбор значения степени оптимизма оказывает влияние мера ответственности: чем серьезнее последствия ошибочных решений, тем больше желание принимающего решение застраховаться, то есть степень оптимизма a ближе к нулю.

Влияние степени оптимизма на выбор решения в задаче “Поставщик”.

Степень оптимизма

Решение

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

А1

1 стратегия

-370

-340

-310

-280

-250

-220

-190*

-160*

-130*

А2

2 стратегия

-285

-270

-255

-240

-225*

-210*

-195

-180

-165

А3

3 стратегия

-254*

-248*

-242*

-236*

-230

-224

-218

-212

-206

А4

4 стратегия

-317

-304

-281

-278

-265

-252

-239

-226

-213

Величина vH для каждого значения a отмечена*. При a £ 4/9 критерий Гурвица рекомендует в задаче “Поставщик” решение А3, при 4/9£ a £2/3 - решение А2. В остальных случаях А1. А4 не выгодно во всех случаях.