регистрация / вход

Теория принятия решений

Принятие решения в условиях неопределенности или риска. Матричные игры, разрешимые в чистых стратегиях. Многокритериальный выбор на языке бинарных отношений. Определение коэффициентов компетентности экспертов. Критерии модульного оценивания знаний.

Министерство образования и науки Украины

Запорожская государственная инженерная академия

Теория принятия решений

Учебно-методическое пособие

Ю.О. Матузко

Запорожье 2009


Содержание

Ведение

Раздел 1. Основные понятия и структура исследования операций

Раздел 2. Принятие решения в условиях риска

2.1 Постановка задачи

2.2 Критерий Байеса

2.3 Критерий Лапласа (Бернулли)

2.4 Критерий Гермейера

2.5 Критерий Ходжа-Лемана

Раздел 3. Принятие решения в условиях неопределенности

3.1 Принцип максимина

3.2 Критерий азартного игрока

3.3 Критерий произведений

3.4 Критерий Сэвиджа

3.5 Критерий Гурвица

Раздел 4. Принятие решения в условиях противодействия

4.1 Матричные игры

4.2 Матричные игры, разрешимые в чистых стратегиях

4.3 Матричные игры, разрешимые в смешанных стратегиях

4.3.1 Постановка задачи

4.3.2 Решение задачи симплекс-методом

4.3.3 Решение задачи графическим методом

Раздел 5. Принятие решения в условиях нескольких критериев выбора40

5.1 Постановка задачи, основные понятия

5.2 Линейные свёртки

5.3 Максиминная и лексикографическая свёртки

5.4 Мультипликативные свёртки

5.5 Многокритериальный выбор на языке бинарных отношений

Раздел 6. Принятие корпоративных решений

6.1 Групповая оценка объектов

6.2 Определение коэффициентов компетентности экспертов

Раздел 7. Критерии модульного оценивания знаний

Раздел 8. Задания для самостоятельной работы студентов

8.1 Домашняя контрольная работа

8.2 Вопросы к модульным тестированиям

8.3 Контрольные вопросы к экзамену по дисциплине

Учебно-методический материал по дисциплине


Ведение

Дисциплина "Теория принятия решений" читается студентам специальности "Автоматизированное управление технологическими процессами". Такой специалист по окончании учебы должен уметь выдать заказчику законченный программно-алгоритмический продукт, который будет автоматизировать процесс принятия решений в конкретном технологическом процессе, описанном заказчиком. Заказчик в таких случаях может представлять различные отрасли народного хозяйства: он может быть химиком, металлургом, строителем, экономистом, электронщиком и т.п. Главное, чтобы его технологический процесс, в котором нужно принимать решения, был успешно автоматизирован. Предлагаемый курс дает теоретические и практические основы математически обоснованного процесса принятия решений. Рассматриваемые в данном пособии задачи носят чисто абстрактный характер по своему текстовому условию. Главное в них – это количественные и качественные методы решения поставленной проблемы принятия решений, которые могут быть применены к различным отраслям.

В пособии охвачена лишь общая часть дисциплины "Принятие решений". Дело в том, что предмет "Теория принятия решений" читается студентам на протяжении всего двух календарных месяцев. Автор по возможности попытался за столь короткий срок охватить наиболее общие и значимые понятия и методы довольно широкой дисциплины "Принятие решений". Более детальную информацию по дисциплине можно получить из специальной литературы, указанной в пособии.

Данное учебное пособие содержит критерии модульного оценивания знаний, задания домашней контрольной работы, вопросы к модульным тестированиям, а также контрольные вопросы к экзамену по предмету "Теория принятия решений".

Раздел 1. Основные понятия и структура исследования операций

Принимать решения, как отдельному человеку, так и различным группам людей, вплоть до всего человечества приходится практически во всех областях своей деятельности. Единственное, чего мы не выбираем, следуя народной мудрости, так это родителей и Родины. Причем в некоторых областях (военных, медицинских, космических, в атомной энергетике, химической промышленности и др.) возникает потребность принятия достаточно сложных управленческих решений, ошибка в которых может повлечь за собой катастрофические последствия. В силу этого появилась необходимость выделить процесс принятия оптимальных решений в отдельную область науки, которая бы формализовала и систематизировала данный процесс.

Исторически считается, что это произошло в начале 40-х годов ХХ века, когда группа английских ученых математически сформулировала и нашла решение задачи об оптимальном способе доставки на фронт войск, оружия и снаряжения. И сразу же стали интенсивно поступать заказы на решение новых военных задач. Позднее эти исследования были перенесены и на гражданскую сферу и обобщены в отдельную науку – исследование операций .

Исследование операций стала основным научным инструментом при принятии оптимальных решений в самых разнообразных областях человеческой деятельности. Специалиста в этой науке в литературе обычно называют аналитиком (или системным аналитиком, или лицом, принимающим решение (далее ЛПР)).

Дадим некоторые основные определения и обозначим ориентировочное структурное строение исследования операций. Даная структура также отражает этапы, которые должен последовательно пройти ЛПР при принятии решения.

1 этап. Постановка (формулировка) задачи (проблемы).

На этом этапе аналитик должен трансформировать слова заказчика "хочу, чтобы было так" в четко сформулированную задачу. В 99% случаях заказчик не только не может предоставить, но и понятия не имеет о тех данных, которые необходимы аналитику для успешного разрешения проблемы. Оно и понятно – ведь у него нет соответствующего образования. (На самом деле, такое образование заказчику и не нужно, ведь он обратился к грамотному специалисту-аналитику, выпускнику ЗГИА! -) Все необходимое аналитик должен добыть себе сам. Так будет лучше по всем показателям – и по времени и, что немаловажно, по искажению информации (формулировка задачи с чьих-то слов уже априори чревато ошибками). Аналитику необходимо увидеть и изучить проблему "изнутри", для этого ему нужно "внедриться" в сложившуюся ситуацию. Зачастую аналитику надо "внедриться" и поработать на всех ключевых постах в организации заказчика, столкнувшейся с проблемой. На это может уйти от нескольких дней до месяцев.

2 этап. Построение математической модели задачи.

Здесь четко поставленная и сформулированная жизненная проблема формализуется математически.

1) Определяются переменные – переменные величины (их может быть как несколько, так и одна), изменение которых влияет на конечный результат задачи. Наборы различных конкретных значений переменных называются альтернативами (также во многих литературных источниках набор переменных называется планом ).

2) Определяются ограничения , которые накладываются на переменные. Пересечение всех полученных ограничений задает допустимое множество . Набор переменных, которые удовлетворяют всем ограничениям, называется допустимым планом .

3) Определяется критерий, по которому должны отбираться альтернативные решения (планы). Такой критерий называется целевой функцией .

Задача состоит в том, чтобы найти такой набор переменных (выбрать такую альтернативу), чтобы они принадлежали допустимому множеству (т.е. удовлетворяли всем ограничениям задачи) и чтобы целевая функция от этих переменных принимала свое оптимальное значение. Такой набор переменных называется оптимальным планом. Понятно, что оптимальный план должен быть допустимым, поэтому и ищется оптимальный план только среди допустимых планов.

Описанными первыми двумя этапами занимается дисциплина "математическое моделирование ", являющаяся составной частью исследования операций.

3 этап. Решение математической модели задачи.

Решением математических моделей задач занимается дисциплина "математическое программирование ".

В исследовании операций нет единого общего метода решений всех математических моделей. Многолетние исследования позволили обобщить и сгруппировать схожие типы моделей в определенные классы задач. Методы решения данных классов задач составляют отдельные разделы математического программирования, со временем они даже трансформировались в отдельные дисциплины. Дадим краткий обзор некоторых из них.

1) Линейное программирование . В этом классе задач и целевая функция и все ограничения являются линейными функциями. К таким задачам относятся:

задача о плане производства;

задача о диете;

и др.

2) Целочисленное программирование . В этих задачах целевая функция и все ограничения также являются линейными. Все переменные должны принимать только целочисленные значения. К таким задачам относятся:

транспортная задача;

задача о назначениях;

и др.

3) Динамическое программирование . Применяется, когда исходную задачу можно разбить на меньшие подзадачи и решать их пошагово. К таким задачам относятся:

задача коммивояжера;

задача об управлении запасами;

задача о ранце;

и др.

4) Нелинейное программирование . В этом классе задач либо целевая функция, либо все или некоторые ограничения являются нелинейными функциями.

Еще раз акцентируем внимание, что выше приведены лишь некоторые основные разделы математического программирования. Кроме указанных разделов еще существуют теория графов, теория расписаний, сетевое планирование, системы массового обслуживания, теория марковских процессов и др. Каждый раздел математического программирования – это отдельная сформировавшаяся дисциплина, требующая достаточно углубленного теоретического и, особенно, практического изучения.

4 этап. Принятие решений.

На этой стадии аналитик (лицо, принимающее решение) на основе пройденных предыдущих этапов должен принять оптимальное решение. Это и является предметом изучаемого курса "Теория принятия решений ".

Само собой разумеется, что студенты, приступившие к изучению курса "Теория принятия решений" ранее должны были изучить и, что немаловажно, успешно сдать и математическое моделирование, и математическое программирование. Без этого необходимого условия ЛПР вряд ли примет оптимальное решение. Невозможно ведь учиться в пятом классе, до этого не выучив во втором классе таблицы умножения! Равно как и невозможно быть директором роддома, не зная, откуда берутся дети.

Принятие решения – это задача управленческого типа. Под ней понимается задача выбора лицом, принимающим решение (ЛПР) наилучшего способа (исхода) из некоторого конечного множества допустимых вариантов (альтернатив). После принятия решения изучаемая система переходит в новое состояние, на которое будет реагировать окружающая среда. Окружающей средой может быть военная, экономическая, финансовая, техническая или какая-либо другая обстановка. При этом возможны такие случаи:

1) ЛПР знает реакцию окружающей среды на выбор им той или иной альтернативы, т.е. он знает насколько "полезной" или "вредной" для его системы будет реакция окружающей среды на выбор им той или иной альтернативы. Такая ситуация называется задачей принятия решения в условиях определенности . В условиях определенности математическое программирование дает точное решение поставленной задачи. Поэтому необходимости выбирать из нескольких вариантов попросту нет. Таким образом, в условиях определенности "Теория принятия решений" не используется, такими задачами занимается математическое программирование.

2) ЛПР знает вероятность реакции окружающей среды на выбор им той или иной альтернативы. Такая ситуация называется задачей принятия решения в условиях риска.

3) ЛПР ничего не знает о реакции окружающей среды на выбор им той или иной альтернативы. Такая ситуация называется задачей принятия решения в условиях неопределенности .

При этом предполагается, что в перечисленных случаях окружающая среда реагирует на принятое ЛПР решение беспристрастно (как природа), не преследуя никаких своих целей.

4) Однако зачастую бывают ситуации, когда в качестве окружающей среды может выступать, например, конкурирующая фирма, военный противник, конкурент на выборах и т.п. В этом случае такая окружающая среда будет реагировать уже совсем не беспристрастно, а сугубо в своих интересах. Такая ситуация называется задачей принятия решения в условиях противодействия .

Раздел 2. Принятие решения в условиях риска

2.1 Постановка задачи

Рассмотрим следующую ситуацию.

Представьте что вы – глава пенсионного фонда Украины. На счета пенсионного фонда Украины поступают налоговые отчисления по достаточно большой процентной (большей, чем в большинстве развитых странах) ставке. По расчетам этих денег должно хватить на выплату пенсий сегодняшним пенсионерам и на накопление для выплат сегодняшним налогоплательщикам, по достижении ими пенсионного возраста. Ваша непосредственная обязанность, как главы пенсионного фонда обеспечить выполнение этих двух задач. Первая задача – выплата текущих пенсий – это чисто техническое задание. Будем считать, что с ним вы блестяще справитесь.

А что делать с накоплениями? Если эти деньги не трогать и "заморозить", то через несколько лет ввиду инфляции сегодняшний налогоплательщик получит сущие гроши. Естественным выходом (так делают во всем мире) будет эти средства во что-нибудь вложить (инвестировать).

Допустим, что вы, как инвестор, имеете возможность вложить средства пенсионного фонда Украины в один из четырех финансовых институтов: акции кампании г-на Сороса, в депозит BankofAmerica, в облигации госказначейства США и в золото. Эти четыре альтернативы (ваши возможные стратегии) обозначим А1, А2, А3, А4 .

Допустим, окружающая среда (В), в данном случае, ситуация на финансовом рынке на момент завершения депозита может принять одно из пяти определенных состояний. Эти пять состояний обозначим В1, В2, В3, В4, В5 .

Из многолетних статистических данных известны приближенные вероятности (Q) этих состояний: q1, q2, q3, q4, q5 .

Инвестиционная привлекательность проекта вложения средств определяется как конечная рентабельность. Оценка рентабельности считается известной для каждой стратегии инвестора и каждого состояния окружающей среды. Эти данные представлены в матрице, называемой матрицей выигрышей инвестора (игрока А),

где аij – это рентабельность инвестиционного проекта при выборе Аi-той альтернативы и при Вj-том состоянии окружающей среды.

От вас, как главы пенсионного фонда Украины, требуется выбрать наилучший вариант вложения средств налогоплательщиков.

Отметим, что понятие наилучшего исхода в различных условиях трактуется по-разному. Для различных условий принятия решений разработаны различные критерии выбора ЛПР наилучшего исхода. Решим данную задачу с помощью различных критериев.

2.2 Критерий Байеса

Критерий Байеса (принцип математического ожидания) предполагает полное доверие ЛПР известным вероятностям состояний окружающей среды. Следовательно, данная задача – это задача принятия решения в условиях риска.

Показатель эффективности стратегии Аi по критерию Байеса находится по формуле:

Z = ,

гдеm – количество строк матрицы, заданной в условии;

n – количество столбцов матрицы, заданной в условии;

qj – заданные вероятности ;

аij – элементы матрицы, заданной в условии.

Для случая оптимизации потерь критерий будет таким:

Z = #

Заметим, что – это математическое ожидание стратегии Аi . Таким образом, исходную матрицу необходимо дополнить справа еще одним столбцом, в который нужно внести значения математических ожиданий всех стратегий:

Пример вычислений для первой строки:

= 0,33 + 0,27 + 0,153 + 0,115 + 0,256 = 0,6 + 1,4 + 0,45 + 1,5 + 1,5 = 5,75

Далее в добавленном столбце нужно найти наибольший элемент (наибольшее математическое ожидание). Строка, в которой он стоит и будет оптимальной стратегией. Необходимо заметить, что наибольших элементов может быть несколько, тогда и оптимальных стратегий соответственно будет несколько.

В нашем случае наибольший элемент 5,95 (в матрице он выделен). Таким образом, в нашем примере оптимальной стратегией будет А3, т.е. средства фонда вам нужно вложить в третий проект.

Ответ А3 .

2.3 Критерий Лапласа (Бернулли)

Критерий Лапласа (принцип недостаточного основания) предполагает недоверие ЛПР известным вероятностям состояний окружающей среды. Вероятности состояний окружающей среды считаются одинаковыми и равными . Следовательно, данная задача – это задача принятия решения в условиях риска с вероятностями .

Показатель эффективности стратегии Аi по критерию Лапласа находится аналогично критерию Байеса с вероятностями :

Z = = ,

Заметим, что нет необходимости вычислять эти математические ожидания. Достаточно просто просуммировать элементы строк матрицы и выбрать из них максимальную сумму:

Z =

Для случая оптимизации потерь критерий будет таким:

Z = #

Таким образом, исходную матрицу необходимо дополнить справа еще одним столбцом, в который нужно внести значения сумм элементов строк всех стратегий:

Далее в добавленном столбце нужно найти наибольший элемент. Строка, в которой он стоит и будет оптимальной стратегией. Необходимо заметить, что наибольших элементов может быть несколько, тогда и оптимальных стратегий соответственно будет несколько.

В нашем случае наибольший элемент в добавленном столбце 34 (в матрице он выделен). Таким образом, в нашем примере оптимальной стратегией будет А1 , т.е. инвестор должен выбрать для вложения первый проект.

Ответ А1 .

2.4 Критерий Гермейера

Критерий Гермейера применяется для задач принятия решений в условиях риска.

Он применяется в основном для решения задач выбора для оптимизации величины потерь или затрат. Такие задачи довольно часто встречаются в хозяйственной практике. Матрица потерь, задаваемая в условии, будет содержать отрицательные элементы (потери выражаются отрицательными величинами). Если в матрице помимо отрицательных будут и положительные элементы, то исходная матрица потерь преобразуется в матрицу, содержащую только отрицательные элементы по правилу:

аij – с ,

где с – некое выбранное ЛПР положительное число.

Следует иметь в виду, что оптимальное решение зависит от выбора с.

Критерий Гермейера применяется и для оптимизации величины прибыли (как в нашей задаче), т.е. для положительных матриц.

В общем случае Гермейер предложил ввести в рассмотрение матрицу с такими элементами:

Построим новую матрицу для нашего примера:

Далее к этой матрице применяется принцип максимина. Показатель эффективности стратегии Аi при этом находится по формуле:

Таким образом, новую матрицу необходимо дополнить справа еще одним столбцом, в который нужно внести наименьшие значения элементов каждой строки.

Затем из элементов добавленного столбца нужно выбрать наибольший. Строка, в которой он стоит и будет оптимальной стратегией.

В нашем случае наибольший элемент в добавленном столбце 16 (в матрице он выделен). Таким образом, в нашем примере оптимальной стратегией будет А3, т.е. инвестор должен выбрать для вложения третий проект.

Ответ А3 .

2.5 Критерий Ходжа-Лемана

Критерий Ходжа-Лемана привносит фактор определенной субъективности при принятии решения.

Решение принимается в условиях риска. Однако у ЛПР есть некое недоверие к распределению вероятностей состояний окружающей среды. Поэтому ЛПР вводит некий "коэффициент доверия" l к вероятностям состояний окружающей среды (0 £l£ 1). Чтобы сильно не рисковать, обычно таким коэффициентом берут 0,4. Этот коэффициент ещё называют уровнем оптимизма.

Показатель эффективности стратегии Аi по критерию Ходжа-Лемана находится по формуле:

Z = ,

#Для случая оптимизации потерь критерий будет таким:

Z = #

Таким образом, исходную матрицу необходимо дополнить справа еще тремя столбцами. В первый нужно внести значения математических ожиданий всех стратегий, умноженных на уровень оптимизма l = 0,4. Во второй нужно внести значения наименьших элементов всех строк, умноженных на уровень пессимизма 1 – l = 1 – 0,4 = 0,6 . В третий добавленный столбец внесем сумму значений первых двух добавленных столбцов:

Пример вычислений для первой строки:

= 0,4  (0,33 + 0,27 + 0,153 + 0,115 + 0,256) = 0,4  5,75 = 2,3

= 0,6  3 = 1,8

Z1 = 2,3 + 1,8 = 4,1

Далее в добавленном столбце нужно найти наибольший элемент. Строка, в которой он стоит и будет оптимальной стратегией.

В нашем случае наибольший элемент 4,78 (в матрице он выделен). Таким образом, в нашем примере оптимальной стратегией будет А3, т.е. инвестор для вложения должен выбрать третий проект.

Ответ А3 .

Раздел 3. Принятие решения в условиях неопределенности

3.1 Принцип максимина

Решим поставленную выше задачу при принятии решения в условиях неопределенности. В таких условиях также нет единой трактовки понятия наилучшего исхода. Поэтому данную задачу тоже будем решать с помощью различных критериев.

Принцип максимина (критерий Вальда) предполагает полное недоверие ЛПР известным вероятностям состояний окружающей среды. Либо же вероятности состояний окружающей среды считаются неизвестными. Следовательно, данная задача – это задача принятия решения в условиях неопределенности.

При неопределенности выбор наилучшей стратегии может основываться на введении различных разумных гипотез о поведении окружающей среды.

Одна из важнейших и основополагающих гипотез такого типа называется гипотезой антагонизма. Она состоит в предположении, что окружающая среда ведет себя наихудшим для ЛПР образом. На этой гипотезе основывается принцип максимина, называемый также принципом гарантированного результата.

Показатель эффективности стратегии Аi по критерию максимина находится по формуле:

Z =

Для случая оптимизации потерь критерий превратится в минимаксный и будет таким:


Z = #

Таким образом, исходную матрицу необходимо дополнить справа еще одним столбцом, в который нужно внести значения минимальных элементов каждой строки.

Затем из элементов добавленного столбца нужно выбрать наибольший. Строка, в которой он стоит и будет оптимальной стратегией.

Выбранные таким образом альтернативы полностью исключают всякий риск! Это означает, что ЛПР не может столкнуться с худшим результатом, чем тот на который он ориентируется. В силу этого принцип максимина является принципом крайнего пессимизма ЛПР (принципом наибольшей осторожности).

Как бы ни вела себя окружающая среда, результат не может оказаться ниже значения критерия максимина! Это свойство делает принцип максимина наиболее применяемым на практике, особенно в случаях, где от конечного результата зависят жизни людей.

Народная интуиция уже веками непроизвольно использует принцип максимина. Это подтверждается такими поговорками как "Семь раз отмерь – один раз отрежь", "Береженого бог бережет", "Лучше синица в руках, чем журавль в небе".

В нашем случае наибольший элемент в добавленном столбце 4 (в матрице он выделен). Таким образом, в нашем примере оптимальной стратегией будет А3, т.е. инвестор должен выбрать для вложения средств третий проект.

Ответ А3 .

3.2 Критерий азартного игрока

Критерий азартного игрока (принцип максимакса) – это диаметральная противоположность принципу максимина, он тоже применяется при принятии решения в условиях неопределенности. Критерий азартного игрока допустим в случаях очень низкого риска, а также когда выигрыш намного превышает возможные потери.

Показатель эффективности стратегии Аi по критерию азартного игрока находится по формуле:

Z =

Для случая оптимизации потерь критерий будет таким:

Z = #

Таким образом, исходную матрицу необходимо дополнить справа еще одним столбцом, в который нужно внести значения максимальных элементов каждой строки.

Затем из элементов добавленного столбца нужно выбрать наибольший. Строка, в которой он стоит и будет оптимальной стратегией.

В нашем случае наибольший элемент в добавленном столбце 15 (в матрице он выделен). Таким образом, в нашем примере оптимальной стратегией будет А1, т.е. инвестор должен выбрать для вложения первый проект.

Применение критерия азартного игрока народная мудрость выразила пословицей "Кто не рискует, тот не пьет шампанского".

Ответ А1 .

3.3 Критерий произведений

Критерий произведений тоже применяется при принятии решения в условиях неопределенности. Это более нейтральный критерий по сравнению с принципом максимина и критерием азартного игрока. Критерий произведений производит некое "выравнивание" между большими и малыми значениями аij .

Показатель эффективности стратегии Аi по критерию произведений находится по формуле:

Z =

Для случая оптимизации потерь критерий будет таким:

Z = #

Таким образом, исходную матрицу необходимо дополнить справа еще одним столбцом, в который нужно внести значения произведений всех элементов каждой строки.

Затем из элементов добавленного столбца нужно выбрать наибольший. Строка, в которой он стоит и будет оптимальной стратегией.

В нашем случае наибольший элемент в добавленном столбце 8640 (в матрице он выделен). Таким образом, в нашем примере оптимальной стратегией будет А3, т.е. инвестор должен выбрать для вложения третий проект.

Ответ А3 .

3.5 Критерий Сэвиджа

Решение опять принимается в условиях неопределенности.

Сэвидж предложил ввести в рассмотрение новую матрицу, элементы которой определяются по формуле:

rij =

Построим новую матрицу для нашего примера:

Пример вычислений для первого столбца:

= 6; r11 = 6 – 3 = 3; r21 = 6 – 4 = 2; r31 = 6 – 6 = 0; r41 = 6 – 3 = 3.

Построенная таким способом матрица называется "матрицей сожалений". И действительно, ведь каждый элемент rijвыражает "сожаление" ЛПР по поводу того, что он не выбрал наилучшего решения по отношению к

Далее к матрице сожалений применяется критерий минимакса. Показатель эффективности стратегии Аiпри этом находится по формуле:

Z = =

Для случая оптимизации потерь критерий будет таким:

Z = #

Таким образом, матрицу сожалений необходимо дополнить справа еще одним столбцом, в который нужно внести наибольшие значения элементов каждой строки.

Затем из элементов добавленного столбца нужно выбрать наименьший. Строка, в которой он стоит и будет оптимальной стратегией.

В нашем случае наименьший элемент в добавленном столбце 5 (в матрице он выделен). Таким образом, в нашем примере оптимальной стратегией будет А3, т.е. инвестор должен выбрать для вложения третий проект.

Ответ А3 .

3.6 Критерий Гурвица

Решение принимается в условиях неопределенности.

Гурвиц предложил критерий, показатель эффективности стратегии Аi при котором находится где-то между точками зрения крайнего оптимизма (критерий азартного игрока) и крайнего пессимизма (критерий максимина). Для этого вводят некий коэффициент l – уровень пессимизма. Выбор уровня пессимизма – процесс субъективный. Чаще всего его выбирают равным либо 0,6 либо 0,5. После этого показатель эффективности стратегии Аi по критерию Гурвица находится по формуле:

Z =

Для случая оптимизации потерь критерий будет таким:

Z = #

Таким образом, исходную матрицу необходимо дополнить справа еще тремя столбцами. В первый нужно внести значения наименьших элементов всех строк, умноженных на уровень пессимизма l = 0,6. Во второй нужно внести значения наибольших элементов всех строк, умноженных на уровень оптимизма 1 – l = 1 – 0,6 = 0,4 . В третий добавленный столбец внесем сумму значений первых двух добавленных столбцов:

Затем из элементов добавленного столбца нужно выбрать наибольший. Строка, в которой он стоит и будет оптимальной стратегией.

В нашем случае наибольший элемент в добавленном столбце 7,2 (в матрице он выделен). Таким образом, в нашем примере оптимальной стратегией будет А1, т.е. инвестор должен выбрать для вложения средств первый проект.

Ответ А1 .

Раздел 4. Принятие решения в условиях противодействия

4.1 Матричные игры

Раздел "Теории принятия решений" в условиях противодействия называется теорией игр . А так как в основном условия задач в "Теории принятия решений" задаются в виде матриц, то рассматриваемые конфликтные ситуации называются матричными играми . В матричных играх состояниями В1, В2, …, Вnуправляет не беспристрастная природа, а активный противник, преследующий сугубо свои цели.

ЛПР, управляющий своими стратегиями (ходами ) А1, А2, …, Аn, и его противник, управляющий стратегиями (ходами) В1, В2, …, Вnв данной ситуации называются игроками .

Элементы матрицы аij , заданной в условии, называются выигрышами (платежами) игрока А. А вся матрица называется матрицей платежей .

Далее возможны два случая. Если в матричной игре задана одна платежная матрица, то естественно предположить, что выигрыши первого игрока будут являться проигрышами второго игрока. Такая антагонистическая ситуация называется матричной игрой с нулевой суммой . Цель игры для первого игрока (ЛПР) – побольше выиграть, а для второго игрока – поменьше проиграть. Иными словами, цельюигры является определение оптимальной стратегии для каждого игрока – такой стратегии, при которой выигрыш первого игрока будет максимальным, а проигрыш второго игрока будет минимальным.

Однако, такая ситуация бывает не всегда. Зачастую в жизни ваш противник преследует сугубо свои цели, определенные своими выигрышами. В этом случае матричная игра задается двумя платежными матрицами. Или для краткости элементы одной платежной матрицы состоят из двух чисел: (аij, bij). Такая ситуация называется матричной игрой с ненулевой суммой . И для первого и для второго игроков цель игры – побольше выиграть.

Очевидно, что рассмотренная матричная игра предполагает, что каждый игрок делает только по одному ходу. Естественно, что многие конфликтные ситуации предполагают по нескольку ходов каждого игрока. Такие игры рассматриваются пошагово и решаются методами динамического программирования. На каждом отдельном шаге такая игра рассматривается как игра с одним ходом.

Матричные игры для двух игроков с нулевой и ненулевой суммой достаточно хорошо изучены и для них разработана теория оптимального поведения игроков.

Однако в жизненной практике в конфликтных ситуациях зачастую участвуют более чем две стороны. Чем больше игроков – тем больше проблем. Такие игры менее изучены и здесь есть просторное поле для новых фундаментальных научных исследований.

Несмотря на несколько легкомысленное звучание основных терминов, теория игр является строго научной дисциплиной с точными математическими выкладками.

На протяжении всего своего исторического пути развития человечество ежедневно сталкивается с конфликтными ситуациями: политическими, военными, экономическими, социальными и прочими, которые проявляются как в глобальных, так и в малых (вплоть до личных) формах. И если бы Человеку хватило бы ума в конфликтных ситуациях пользоваться не силой, не надеждой на "авось", а математикой, то жизнь наверняка была бы другой. Будем надеяться, что новое поколение, усвоив курс "Исследование операций" -, изменит жизнь к лучшему!

Итак, рассмотрим игру, в которой ЛПР противостоит "думающий" противник.

Возможны такие случаи:

1) Ходы игроками делаются одновременно.

2) Первым ходит игрок 2 – противник, но игрок 1 – ЛПР, не имеет информации о ходе противника.

3) Первым ходит игрок 2 – противник, но игрок 1 – ЛПР, знает о ходе противника.

4) Первым ходит игрок 1, но игрок 2 не имеет информации о ходе противника.

5) Первым ходит игрок 1, но игрок 2 знает о ходе противника.

Очевидно, что случаи 1), 2) и 4) идентичны – никто из игроков не знает о ходе противника ничего.

Рассмотрим случай 3). Так как ЛПР имеет полную информацию о ходе противника, то мы имеем ситуацию принятия решения в условиях полной определенности. Как уже отмечалось выше, такими задачами занимается математическое программирование.

Рассмотрим случай 5). Так как ЛПР ходит первым, то его противник наверняка выберет самую худшую для ЛПР стратегию. Поэтому в такой ситуации ЛПР необходимо принимать решение о своем ходе согласно принципу наибольшей осторожности, т.е. согласно принципу максимина. Это утверждение однозначно, легко математически доказывается и не должно подвергаться сомнению ни в каких жизненных ситуациях.

Итак, содержательны по своей сути только случаи 1), 2) и 4), которые сводятся к одному случаю. Это как мы видим, принятие решения в условиях неопределенности.

4.2 Матричные игры, разрешимые в чистых стратегиях

Рассмотрим парную конечную антагонистическую игру. Пусть игрок А располагает mличными стратегиями, которые обозначим А1, а2 ..., Аm. Пусть у игрока В имеется nличных стратегий, обозначим их В1, В2, ,.., Вn. Говорят, что игра имеет размерность mх n . В результате выбора игроками любой пары стратегий Аiи Вj(i = 1,2 …, m; j = 1,2, …, n).

Однозначно определяется исход игры, т.е. выигрыш аijигрока А (положительный или отрицательный) и проигрыш (-аij) игрока В . Предположим, что значения аijизвестны для любой пары стратегий (Аi Вj). Значения этих выигрышей заданы в платежной матрице

Строки этой таблицы соответствуют стратегиям игрока А , а столбцы – стратегиям игрока В .

С помощью хорошо нам знакомого принципа максимина найдем гарантированный наибольший выигрыш для игрока А:

Найденное число a называется нижней ценой игры.

Стратегия, соответствующая максимину, называется максиминной стратегией – она будет оптимальной стратегией игрока А.

Посмотрим на эту ситуацию с точки зрения второго игрока: ему необходимо уменьшить свои потери. В таком случае критерию максимина превратится в минимаксный и гарантированный наименьший проигрыш для игрока В будет таким:

Найденное число в называется верхней ценой игры

Стратегия, соответствующая минимаксу, называется минимаксной стратегией – она будет оптимальной стратегией игрока В.

Причем, для нижней и верхней цены игры всегда справедливо неравенство:

Если нижняя и верхняя цены игры совпадают, то общее значение верхней и нижней цены игры a = в = n называется чистой ценой игры , или ценой игры . Элемент платежной матрицы, в котором достигается чистая цена игры, называется седловой точкой (по аналогии с поверхностью седла, которая искривляется вверх в одном направлении и вниз – в другом). Найденные оптимальные стратегии игроков А и В в данном случае называются чистыми стратегиями .

Матричная игра с платежной матрицей, имеющей седловую точку, называется игрой, разрешимой в чистых стратегиях. При этом очевидно, что решение игры обладает устойчивостью, т.е. если один из игроков придерживается своей оптимальной стратегии, то для другого не может быть выгодным отклоняться от своей оптимальной стратегии. Оба игрока находятся в "положении равновесия", из которого не выгодно выходить каждому.

Рассмотрим числовой пример.

Пусть имеем игру с платежной матрицей:

Проверим, имеет ли наша матричная игра седловую точку? Для этого используем принцип максимина.

Дополним исходную матрицу справа еще одним столбцом, а снизу – еще одной строкой. В них будем заносить значения минимальных элементов каждой строки и значения максимальных элементов каждого столбца соответственно:

Найдем нижнюю цену игры. Выигрыш игрока А:

a = = 4он достигается в третьей строке.

Найдем верхнюю цену игры. Выигрыш игрока В:

в = = 4 он достигается во втором столбце.

Как видим, выигрыши игроков совпадают: a = в = n = 4 , значит у матрицы имеется седловая точка. А значит, у данной матричной игры имеется пара оптимальных чистых стратегий А3В2 . Цена игры n = 4.

Но такое бывает далеко не всегда.

4.2 Матричные игры, разрешимые в смешанных стратегиях

4.2.1 Постановка задачи

Если платежная матрица не имеет седловой точки, то . А значит . Такая игра в чистых стратегиях не разрешима. Первый игрок в таком случае будет стремиться увеличить свой выигрыш, а второй – уменьшить свой проигрыш. Поиск такого решения приводит к применению сложной стратегии, состоящей в случайном применении двух и более чистых стратегий с определенными вероятностями:

PA = (p1, p2, …, pm) где pi – это вероятности применения чистых стратегий игроком А;

QB = (q1, q2, …, qn) где qj– это вероятности применения чистых стратегий игроком B;

при этом и .

Такие наборы вероятностей применения чистых стратегий игроками А и В называются смешанными стратегиями .

Заметим, что чистые стратегии – это частный случай смешанных стратегий. Например, чистая стратегия первого игрока – это смешанная стратегия, у которой все вероятности pi = 0 , кроме соответствующего номера kчистой стратегии: pk = 1 .

Основная теорема теории игр (Теорема фон-Неймана) : любая конечная игра двух лиц с нулевой суммой разрешима в смешанных стратегиях.

Как же искать смешанные стратегии? Их можно найти точно – алгебраическим способом (в частности, с помощью симплекс-метода) или графическим способом (для игры размерности 2 х nили m х 2 ).

Для того чтобы точно найти решение матричной игры в смешанных стратегиях, нужно представить заданную матричную игру в виде задачи линейного программирования и решить её симплекс-методом.

Рассмотрим матричную игру, не разрешимую в чистых стратегиях, в общем виде:

Заметим, что в матричной игре, разрешимой в чистых стратегиях, элементы платежной матрицы могут быть как положительными, так и отрицательными. Для симплекс-метода, которым будем решать игру, не разрешимую в чистых стратегиях, необходимо, чтобы элементы платежной матрицы были неотрицательными. Для этого, если в платежной матрице будут отрицательные элементы, нужно ко всем элементам платежной матрицы прибавить достаточно большое число с . При этом решение задачи не изменится, а цена игры увеличится на с.#

PA = (p1, p2, …, pm)– это оптимальная смешанная стратегия первого игрока. Её применение гарантирует первому игроку выигрыш не меньший, чем цена игры n . Если при этом второй игрок выберет стратегию В1, математически все вышесказанное будет иметь вид:

а11р1 + а21р2 + … + am1pm ≥ n

Таких неравенств будет столько, сколько есть возможных альтернатив у второго игрока, т.е. столбцов платежной матрицы – nштук:

а11р1 + а21р2 + … + am1pm ≥ n

а12р1 + а22р2 + … + am2pm ≥ n

а1nр1 + а2nр2 + … + amnpm ≥ n


Разделив все неравенства на n , получим (в общем виде):

а1j + а2j + … + amj ≥ 1

Обозначим: = xi, . С помощью таких новых переменных вышеуказанные неравенства запишутся в виде:

а11 x1 + а21 x2 + … + am1 xm ≥ 1

а12 x1 + а22 x2 + … + am2 xm ≥ 1

а1n x1 + а2n x2 + … + amn xm ≥ 1

Просуммируем новые переменные:

= x1 + x2 + … + xm = + + … + = =

PA = (p1, p2, …, pm)– это оптимальная смешанная стратегия первого игрока. То есть нужно так подобрать (p1, p2, …, pm) , чтобы n была как можно большей. Или же, что то же самое, чтобы была как можно меньшей.

Таким образом, используя новые переменные и учитывая всё вышесказанное, исходную матричную игру можно представить в виде задачи линейного программирования:

найти вектор переменных Х = {x1, x2, … , xm}, такой что:

целевая функция f = min

при множестве ограничений:


АТХ ≥ Е

гдеА – матрица коэффициентов (платежная матрица), заданная в условии;

Е – единичный вектор

Х – вектор неизвестных переменных, такой что xi = ;

n – это цена игры:n = = ;

рi – это коэффициенты вектора смешанной стратегии первого игрока.

4.2.2 Решение задачи симплекс-методом

Рассмотрим числовой пример.

Пусть имеем игру с платежной матрицей:

Проверим, имеет ли наша матричная игра седловую точку? Для этого используем принцип максимина.

Выигрыш игрока А:a = = 2 он достигается в первой строке.

Выигрыш игрока В:в = = 3 он достигается в четвертом столбце.

Как видим, выигрыши игроков не совпадают, значит у матрицы нет седловой точки. Значит, нужноискать смешанные стратегии.

В данном конкретном случае в множестве ограничений будет четыре неравенства (т.к. в условии задачи четыре столбца). Пересчитывать симплекс- таблицы с четырьмя строками не очень сильно хочется, поэтому удобнее решить двойственную задачу (для коэффициентов вектора смешанной стратегии второго игрока), в которой будет всего две строки (т.к. в условии задачи две строки):

найти вектор двойственных переменных Y = {y1, y2, … yn}, такой что:

целевая функция g = max

при множестве ограничений:АY ≤ Е

Для нашего примера задача линейного программирования будет такой:

найти вектор Y = {y1, y2, y3, y4}, такой что:

целевая функция g = max

при множестве ограничений:

Далее нужно вспомнить методику применения симплекс-метода и использовать её для нашей задачи.

Однако, как показывает многолетняя практика, студенты обладают так называемой "краткосрочной памятью", которая работает только до сдачи необходимого экзамена. Поэтому вспомнить сейчас методику применения симплекс-метода вряд ли кто-то сможет. Для этого нужно сходить в библиотеку, найти специальную литературу и умело ей воспользоваться. Осмелимся заметить, что и этого половина студентов сделать поленится и благополучно завалит данную тему - . #

Поэтому для всеобщего блага приведем здесь методику применения симплекс-метода (пройденного и успешно сданного в математическом программировании) для нашей конкретной задачи.

1 этап – приведение задачи линейного программирования к каноническому виду.

Неравенства во множестве ограничений нужно превратить в равенства с помощью добавления искусственных переменных. Для того чтобы неравенства превратить в равенства, надо в каждое неравенство добавить (или отнять – в зависимости от знака неравенства) искусственную переменную:

Целевая функция при этом будет выглядеть так:g = y1 + y2 + y3 + y4 + 0y5 + 0y6

2 этап – определение начального опорного плана.

В полученном случае начальный опорный план будут составлять искусственные переменные, входящие в ограничения с коэффициентами +1 :{ y5 ; y6 }. Новых искусственных переменных для данной задачи вводить не требуется.

3 этап – заполнение исходной симплекс-таблицы.

Исходная симплекс-таблица для нашей двойственной задачи будет иметь вид:

В столбец "текущий базис" ставим переменные, начального опорного плана : { y5 ; y6 }.

В столбец "сi" ставим их коэффициенты в целевой функции.

В столбец "А0" ставим вектор ограничений Е : а10 = 1 ;а20 = 1 .

В самую верхнюю строку таблицы ставим коэффициенты cjпри соответствующих переменных в целевой функции:c1 = 1 ; c2 = 1 ; c3 = 1 ; c4 = 1 ; c5 = 0 ; c6 = 0 .

В столбцы "А1", ...., "А6" ставим соответствующие коэффициенты матрицы ограничений А.


Вычисляем оценки по формулам

D0 = ; .Dj = cj

и ставим их в самую нижнюю строку симплекс-таблицы (строку оценок) :

D0 = = 0 * 1 + 0 * 1 = 0D1 = c1 = 0 * 4 + 0 * 3  1 =  1

D2 = c2 = 0 * 3 + 0 * 7  1 =  1D3 = c3 = 0 * 8 + 0 * 1  1 =  1

D4 = c4 = 0 * 2 + 0 * 3  1 =  1D5 = c5 = 0 * 1 + 0 * 0  0 = 0

D6 = c6 = 0 * 0 + 0 * 1  0 = 0

4 этап – пересчет симплекс-таблицы.

1. Если j ³ 0 для всех j = 1, 2, .... , n , то данный план (в столбце "текущий базис") – оптимален. В нашем случае это условие не выполняется, значит, текущий базис можно улучшить.

2. Если имеются k < 0 и в столбце Аk все элементы aik 0 , то целевая функция не ограничена сверху на допустимом множестве и данная задача не имеет смысла. В нашем случае видим, что целевая функция сверху ограничена.

3. Если имеются j < 0 и в столбцах Аj , соответствующих этим оценкам, существует хотя бы один элемент aik > 0, то возможен переход к новому лучшему плану, связанному с большим значением целевой функции. У нас так и есть.

4. Переменная хk, которую необходимо ввести в базис, для улучшения плана соответствует наименьшей отрицательной оценке j. Столбец Ak, содержащий эту оценку называется ведущим . В нашем случае все оценки одинаковы. Поэтому в качестве ведущего столбца выберем любую оценку, например, третью: k = 3.

5. Ищем min{ ai0 / ai1 } = min{ 1/8 ; 1/1 } = 1/8– этот минимум достигается при i = 1. Значит, r = 1первая строка – ведущая . (на рисунке помечена стрелкой)

Ведущий элементark = a13 = 8 (на рисунке выделен)

6. Заполняем новую симплекс-таблицу.

В столбец "текущий базис" вместо переменной у5 ставим переменную у3 .

В столбец "сi" ставим коэффициент переменной у3 в целевой функции.

Самая верхняя строка таблицы всегда остаётся неизменной.

Пересчитываем ведущую строку по формуле :

После этого пересчитываем остальные строки по формуле

:

вторая строка (i = 2)

Пересчитываем и заполняем строку оценок:

D0 = = 1 * + 0 * = D1 = c1 = 1 * + 0 *  1 = 

D2 = c2 = 1 * + 0 *  1 = D3 = c3 = 1 * 1 + 0 * 0  1 = 0

D4 = c4 = 1 * + 0 *  1 = 

D5 = c5 = 1 * + 0 *  0 = D6 = c6 = 1 * 0 + 0 * 1  0 = 0

После этого повторяем 4 этап до тех пор, пока не будет выполнен п.1 (все j ³ 0).

В нашем случае имеются j < 0 и наименьшая среди них 4 . Значит ведущим столбцом на данном шаге будет A4 (пометим его стрелкой).

Ищем min{ ai0 / ai4 } = min{:; :} = min{; } = – этот минимум достигается при i = 2. Значит, r = 2вторая строка – ведущая (на рисунке помечена стрелкой).

Таким образом, в новый текущий базис вместо переменной у6 надо ввести переменную у4 .

Пересчитываем все элементы новой симплекс-таблицы.

Пересчитываем ведущую строку (вторую):

= : = = = : = =

= : = = = 0 : = 0

= : = 1 = – : = – = 1 : =

Приведенные выше и ниже вычисления представлены в весьма подробном виде. Это сделано из тех соображений, что как опять таки показывает практика, даже не смотря на достаточно хорошее понимание и усвоение теоретического материала, ошибки зачастую возникают именно при выполнении элементарных арифметических операций. Не следует думать, что средняя школа осталась позади, и вы всё можете посчитать в уме. Поэтому всем студентам мы советуем не лениться и подробно расписывать все арифметические действия (особенно с дробями).#

Пересчитываем оставшуюся строку (первую):

= = = =

= = = =

= = = – = –

= 1 – 0  = 1 = = 0

= = + = =

= 0 – = –

Пересчитываем и заполняем строку оценок:

D0 = = 1 * + 1 * = =

D1 = c1 = 1 * + 1 *  1 = =

D2 = c2 = 1 * + 1 *  1 = = =

D3 = c3 = 1 * 1 + 1 * 0  1 = 0

D4 = c4 = 1 * 0 + 1 * 1  1 = 0

D5 = c5 = 1 * + 1 *  0 = =

D6 = – c6 = 1  + 1  – 0 =

Повторяем 4-й этап. При проверке п. 1 видим, что все j ³ 0 . Следовательно, данный план {у3, у4} (в столбце "текущий базис") – оптимален. Больше пересчитывать симплекс-таблицу не нужно.

Решение задачи линейного программирования полностью содержится в последней симплекс-таблице.

Значения переменных находятся в столбце А0 возле соответствующих переменных. В нашем случае, мы видим, что у3 = , у4 = . Переменные у1 и у2 не входят в базис, поэтому их значения будут равны нулю. Таким образом, вектор переменных будет выглядеть так: Y = .

Значение целевой функции – это значение оценки 0 . В нашем случае g = 0 = .

Значения двойственных переменных находятся в строке оценок возле искусственных переменных. В нашем случае это 5 и 6 , то есть х1 = , х2 = . Таким образом, вектор двойственных переменных будет выглядеть так:Х = .

Итак, мы получили решение прямой задачи (которая у нас была двойственной): Y =

и двойственной задачи к данной (которая у нас была прямой):

Х =

Значения целевых функций при этом будут совпадать:f = g = .

Найдем цену игры:n = =

Далее найдем коэффициенты смешанной стратегии

для первого игрока по формуле рi = :

Р = = ,

для второго игрока по формуле qi = :

Q = = .

Особо "продвинутые" студенты при нахождении решения задачи линейного программирования, чтобы не считать симплекс-метод вручную академическим способом, могут воспользоваться средствами MS Excel. Это гораздо быстрее и удобнее.#

Ответ: смешанная стратегия для первого игрока Р = ,

смешанная стратегия для второго игрока Q = ,

цена игры n = .

4.2.3 Решение задачи графическим методом

Симплекс-методом можно найти решение матричной игры произвольной размерности. Графическим же способом найти решение можно лишь для игры размерности 2 х n.

В ответе мы должны получить смешанные стратегии – два вектора PA = (p1, p2) и QB = (q1, q2, …, qn). Причем, p2 = 1 – p1.

В этом случае выигрыш игрока А, соответствующий j-той чистой стратегии игрока В, будет вычисляться по формуле:

aj* = a1j p1 + a2j p2 = a1j p1 + a2j (1 – p1) = (a1j – a2j) p1 + a2j

Нахождение наименьшего гарантированного выигрыша для игрока А подразумевает минимизацию данного выражения.

По условию наша игра имеет размерность 2 х n. То есть j = . В итоге будем иметь n аналогичных выражений, которые надо минимизировать. После этого согласно принципу максимина из найденных минимумов нужно выбрать наибольший:

a =

Решим графическим способом предыдущий числовой пример.


В данном случае будем иметь четыре уравнения, соответствующие четырем возможным чистым стратегиям игрока В:a1* = р1 + 3

a2* = –4р1 + 7

a3* = 7р1 + 1

a4* = –р1 + 3

Чтобы определить наилучший результат из наихудших, построим нижнюю огибающую четырех заданных прямых (на рисунке выделена жирной линией). Эта огибающая представляет минимальный гарантированный выигрыш игрока А, независимо от того, что делает игрок В. Точка максимума нижней огибающей – это и есть решение задачи по принципу максимина. Координатами этой точки будут р1 – одна из вероятностей смешанной стратегии игрока А и a – выигрыш игрока А.

# Заметим, что содержательной является только часть графика, заключенная в интервале 0 ≤ р1 ≤ 1 . Все линии и точки, лежащие за пределами этого интервала не принимаются во внимание. #

"На глаз" координаты точки максимума нижней огибающей видны плохо. Точка максимума нижней огибающей – это точка пересечения прямой 3 и прямой 4. Найдем её точные координаты, решив систему соответствующих уравнений:

ÞÞÞ


Далее находим p2: p2 = 1 – p1 = 1 – =

Итак, для игрока А все ясно:

смешанная стратегия игрока А: Р = ,

выигрыш игрока А:a = .

Аналогичные рассуждения нужно повторить и для игрока В.

Точка максимума нижней огибающей – это точка пересечения прямой 3 и прямой 4. Значит оптимальная смешанная стратегия игрока В определяется двумя стратегиями В3 и В4 соответственно.

Проигрыш игрока В, соответствующий i-той чистой стратегии игрока A, будет вычисляться по формуле:

вi* = ai3 q3 + ai4 q4 = ai3 q3 + ai4 (1 – q3) = (ai3 – ai4) q3 + ai4

В данном случае будем иметь два уравнения, соответствующие двум возможным чистым стратегиям игрока А:

в1* = 6q3 + 2

в2* = –2q3 + 3

Решив систему этих двух уравнений, найдем q3 – одну из вероятностей смешанной стратегии игрока В и в – выигрыш игрока В:

ÞÞÞ

Далее находим q4: q4 = 1 – q3 = 1 – =

Все выяснили также и для игрока В:

смешанная стратегия игрока В: Q =

проигрыш игрока В:в =

Выигрыш игрока А и проигрыш игрока В совпадают – это и будет ценой игры.

Ответ: смешанная стратегия для первого игрока Р = ,

смешанная стратегия для второго игрока Q = ,

цена игры n = .

Видим, что ответы в случае решения задачи симплекс-методом и в случае решения этой же задачи графическим методом совпали.

Мораль вышесказанного такова, что если имеем задачу размерности 2 х nи под рукой нет компьютера, то точное решение можно получить с помощью графического метода.

Если имеем задачу размерности m х 2 , то делаем то же самое, поменяв игроков местами и транспонировав платежную матрицу. #

Если же под рукой есть компьютер, то такие задачи удобнее решать симплекс-методом средствами MS Excel. Если же поставленная задача любой большей размерности, то решить ее можно только симплекс-методом либо вручную, либо опять таки средствами MS Excel.

Раздел 5. Принятие решения в условиях нескольких критериев выбора

5.1 Постановка задачи, основные понятия

Все перечисленные классические критерии выбора не охватывают всевозможные практические ситуации. К каждой конкретной практической ситуации ЛПР может выработать свой "новый" критерий, который будет более точно количественно и качественно описывать данную ситуацию.

К сожалению или счастью, жизнь устроена несколько сложнее и достаточно часто бывает невозможно описать ситуацию одним критерием. Даже в обыденной жизни мы практически никогда не используем единственный критерий, например, при выборе подарка ко дню рождения, или при выборе блюд из меню в кафе, или при выборе места, куда поехать в отпуск.

А представьте, что вы – проектировщик баз данных. В таком случае при выборе оптимального проекта баз данных вам следует учитывать тоже несколько критериев: объем занимаемой оперативной памяти, средняя скорость одной операции, размер программного кода, аппаратные требования, обучаемость обслуживающего персонала, возможность и стоимость сопровождения и прочие. Ниже будут рассматриваться прикладные задачи с уже изученными нами критериями: Байеса, Лапласа и др. Но если вы все-таки – например, проектировщик баз данных, то вам надо будет вместо них рассматривать "свои" критерии, которые являются спецификой вашего рода деятельности.

Такие ситуации описываются многокритериальными задачами принятия решений.

Теоретически можно представить себе случай, когда в допустимом множестве альтернатив существует одна альтернатива, которая лучше всех по всем критериям сразу. Очевидно, что она и будет лучшей.

Однако на практике такое бывает не всегда. Для решения таких задач разработаны специальные методы. Надо сказать, что данное научное направление сравнительно ново – оно развивается последние 30 – 40 лет. Уже известные методы корректируются, обобщаются, разрабатываются новые. Приятно отметить, что одним из основоположников и всемирно признанным гуру данного научного направления является наш почти соотечественник В.В. Подиновский.

Рассмотрим приведенный выше числовой пример. И применим к нему все изученные нами критерии. Результаты отобразим в таблице:

Заметим, что стратегия (альтернатива) А4 по всем девяти критериям хуже, чем любая другая стратегия. Её можно убрать из рассмотрения, при этом результат выбора не изменится. Это утверждает принцип Парето . Оставшиеся альтернативы А1, А2, А3, будут образовывать множество Парето для данной задачи.

Из допустимого множества альтернатив множество Парето образуют те альтернативы, каждая из которых не хуже по всем критериям, чем любая альтернатива, не вошедшая во множество Парето, а хотя бы по одному критерию – лучше.

Согласно принципу Парето оптимальная альтернатива содержится во множестве Парето. Если, например исходная задача содержит 100 альтернативных решений, а множество Парето состоит из 20 альтернатив, то применение принципа Парето в 5 раз уменьшает размерность задачи, соответственно в 5 раз увеличится скорость работы программы, реализующей решение такой задачи!

Далее полученную многокритериальную задачу принятия решения на множестве Парето можно свести к однокритериальной, введя некий обобщенный критерий Z* как функцию от предыдущих частных критериев. Обобщенный критерий Z* в литературе еще называют функцией полезности . Процесс сведения многокритериальной задачи к однокритериальной называется свёрткой .

5.2 Линейные свёртки

Начнем с линейных свёрток. Все линейные свёртки основываются на принципе: "низкая оценка по одному критерию может быть компенсирована высокой оценкой по другому".

Рассмотрим простую линейную аддитивную свёртку:

Z* = max,

То есть, данная свёртка подсчитывает, сколько раз та или иная стратегия была оптимальной. Результаты отобразим в таблице:

В последнем столбе таблицы размещены результаты свёртки. Как видим, оптимальной стратегией является А3.

Такая свёртка является самой простой из линейных, она не учитывает количественных показателей значений критериев.

Рассмотрим линейную аддитивную свёртку с нормирующими множителями:

Z* = max,

где aj = – нормирующие множители.

Как видим, оптимальной стратегией также является А3. Но в этом случае уже нет такого количественного отрыва как в предыдущей простой линейной свёртке. Да и стратегия А2 уже не кажется очень сильно плохой. Если бы были чуть другие начальные данные, то ответы двух рассмотренных вариантов свёрток могли бы и не совпасть.

Линейная аддитивная свёртка с нормирующими множителями позволяет работать с количественными критериями, имеющими, как в нашем случае, разные единицы измерений.

Рассмотрим линейную аддитивную свёртку с весовыми коэффициентами:

Z* = max,

где aj – те же нормирующие множители,

вj – весовые коэффициенты, отражающие относительный
вклад частных критериев в общий критерий.

Весовые коэффициенты принято указывать уже нормированными величинами (Sвj = 1).

Очевидно, что в каждой отдельной конкретной ситуации частные критерии по-разному влияют на общий суперкритерий. Поэтому естественно им придать в общей формуле разный удельный вес. Это можно сделать с помощью весовых коэффициентов. Но где же их взять? Обычно ЛПР сам назначает каждому критерию весовые коэффициенты на свой "мудрый" взгляд. На этом этапе строгая математическая наука заканчивается – конечный результат лежит целиком на совести ЛПР и зависит от его опыта и интуиции в данной сфере. Однако от такого субъективизма никуда не денешься – нельзя же всю жизнь формализовать с помощью математических формул!

Как видим, при неизменном условии задачи оптимальной получилась стратегия А2, хотя в двух предыдущих свёртках она "пасла задних". Все дело в весовых коэффициентах!

5.3 Максиминная и лексикографическая свёртки

Максиминная свёртка – это самый простой способ построения обобщенного критерия (суперкритерия), основанный на применении уже хорошо нам известного принципа максимина.

Пусть мы имеем оценки некоторых объектов (альтернатив) по nкритериям. Каждый из критериев имеет свою размерность, и эти размерности обычно не совпадают. Поэтому для начала нужно нормировать все имеющиеся оценки. Делается это с помощью нормирующих множителей – на основе исходной матрицы оценок строится новая матрица с такими элементами:

cij =

где aj = – нормирующие множители.

Далее к полученной матрице применяем принцип максимина. Посмотрим, как это делается на нашем примере:

Исходную матрицу мы, так же как и ранее, дополнили справа еще одним столбцом, в который внесли значения минимальных элементов каждой пересчитанной строки.

Из элементов добавленного столбца выбираем наибольший. Строка, в которой он стоит и будет оптимальной альтернативой. В данном случае оптимальной будет альтернатива А1.

Недостаток максиминной свёртки – это то, что она учитывает только те критерии, которые дают самые плохие оценки, все остальные критерии игнорируются. Из-за этого максиминную свёртку используют не слишком часто, чаще используют линейные и мультипликативные свёртки. Зато такой подход всегда дает гарантированный результат , ниже которого исхода не будет.

А что делать, если максиминная свёртка даст несколько одинаковых результатов (такое тоже бывает!), а ЛПР необходимо выбрать одно решение? Для такого интересного случая А. Джоффрион предложил использовать так называемую лексикографическую свёртку . Делается это так. Берутся две (или несколько) оптимальные альтернативы, полученные методом максиминной свёртки, и из них выбирается наилучшая методом линейной свёртки.

Как видим, с такими числовыми данными максиминная свёртка оптимальными считает альтернативы А1 и А2 . Теперь после максиминной свёртки применим к альтернативам А1 и А2 линейную свёртку:

В результате получили однозначный ответ: оптимальной является альтернатива А1 .

5.4 Мультипликативные свёртки

Рассмотрим мультипликативную свёртку с нормирующими множителями:

Z* = max,

где aj – нормирующие множители.

Мультипликативная свёртка основывается на постулате: "низкая оценка хотя бы по одному критерию влечет за собой низкое значение функции полезности". Действительно, если вы выбираете торт, и он – несвежий, то это обстоятельство никак не может быть компенсировано его красотой или ценой.

Оптимальной стратегией снова является А3.

Посмотрим, какие результаты даст мультипликативная свёртка с весовыми коэффициентами:

Z* = max,

где aj – нормирующие множители,

вj – весовые коэффициенты.

Итоги отражены в таблице:

Оптимальной стратегией снова является А3.

В конце еще раз напомним непременное правило: перед тем, как применять какую-либо свёртку нужно автоматически всегда выделять множество Парето. И именно для множества Парето применять свёртки. Иначе вы или ваша программа будете выполнять лишнюю ненужную работу.

5.5 Многокритериальный выбор на языке бинарных отношений

До этого были рассмотрены случаи, когда все критерии оценивали все альтернативы. Все альтернативы можно было сравнить друг с другом по каждому критерию. А что делать, если не все альтернативы будут оценены всеми критериями? В таком случае появятся альтернативы, не сравнимые между собой по некоторым критериям. Рассмотрим такой случай на нашем примере (уберем из него некоторые оценки):

При таком условии альтернативы можно сравнить между собой лишь попарно. Такие попарные сравнения называются бинарными отношениями . Обозначается бинарное отношение (на примере критерия Байеса из нашей таблицы) А1RА2 – альтернатива А1 лучше альтернативы А2.

Дадим математически точное определение бинарных отношений.

Бинарным отношением на множестве Ω называется произвольное подмножество R множества Ω Х Ω , где Ω Х Ω – это множество всех упорядоченных пар (ai ;aj) , где ai , aj Î Ω . #

Бинарные отношения очень удобно изображать наглядно. Представим четыре стратегии из нашего примера в виде точек на плоскости. Если имеем, что какая-то альтернатива лучше другой, то проведем стрелку от лучшей альтернативы к худшей. На примере критерия Байеса из нашей таблицы имеем А1RА2 , поэтому на плоскости проведем стрелку от точки А1 к точке А2. Аналогичным образом поступим со всеми начальными данными из таблицы. Заметим, что бинарные отношения не исключают отношения элемента с самим собой. На рисунке такое бинарное отношение будет задаваться петлёй со стрелкой. В результате получим следующую картину:

Подобные фигуры называются ориентированными графами . Точки – это вершины графа, стрелки между точками – это дуги графа.

Дадим математически точное определение графа.

Графом называется пара (Е, е), где Е – непустое конечное множество элементов (вершин), е – конечное (возможно и пустое) множество пар элементов из Е (множество дуг). #

Две вершины, соединенные дугой, называются смежными вершинами. Дуга, соединяющая две вершины, называется инцидентной этим вершинам. Две вершины, соединенные дугой, называются инцидентными этой дуге.

Как же произвести выбор наилучшего элемента из имеющихся альтернатив (наилучшей вершины графа)? Для этого сначала необходимо определить, что же будет являться наилучшей вершины (наилучшими вершинами) графа. На этот счет имеются две исторически сложившиеся в теории графов точки зрения.

1)Максимальным элементом множества Ω по бинарному отношению R называется такой элемент х Î Ω , что "у Î Ω выполняется отношение хRy .

Иначе говоря, максимальный элемент множества должен быть "лучше" каждого элемента этого множества. Не исключается и то, что он может быть "лучше" самого себя, кроме этого максимальный элемент может быть одновременно и "хуже" какого-либо элемента этого множества. Слова "лучше" и "хуже" не совсем верно передают смысл бинарных отношений.

Для графов понятие максимальный элемент – это вершина, из которой исходят стрелки во все остальные вершины графа. Например, на рис. 1 максимальным элементом будет вершина А1 – из неё выходят стрелки во все остальные вершины графа.

2)Оптимальным по Парето элементом множества Ω по бинарному отношению R называется такой элемент х Î Ω , что ù$у Î Ω для которого выполнялось бы отношение уRх .

Иначе говоря, оптимальный по Парето элемент множества – это такой элемент, "лучше" которого в рассматриваемом множестве нет.

Для графов понятие оптимальный по Парето элемент – это вершина, в которую не входит ни одна стрелка. Например, на рис. 1 оптимальным по Парето элементом будет вершина А1 – в неё не входит ни одна стрелка.

Видим, что два разных подхода к определению наилучшего элемента в нашем примере дали одинаковый результат. Но такое бывает не всегда.

Рассмотрим несколько примеров.

У графа на рис. 2 максимальным элементом будет вершина А1 – из неё выходят стрелки во все остальные вершины графа. Оптимальных по Парето элементов у данного графа нет.

У графа на рис. 3 максимальным элементом будет также вершина А1 – из неё выходят стрелки во все остальные вершины графа. Заметим: то, что в неё входит стрелка из вершины А4 , по определению совершенно не важно. Оптимальных по Парето элементов у данного графа нет.

У графа на рис. 4 максимальными элементами будут вершины А1 и А4 – из них выходят стрелки во все остальные вершины графа. Оптимальных по Парето элементов у данного графа нет.

У графа на рис. 5 максимального элемента нет. Оптимальными по Парето элементами будут вершины А1 и А4 – в них не входит ни одна стрелка.

Отметим очевидные особенности.

У графа либо нет максимальных элементов, либо есть.

Оптимальными по Парето элементами могут быть несколько вершин графа, либо таковых может не быть.

В графе не может один (или одни) элемент быть максимальным, а другой (или другие) элемент быть оптимальным по Парето.

Итак, если имеется задача многокритериального выбора, описанная на языке бинарных отношений, то её удобно представить наглядно в виде графа. Однако такое удобство хорошо для небольшого количества вершин (альтернатив). Если вершин довольно много, то вся наглядность пропадает и легко можно запутаться. В таком случае граф удобно представить в виде матрицы смежности или матрицы инцидентности.

Матрица смежности вершин графа – это квадратная матрица размера mxm(m – это количество вершин) с элементами:

сij =

По матрицам смежности искать максимальные элементы и элементы, оптимальные по Парето – одно удовольствие! Максимальные элементы – это те, чьи строки состоят из всех единиц (кроме себя самих – там может быть как нуль, так и единица). А оптимальные по Парето элементы – это те, чьи столбцы состоят из всех нулей.

Матрица инцидентности графа – это матрица, строки которой соответствуют вершинам, а столбцы – дугам. При этом предполагается, что граф не должен иметь петель.


Элементы матрицы инцидентности будут такими:

сij =

Видим, что каждый столбец должен содержать одну единицу и одну минус единицу, остальные элементы столбцов – нули. То есть каждая дуга из одной вершины выходит и в другую вершину входит.

Налицо также очевидна закономерность: максимальные элементы – это те, чьи строки содержат единиц на одну меньше, чем количество строк (вершин), а оптимальные по Парето элементы – это те, чьи строки не содержат минус единиц.

Используя замечательные особенности матриц смежности и инцидентности графов, не составит большого труда разрабатывать компьютерные программы по принятию решений для задач выбора, описанных на языке бинарных отношений.

Раздел 6. Принятие корпоративных решений

6.1 Групповая оценка объектов

В приведенном выше материале подразумевалось, что ЛПР – это некий эксперт-аналитик, принимающий решение по поставленной проблеме. А если проблемой занимаются несколько экспертов? А решение то должно быть одно! Такая задача называется задачей группового выбора или задачей принятия корпоративного решения.

Тут нужно отметить один важный психологический момент. Взрослого человека (начиная лет с 5-10) практически никогда невозможно заставить изменить свое мнение. (Есть, конечно, "безотказные" методы типа насилия, или денежного подкупа, но они к науке не имеют никакого отношения.) Поэтому эксперты в группе всегда будут:

- иметь разные мнения по поводу набора критериев, по которым надо оценивать альтернативные решения;

- иметь разные мнения о сравнительной значимости (весовых коэффициентах) критериев;

- давать разные оценки альтернатив по критериям;

- кроме этого эксперты будут иметь разную компетентность.

Исходя из таких очевидных фактов, можно с уверенностью утверждать, что у группы экспертов всегда должен быть руководитель.

Каждый из экспертов группы в принятии своего решения будет руководствоваться своим опытом и своими знаниями. Будем надеяться, что вышеприведенный материал окажет экспертам некую посильную помощь. Материал данного подраздела предназначен для руководителей групп экспертов, которые на основе всех решений группы обязаны приять единственное правильное решение.

Вспомним, как обычно преодолеваются групповые разногласия? В подавляющем большинстве случаев это делается с помощью обыкновенного голосования.

Рассмотрим формализованный пример голосования. В таблице начальных данных отражены количественные оценки четырёх альтернативных решений девятью экспертами:

Для начала необходимо найти множество Парето: это будут альтернативы А1, А2, А4. Оптимальное решение будем искать среди них. Для проведения голосования определим функцию полезности:

Z* = max,

В последнем столбе таблицы размещены результаты голосования. Как видим, оптимальным решением является альтернатива А4 – за неё проголосовало пять экспертов из девяти – больше половины.

При всей простоте, широкой распространенности и многовековой исторической традиции использования метод голосования имеет один существенный недостаток. Голосование не считается с мнением меньшинства . Мнение меньшинства полностью игнорируется! Но иногда ведь случается, (правда очень редко) что именно среди этого меньшинства и находилось наилучшее решение! Кроме практического результата голосование наносит психологический удар по тем экспертам, мнения которых были отброшены. Математические методы принятия корпоративных решений стараются исправить этот недостаток. Учитываются мнения всех экспертов.


Рассмотрим такую функцию полезности с нормирующими множителями:

Z* = max,

где aj = .

В этом случае оптимальным решением является альтернатива А1.

Заметим, что такой способ учитывает также и то, что эксперты пользовались разными шкалами оценок объектов.

А теперь попробуем учесть ещё и степень компетентности каждого эксперта. Функция полезности при этом будет выглядеть так:

Z* = max,

где aj – те же нормирующие множители,

kj – коэффициенты компетентности экспертов.

Ниже будет рассмотрен один из способов определения коэффициентов компетентности экспертов.

А пока рассмотрим ту же задачу с уже якобы вычисленными коэффициентами компетентности экспертов. В таблице снова сначала – условие, ниже – результаты:

А теперь мы получили в качестве оптимальной альтернативу А2.

Надо отметить, что приведенные два последних способа принятия группового решения годятся только для согласованных суждений экспертов. Согласованность – это степень расхождения мнений экспертов. Методика вычисления согласованности оценок экспертов достаточно сложна. По необходимости с ней можно ознакомиться в специальной литературе по принятию корпоративных решений.

Если эксперты честно оценивают реальный объект, то их оценки не должны сильно расходиться. Если же они все-таки существенно расходятся, то можно получить часто упоминаемую в литературе так называемую "среднюю температуру по больнице". Действительно, если сложить температуру всех высокотемпературных больных и температуру тел в морге, а потом поделить на общее количество замеров, то можно получить 36,6°. Свидетельствует ли это о том, что "в среднем" все находящиеся в больнице здоровы?

Если согласованность оказалась низкой, то нужно пытаться выяснить причину расхождений и по возможности попытаться устранить её. Часто причиной может быть отсутствие важной информации у некоторых экспертов. В некоторых случаях эксперты разбиваются на две устойчивые группы. Группы нужно уметь выявлять и обрабатывать отдельно.

6.2 Определение коэффициентов компетентности экспертов

Теперь опишем одну из методик определения коэффициентов компетентности экспертов.

Рассмотрим опять нашу задачу, в которой принимали участие девять экспертов. Предложим каждому из девяти экспертов в отдельности самому сформировать экспертную группу. Каждый эксперт может включить в экспертную группу произвольное количество участников. Себя он может как включать в эту группу, так и нет. В результате получим матрицу Х, состоящую из элементов хij :

Х = {хij} =


Допустим, наши эксперты проголосовали друг за друга следующим образом:

По данным этой матрицы вычисляются коэффициенты компетентности экспертов:

ki =

Вычислим коэффициенты компетентности экспертов для нашей задачи и результаты занесем в таблицу:

Крайний правый столбец – это коэффициенты компетентности экспертов. Они уже были использованы в примере группового выбора, рассмотренного выше.

Раздел 7. Критерии модульного оценивания знаний

Кредитно-модульная система – это модель организации учебного процесса, которая основывается на объединении двух составляющих: модульной технологии обучения и кредитов (зачетных единиц) и охватывает содержание, формы контроля качества знаний, навыков и учебной деятельности студента в процессе аудиторной и самостоятельной работы.

Рейтинговая система оценивания – это система определения качества выполненной студентом всех видов аудиторной и самостоятельной работы и уровня приобретенных им знаний и навыков путем оценивания в баллах результатов этой работы во время текущего модульного и полусеместрового итогового контроля, с последующим переведением рейтинговой оценки в баллах в оценки традиционной национальной шкалы и шкалы ECTS.

Рейтинговая оценка состоит из баллов, которые студент получает за определенную учебную деятельность на протяжении усвоения данного модуля – тестирование, выполнение и защита индивидуальных задач (домашних контрольных работ), выполнение аудиторной самостоятельной работы и выступления на практических занятиях и т.п..

Семестровый курс дисциплины "Теория принятия решений" разбит на 4 модуля. В конце каждого модуля проводится модульный контроль в виде аудиторной контрольной работы (АКР) или защиты домашней контрольной работы (ДКР), который оценивается до 25 баллов.

Для модуля №1 максимальный рейтинговый балл – 25 баллов распределяется следующим образом:

- аудиторная контрольная работа – 20 баллов;

- выполнение аудиторной самостоятельной работы и выступления на практических занятиях – 5 баллов.

Для модуля №2 максимальный рейтинговый балл – 25 баллов распределяется следующим образом:

- аудиторная контрольная работа – 20 баллов;

- выполнение аудиторной самостоятельной работы и выступления на практических занятиях – 5 баллов.

Для модуля №3 максимальный рейтинговый балл – 25 баллов распределяется следующим образом:

- домашняя контрольная работа – 20 баллов;

- выполнение аудиторной самостоятельной работы и выступления на практических занятиях – 5 баллов.

Для модуля №4 максимальный рейтинговый балл – 25 баллов распределяется следующим образом:

- аудиторная контрольная работа – 20 баллов;

- выполнение аудиторной самостоятельной работы и выступления на практических занятиях – 5 баллов.

Общая балльная оценка за полусеместр выводится простой суммой полученных студентом баллов за все модули полусеместра. Максимальная полусеместровая оценка составляет 100 баллов. Оценка по национальной шкале выводится в соответствии с таблицей:

Итоговый рейтинговый балл по дисциплине Оценка по шкале ECTS Оценка по национальной шкале
91-100 A Отлично
81-90 B Хорошо
76-80 C
61-75 D Удовлетворительно
51-60 E
21-50 FX Неудовлетворительно
0-20 F

Раздел 8. Задания для самостоятельной работы студентов

8.1 Домашняя контрольная работа

Согласно рабочей учебной программе дисциплины "Теория принятия решений" в модуле №3 выполняется домашняя контрольная работа.

Цель домашней контрольной работы – детальная и более тщательная проработка лекционного и практического материала, с целью проверки и контроля степени его усвоения, формирование у студентов предусмотренных рабочей программой навыков.

Домашняя контрольная работа выполняется на бумажных носителях.

Домашняя контрольная работа содержит 30 вариантов. Каждый вариант содержит четыре задания:

- задание №1 – решение матричной игры в чистых стратегиях;

- задание №2 – решение матричной игры в смешанных стратегиях симплекс-методом;

- задание №3 – решение матричной игры в смешанных стратегиях графическим методом.

Студент выбирает вариант домашней контрольной работы согласно своему порядковому номеру в журнале списка своей группы. Контрольная работа, не соответствующая своему варианту, не проверяется и к защите не допускается .

Задание №1.

Определить оптимальные чистые стратегии и цену игры:

1 вариант2 вариант3 вариант


4 вариант5 вариант6 вариант

7 вариант8 вариант9 вариант

10 вариант11 вариант12 вариант

13 вариант14 вариант15 вариант

16 вариант17 вариант18 вариант


19 вариант20 вариант21 вариант

22 вариант23 вариант24 вариант

25 вариант26 вариант27 вариант

28 вариант29 вариант30 вариант

Задание №2.

Определить симплекс-методом оптимальные смешанные стратегии и цену игры:

1 вариант2 вариант3 вариант


4 вариант5 вариант6 вариант

7 вариант8 вариант9 вариант

10 вариант11 вариант12 вариант

13 вариант14 вариант15 вариант

16 вариант17 вариант18 вариант

19 вариант20 вариант21 вариант


22 вариант23 вариант24 вариант

25 вариант26 вариант27 вариант

28 вариант29 вариант30 вариант

Задание №3.

Определить графическим методом оптимальные смешанные стратегии и цену игры:

1 вариант2 вариант3 вариант

4 вариант5 вариант6 вариант

7 вариант8 вариант9 вариант


10 вариант11 вариант12 вариант

13 вариант14 вариант15 вариант

16 вариант17 вариант18 вариант

19 вариант20 вариант21 вариант

22 вариант23 вариант24 вариант

25 вариант26 вариант27 вариант

28 вариант29 вариант30 вариант

8.2 Вопросы к модульным тестированиям

Общие вопросы к всем модулям:

1.Что такое исследование операций?

2.Что такое ЛПР?

3.Что такое математическая модель?

4.Что такое переменные?

5.Что такое альтернатива?

6.Что такое план?

7.Что такое ограничение?

8.Что такое допустимое множество?

9.Что такое допустимый план?

10.Что такое целевая функция?

11.Что такое оптимальный план?

12.Что такое математическое моделирование?

13.Что такое математическое программирование?

14.Что такое линейное программирование?

15.Что такое целочисленное программирование?

16.Что такое динамическое программирование?

17.Что такое нелинейное программирование?

18.Что такое задача принятия решения?

19.Что такое бинарные отношения?

20.Что такое ориентированный граф?

21.Что такое множество Парето?

22.Найти множество Парето.

23.Что такое принятие решения в условиях определенности?

Вопросы к модулю №1:

24.Что такое принятие решения в условиях риска?

25.Какие условия использования критерия Байеса?

26.Решить задачу с помощью критерия Байеса.

27.Какие условия использования критерия Лапласа?

28.Решить задачу с помощью критерия Лапласа.

29.Какие условия использования критерия Гермейера?

30.Решить задачу с помощью критерия Гермейера.

31.Какие условия использования критерия Ходжа-Лемана?

32.Решить задачу с помощью критерия Ходжа-Лемана.

Воп росы к модулю №2:

33.Что такое принятие решения в условиях неопределенности?

34.Какие условия использования принципа максимина?

35.Решить задачу с помощью принципа максимина.

36.Какие условия использования критерия азартного игрока?

37.Решить задачу с помощью критерия азартного игрока.

38.Какие условия использования критерия произведений?

39.Решить задачу с помощью критерия произведений.

40.Какие условия использования критерия Севиджа?

41.Решить задачу с помощью критерия Севиджа.

42.Какие условия использования критерия Гурвица?

43.Решить задачу с помощью критерия Гурвица.

Вопросы к модулю №4:

44.Что такое принятие решения в условиях противодействия?

45.Что такое матричная игра?

46.Что такое платежи матричной игры?

47.Что такое матрица платежей?

48.Что такое матричная игра с нулевой суммой?

49.Что такое матричная игра с ненулевой суммой?

50.Что такое седловая точка?

51.Что такое чистая стратегия?

52.Что такое смешанная стратегия?

53.Найти седловую точку матрицы.

54.Решить матричную игру в чистых стратегиях.

55.Найти множество Парето для задачи двукритериального выбора.

56.Решить задачу многокритериального выбора методом линейной аддитивной свертки.

57.Решить задачу многокритериального выбора методом мультипликативной свертки.

58.Решить задачу многокритериального выбора методом максиминной свертки.

59.Решить задачу про групповую экспертную оценку.

60.Решить задачу экспертной оценки объектов с учетом компетентности экспертов.

8.3 Контрольные вопросы к экзамену по дисциплине

1. Исследование операций как наука о принятии оптимальных решений.

2. Построение математической модели.

3. Математическое программирование. (Общий обзор, основные понятия, классы задач.)

4. Принятие решения: постановка задачи, возможные случаи.

5. Принятие решений в условиях риска. Критерий Байеса.

6. Принятие решений в условиях риска. Критерий Лапласа.

7. Принятие решений в условиях риска. Критерий Гермейера.

8. Принятие решений в условиях риска. Критерий Ходжа-Лемана.

9. Принятие решений в условиях неопределенности. Принцип максимина.

10. Принятие решений в условиях неопределенности. Критерий азартного игрока.

11. Принятие решений в условиях неопределенности. Критерий произведений.

12. Принятие решений в условиях неопределенности. Критерий Севиджа.

13. Принятие решений в условиях неопределенности. Критерий Гурвица.

14. Принятие решений в условиях противодействия. Общие понятия.

15. Матричные игры.

16. Чистые стратегии, седловая точка, цена игры.

17. Смешанные стратегии.

18. Представление матричной игры в виде задачи линейного программирования.

19. Графический метод решения матричной игры.

20. Принятие решений в условиях нескольких критериев выбора (многокритериальный выбор).

21. Линейные свёртки.

22. Максиминная и лексикографическая свёртки.

23. Мультипликативные свёртки.

24. Описание выбора на языке бинарных отношений.

25. Множество Парето. Максимальный элемент.

26. Матрицы смежности и инцидентности.

27. Принятие корпоративных решений.

28. Компетентность экспертов.

Контрольные экзаменационные вопросы используются в случае сдачи студентом экзамена по дисциплине на повышенную оценку в сравнении с оценкой, которую он получил по рейтингу полусеместра. В соответствии с действующим "Положением о кредитно-модульной системе организации учебного процесса и рейтинговом оценивании знаний студентов ЗГИА" оценка, которая получена на экзамене является окончательной и именно она вносится в экзаменационную ведомость и индивидуальный план (зачетную книжку) студента.

Учебно-методический материал по дисциплине

Основная литература (имеется в наличии в библиотеке ЗГИА)

1.Акулич И.Л. Математическое программирование в примерах и задачах: Учеб. пособие для вузов. - М.: Высшая школа , 1986. - 319 c.

2.Волков И.К., Загоруйко Е.А. Исследование операций: Учебник для втузов / Ред. Зарубин В.В., Крищенко А.П. - 2-е изд. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2002. - 435 c.

3.Евланов В.Г. Теория и практика принятия решений. – М.: Экономика, 1984. – 175 с.

4.Кини Р.Л., Райфа Х. Принятие решений при многих критериях: предпочтения и замещения. – М.: Радио и связь, 1981. – 560 с.

5.Колпаков В.М. Теория и практика принятия управленческих решений: Учеб. пособие для вузов. – К.: МАУП, 2000. – 254 с.

6.Костевич Л.С., Лапко А.А. Теория игр. Исследование операций: Учеб. пособие для вузов. - Мн.: Вышэйшая школа, 1982. - 230 c.

7.Кузнецов Ю.Н., Кузубов В.И., Волощенко А.Б. Математическое программирование: Учеб. пособие для вузов - М.: Высшая школа , 1976. - 350 c.

8.Мулен Э. Кооперативное принятие решений: Аксиомы и модели. - М.: Мир, 1991. - 463c.

9.Таха Хемди А. Введение в исследование операций, 7-е изд: Пер. с англ. – М.: Изд. дом "Вильямс", 2005. – 912 с.

10.Теория выбора и принятия решений Учеб. пособие для вузов. - М.: Наука, 1982. - 328 c.

11.Тоценко В.Г. Методы и системы поддержки принятия решений: Алгоритмический аспект / НАН Украины. Ин-т пробл. регистрации информ. - К.: Наук. думка, 2002. – 381 c.

12.Трухаев Р.И. Модели принятия решений в условиях неопределенности / АН СССР. Дальневост. науч. центр. Хабаров. комплекс НИИ. - М.: Наука, 1981. - 257 c.

Дополнительная литература

13.Вентцель Е.С. Исследование операций. – М.: Советское радио, 1972.

14.Гафт М.Г., Подиновский В.В. О построении решающих правил в задачах принятия решений. - Автоматика и телемеханика, №6, 1981.

15.Джексон П. Введение в экспертные системы: Пер. с англ.: Учеб. пособие. – М.: Изд. дом "Вильямс", 2001.

16.Ершов А.Т., Карандаев И.С., Статкус А.В. Матричные игры и графы. – М.: МИУ, 1986.

17.Ларичев О.И. Наука и искусство принятия решений. – М.: Наука, 1979.

18.Ларичев О.И. Теория и методы принятия решений, а также Хроника событий в Волшебных странах: Учебник. – М.: Логос, 2003.

19.Сигал И.Х., Иванова А.П. Введение в прикладное дискретное программирование: модели и вычислительные алгоритмы: Учеб. пособие. – М.: ФИЗМАТЛИТ, 2002. – 240с.

20.Фон Нейман Дж., Моргенштерн О. Теория игр и экономическое поведение. – М.: Наука, 1970.

21.Черноруцкий И.Г. Методы принятия решений. – СПб.: БХВ-Петербург, 2005. – 416 с.

ОТКРЫТЬ САМ ДОКУМЕНТ В НОВОМ ОКНЕ

ДОБАВИТЬ КОММЕНТАРИЙ [можно без регистрации]

Ваше имя:

Комментарий