Принятие решений в условиях неопределенности
Принятие решений в условиях неопределённости — процесс выбора наилучшего варианта действий в ситуации, когда информация о внешней среде, возможных последствиях и вероятностях развития событий является неполной, неточной или недоступной. Степень неопределённости может варьироваться от частичной (когда известны отдельные характеристики распределений, но не полное распределение) до полной (когда неизвестны даже возможные исходы). Таким образом, принятие решений в условиях неопределённости охватывает широкий спектр задач — от ситуаций с ограниченной статистикой до уникальных, не имеющих прецедентов событий.
В отличие от принятия решений в условиях риска, где вероятности исходов известны или могут быть обоснованно оценены, при неопределённости распределение вероятностей отсутствует, неполно или не может быть установлено.
Различие между риском и неопределённостью
Разграничение понятий риска и неопределённости является одним из фундаментальных положений теории принятия решений. Хотя в обыденном языке эти термины нередко используются как синонимы, в академической традиции они обозначают качественно различные ситуации.
Классическое разграничение Найта
Наиболее влиятельное разграничение было предложено американским экономистом Фрэнком Найтом в работе «Risk, Uncertainty and Profit» (1921). Найт выделил два типа незнания о будущем:
- Риск (risk proper) — ситуация, в которой исходы неизвестны, но вероятности их наступления могут быть измерены — на основе статистических данных, частотного анализа или объективных расчётов. Риск поддаётся страхованию и включается в издержки.
- Неопределённость (true uncertainty) — ситуация, в которой вероятности принципиально не могут быть определены: отсутствует статистическая база, ситуация уникальна, или знание о ней слишком неполно для количественной оценки. Именно неопределённость, по Найту, порождает предпринимательскую прибыль, поскольку не поддаётся калькуляции и страхованию.
Найт подчёркивал, что разница между этими понятиями носит не количественный, а качественный характер: измеримая неопределённость (риск) настолько отличается от неизмеримой, что фактически перестаёт быть неопределённостью. Это различие получило название «найтовской неопределённости» (Knightian uncertainty) и оказало глубокое влияние на экономическую теорию XX века.
Трёхчастная классификация Льюса и Райфы
Систематическую классификацию условий принятия решений предложили Р. Д. Льюс и Г. Райфа в работе «Games and Decisions» (1957). Они выделили три типа ситуаций:
| Условия | Характеристика | Пример |
|---|---|---|
| Определённость | Каждое действие гарантированно ведёт к единственному известному результату. | Покупка товара с фиксированной ценой. |
| Риск | Каждое действие ведёт к одному из нескольких возможных исходов, причём вероятности исходов известны лицу, принимающему решение (ЛПР). | Страхование имущества на основе актуарных таблиц. |
| Неопределённость | Каждое действие ведёт к одному из нескольких возможных исходов, но вероятности исходов неизвестны ЛПР или не имеют смысла. | Вывод на рынок принципиально нового продукта. |
Льюс и Райфа также обсуждали комбинацию риска и неопределённости в условиях опытных данных, которая составляет предмет статистического вывода. При этом они подчёркивали, что традиционная игровая модель (выбор в условиях конфликта с рациональным противником) обычно не относится к decision making under uncertainty в узком смысле; этот термин резервируется для задач выбора при незнании состояний природы.
Вклад Сэвиджа и Эллсберга
Леонард Сэвидж в работе «The Foundations of Statistics» (1954) предложил подход субъективных вероятностей, в рамках которого ЛПР всегда может приписать исходам субъективные вероятности и действовать по модели ожидаемой полезности. Тем самым граница между риском и неопределённостью формально стиралась: любая неопределённость превращалась в субъективный риск.
Однако Дэниел Эллсберг в статье «Risk, Ambiguity, and the Savage Axioms» (1961) показал, что на практике люди систематически различают ситуации с известными и неизвестными вероятностями. Экспериментальные исследования (парадокс Эллсберга) продемонстрировали феномен неприятия неоднозначности (ambiguity aversion): при выборе между лотереей с известными и лотереей с неизвестными вероятностями большинство людей предпочитает первую, даже если ожидаемый выигрыш одинаков. Эти результаты подтвердили, что различие между риском и неопределённостью имеет не только теоретическое, но и поведенческое значение, и стимулировали развитие альтернативных моделей принятия решений (максиминная ожидаемая полезность Гильбоа—Шмайдлера, 1989; ожидаемая полезность Шоке — обобщение ожидаемой полезности, в котором вместо аддитивной вероятностной меры используется интеграл Шоке по неаддитивной (ёмкостной) мере, что позволяет описывать различные установки к неоднозначности и, в частности, покрывать поведение эллсберговского типа; функции доверия Демпстера—Шейфера).
Параллельно Дэниел Канеман и Амос Тверски в работе «Prospect Theory: An Analysis of Decision under Risk» (1979) показали, что реальное поведение людей в условиях риска систематически отклоняется от предсказаний нормативной теории ожидаемой полезности: люди переоценивают малые вероятности, недооценивают большие и оценивают исходы относительно точки отсчёта, а не в абсолютных величинах. Теория перспектив была разработана именно для выбора при риске (с известными вероятностями); её распространение на ситуации неоднозначности (ambiguity) и более глубокой неопределённости — предмет позднейших расширений и интерпретаций. В современной литературе бинарное деление Найта «риск vs. неопределённость» развивается в многоуровневую градацию. Единой общепринятой таксономии уровней не существует; приведённая ниже таблица представляет синтетическую рабочую схему, обобщающую подходы различных авторов (Walker et al., 2013; Marchau et al., 2019 и др.):
| Уровень | Характеристика | Знание о вероятностях | Типичный подход |
|---|---|---|---|
| Определённость | Исход полностью известен. | Вырожденное распределение (p = 1). | Детерминированная оптимизация. |
| Риск (risk) | Исходы известны, вероятности заданы. | Известное распределение. | Ожидаемая полезность, критерий Байеса. |
| Неоднозначность (ambiguity) | Исходы известны, но распределение вероятностей задано неточно или неединственно. | Множество допустимых распределений. | Максиминная ожидаемая полезность, неточные вероятности, модели Гильбоа—Шмайдлера. |
| Неопределённость без вероятностей (uncertainty) | Исходы известны, вероятности не могут быть приписаны. | Нет распределения. | Критерии Вальда, Сэвиджа, Гурвица, Лапласа. |
| Глубокая неопределённость (deep uncertainty) | Стороны не знают или не могут согласовать модели системы, распределения вероятностей и/или способы оценивания желательности исходов. | Неприменимо или спорно. | Робастное принятие решений (RDM), адаптивные стратегии, DMDU-подходы. |
Эта градация показывает, что классические критерии (Вальд, Сэвидж, Гурвиц, Лаплас) работают на одном конкретном уровне — неопределённость без вероятностей. При наличии хотя бы субъективных вероятностей задача переходит к уровню риска или неоднозначности, а при радикальном незнании — к глубокой неопределённости, требующей принципиально иных подходов.
Практическое значение разграничения
Различие между уровнями неопределённости определяет выбор математического аппарата:
- в условиях риска применяются вероятностные методы: критерий Байеса, анализ ожидаемой полезности, деревья решений с вероятностными ветвями;
- в условиях неоднозначности (ambiguity) применяются модели неоднозначных убеждений: неаддитивные вероятности, множества вероятностных мер (Гильбоа—Шмайдлер), функции доверия (Демпстера—Шейфера);
- на границе между риском и неопределённостью применяются компромиссные критерии, сочетающие вероятностную и минимаксную компоненты: критерий Ходжа-Лемана, критерий Гермейера;
- в условиях неопределённости без вероятностей используются критерии, не требующие знания вероятностей: Вальда, максимакса, Гурвица, Сэвиджа, Лапласа;
- в условиях глубокой неопределённости применяются робастное принятие решений (RDM), адаптивные траектории (adaptive pathways), сценарное исследование и методы DMDU.
На практике чистая неопределённость и чистый риск — крайние точки спектра. Большинство реальных задач занимают промежуточное положение, где часть информации доступна, а часть — нет, что обуславливает необходимость комбинированных подходов.
Формальная постановка задачи
Задача принятия решений в условиях неопределённости формализуется с помощью платёжной матрицы (матрицы решений).
Пусть:
- — множество альтернатив (стратегий ЛПР);
- — множество возможных состояний среды (природы);
- — результат (выигрыш, полезность), получаемый при выборе альтернативы и наступлении состояния .
Тогда платёжная матрица имеет вид:
ЛПР не знает, какое состояние наступит, и не может приписать состояниям вероятности. Задача — выбрать альтернативу , наилучшую в некотором смысле, определяемом применяемым критерием.
Матрица выигрышей и матрица потерь
Важно различать два способа задания задачи:
- Матрица выигрышей (payoff matrix) — элементы представляют прибыль, доход или полезность; ЛПР стремится их максимизировать. Критерии формулируются через по альтернативам.
- Матрица потерь (loss matrix, cost matrix) — элементы представляют издержки, убытки или ущерб; ЛПР стремится их минимизировать. Критерии формулируются через по альтернативам.
Переход между формулировками осуществляется заменой знака: . При этом критерий максимина (Вальда) в терминах потерь превращается в критерий минимакса: . Смешение формулировок — частый источник ошибок; при решении задач необходимо явно указывать, какая матрица используется.
В дальнейших разделах статьи используется матрица выигрышей (элементы подлежат максимизации), если не оговорено иное.
Классификация неопределённости
Неопределённость в задачах принятия решений может быть классифицирована по нескольким основаниям. Ниже приводятся три ключевых деления, каждое из которых отражает самостоятельную аналитическую плоскость. Следует учитывать, что единой общепринятой международной таксономии не существует; приведённая классификация представляет одну из распространённых дидактических схем, встречающихся в учебной литературе.
По источнику (кто или что порождает неопределённость)
- Природная (пассивная) неопределённость — обусловлена незнанием того, какое именно состояние внешней среды наступит. «Природа» не преследует целей и не действует против ЛПР. Именно этот тип неопределённости описывается платёжной матрицей и классическими критериями выбора (так называемые «игры с природой»).
- Поведенческая (конфликтная, активная) неопределённость — связана с наличием других участников, преследующих собственные цели, и невозможностью предсказать их поведение. Такие ситуации моделируются с помощью теории игр и выходят за рамки классических критериев, рассмотренных ниже, поскольку предполагают рационального противника, а не безразличную среду. Льюс и Райфа подчёркивали, что игровая модель обычно не относится к decision making under uncertainty в узком смысле.
- Личностная неопределённость (дидактический термин) — обусловлена психологическими факторами самого ЛПР: нечёткость предпочтений, неопределённость целей, непоследовательность суждений, когнитивные ограничения. Сам термин не является международно каноническим; в международной традиции соответствующие явления рассматриваются в рамках теории ограниченной рациональности (Г. Саймон, 1955) и поведенческой экономики.
По степени знания о вероятностях
- Стохастическая постановка (ситуация риска) — закон распределения вероятностей состояний среды известен (например, на основе большого массива статистических данных). Строго говоря, это уже не неопределённость, а риск в классическом смысле Льюса—Райфы; пункт приведён здесь для полноты спектра и обозначения границы перехода.
- Статистическая неопределённость — закон распределения неизвестен, но имеются выборочные данные, позволяющие строить оценки параметров. Используются методы статистического вывода.
- Нестохастическая неопределённость — вероятности состояний не могут быть определены ни объективно, ни субъективно. Включает:
- Семантическую (нечёткую) неопределённость — вызвана расплывчатостью описаний: невозможностью чёткого выражения ситуации, вариантов и предпочтений средствами естественного языка. Нечёткая логика и теория нечётких множеств (Л. Заде, 1965) моделируют именно vagueness — расплывчатость высказываний, а не незнание объективных состояний.
- Информационно-статистическую неопределённость — обусловлена неполнотой, неточностью или зашумлённостью данных: ошибки измерений, субъективные экспертные оценки, отсутствие статистики. В отличие от пассивной неопределённости, где неизвестно состояние среды, здесь неточны сами данные, на основе которых строится модель.
- Априорная неопределённость — наиболее глубокий случай: неизвестны не только вероятности, но и само множество возможных исходов. ЛПР действует в условиях радикального незнания. Этот случай близок к уровню total ignorance в классификации Walker et al. (2013), представляющему крайнюю точку спектра глубокой неопределённости.
Алеаторная и эпистемическая неопределённость
В инженерных науках, теории надёжности и машинном обучении широко используется ортогональное деление неопределённости на два фундаментальных типа:
- Алеаторная неопределённость (aleatoric uncertainty, от лат. alea — кость, жребий) — неустранимая случайность, присущая самому явлению. Даже при полном знании модели и параметров результат варьируется из-за внутренней стохастичности процесса. Примеры: бросок кости, квантовый шум, естественная вариабельность свойств материалов.
- Эпистемическая неопределённость (epistemic uncertainty, от греч. ἐπιστήμη — знание) — неопределённость, обусловленная неполнотой знаний наблюдателя: недостаточность данных, неточность модели, ограниченность эксперимента. В принципе, эпистемическая неопределённость может быть уменьшена путём получения дополнительной информации.
Это деление имеет практическое значение: алеаторную неопределённость нельзя уменьшить — можно лишь учесть в модели; эпистемическую — можно снизить за счёт сбора данных, уточнения модели или экспертизы. Многие реальные задачи содержат оба типа одновременно.
Снижение, представление и управление неопределённостью
Работа с неопределённостью включает три взаимосвязанных направления: снижение (уменьшение степени незнания), представление (формализация неопределённости в рамках модели) и управление (выбор стратегий, устойчивых к неопределённости или адаптируемых по мере её разрешения).
Снижение неопределённости
- Получение дополнительной информации — наблюдения, экспертиза, тестирование, пилотные проекты, маркетинговые исследования. Формально оценивается с помощью анализа ценности информации (Value of Information, см. ниже).
- Переход к вероятностной оценке — если накоплено достаточно статистики, задача из неопределённости переходит в задачу с риском, и становятся применимы критерии Байеса, Ходжа-Лемана и др. Это не просто снижение неопределённости, а переход задачи в другой режим.
- Метод аналогий — перенос знаний с похожих ситуаций из прошлого опыта, использование прецедентов для снижения неопределённости в уникальных задачах.
Представление (формализация) неопределённости
- Нечёткие модели — когда информация носит качественный или вербальный характер, формализация через нечёткие множества позволяет обрабатывать «мягкие» оценки. Нечёткие модели не устраняют неопределённость, а формализуют расплывчатость описаний.
- Структуризация задачи — формирование деревьев решений, сценариев, морфологических таблиц, позволяющее выявить ключевые факторы и их взаимосвязи. Деревья решений представляют последовательные задачи выбора в условиях неопределённости (sequential decision problems), а не просто способ графической визуализации.
- Неточные вероятности (imprecise probabilities) — представление неопределённости множеством допустимых вероятностных распределений, а не единственным распределением. Включает интервальные вероятности, верхние и нижние вероятности, функции доверия Демпстера—Шейфера.
Управление неопределённостью
- Анализ чувствительности — оценка того, насколько результат зависит от изменения отдельных параметров или предположений, выявление «критических» переменных.
- Робастная оптимизация — поиск решений, устойчивых к широкому диапазону возможных состояний среды.
- Рандомизация — искусственное введение случайности в процесс выбора (смешанные стратегии), применяемое преимущественно в теории игр и матричных играх для защиты от наихудшего сценария.
- Адаптивные стратегии — последовательные решения, допускающие корректировку по мере поступления новой информации (подробнее — в разделе «Расширения и современные подходы»).
Классические критерии принятия решений при неопределённости
В предыдущих разделах термин «неопределённость» использовался в широком смысле, охватывающем весь спектр ситуаций — от неоднозначности (ambiguity) до глубокой неопределённости (deep uncertainty). В настоящем разделе он употребляется в узком, классическом смысле: как сценарная неопределённость, при которой множество состояний среды и соответствующие выигрыши известны, но вероятности состояний не заданы. Именно для этого режима разработаны критерии Вальда, Сэвиджа, Гурвица, Лапласа и их расширения. Подходы к более глубоким формам неопределённости рассмотрены в разделе «Расширения и современные подходы».
В ситуации неопределённости ЛПР не знает, какое из возможных состояний среды наступит. Чтобы всё же сделать выбор, используются специальные критерии, каждый из которых отражает определённое отношение к риску и характер доступной информации.
Все нижеприведённые критерии сформулированы для матрицы выигрышей (ЛПР максимизирует результат). При использовании матрицы потерь направления оптимизации меняются на противоположные (см. раздел «Матрица выигрышей и матрица потерь»).
Замечание о шкалах: критерии Вальда и максимакса требуют лишь порядковой шкалы (сравнение «больше — меньше»), поскольку операции и инвариантны к любым строго возрастающим преобразованиям. Критерии Лапласа, Гурвица и Сэвиджа требуют как минимум интервальной шкалы: все три инвариантны к позитивным аффинным преобразованиям (при ), включая сдвиг начала отсчёта, но чувствительны к нелинейным монотонным преобразованиям функции выигрыша.
Критерий Вальда (максимин, критерий гарантированного результата)
Критерий крайнего пессимизма. ЛПР предполагает, что произойдёт самый неблагоприятный исход, и выбирает альтернативу с наилучшим гарантированным результатом:
Для каждой альтернативы определяется минимальный выигрыш по всем состояниям среды, и выбирается та альтернатива, у которой этот минимум максимален.
В терминах матрицы потерь аналогичный критерий записывается как (минимакс).
Условия применения: ситуации с высокой ценой ошибки, невозможностью повторного выбора, ответственные решения, когда потери недопустимы.
Критерий максимакса (критерий крайнего оптимизма)
Полярная противоположность критерия Вальда. ЛПР рассчитывает на самый благоприятный исход и выбирает альтернативу с наибольшим возможным выигрышем:
Для каждой альтернативы определяется максимальный выигрыш, и выбирается та, у которой этот максимум наибольший.
Условия применения: ситуации, где потери некритичны и ЛПР склонно к риску ради максимального выигрыша.
Критерий минимина (для матрицы потерь)
В литературе иногда упоминается критерий минимина:
где — элементы матрицы потерь. ЛПР рассчитывает на самый благоприятный исход и выбирает альтернативу с наименьшим возможным убытком. Таким образом, минимин — это критерий крайнего оптимизма, аналог максимакса, но для задач, сформулированных в терминах потерь.
Важно: применение формулы к матрице выигрышей (а не потерь) лишено рационального смысла, поскольку означает целенаправленный выбор альтернативы с наименьшим гарантированным доходом. В контексте матрицы выигрышей полярную шкалу отношения к риску замыкают два критерия: максимакс (предельный оптимизм) и Вальд (предельный пессимизм).
Критерий Гурвица (альфа-критерий, критерий «оптимизма-пессимизма»)
Компромисс между крайним пессимизмом и крайним оптимизмом. ЛПР задаёт коэффициент оптимизма и для каждой альтернативы вычисляет взвешенную оценку:
Выбирается альтернатива с наибольшим значением :
При критерий вырождается в критерий Вальда (чистый пессимизм), при — в критерий максимакса (чистый оптимизм). Значение назначается субъективно, исходя из опыта, контекста задачи и склонности ЛПР к риску.
Примечание о конвенции: в данной статье определён как коэффициент оптимизма ( — чистый оптимизм). В ряде источников используется обратная конвенция, где обозначает коэффициент пессимизма (вес наихудшего исхода), и тогда формула принимает вид . При сверке с другими учебниками необходимо обращать внимание на определение параметра.
Условия применения: ситуации, допускающие баланс между безопасностью и выгодой; ЛПР способно явно оценить свою склонность к риску.
Критерий Сэвиджа (минимакс сожалений)
Критерий, ориентированный на минимизацию упущенной выгоды (сожаления). Как и критерий Вальда, выражает пессимистическую установку, но пессимизм измеряется не в абсолютных потерях, а в разнице между лучшим возможным и фактическим результатом.
Сначала строится матрица сожалений (матрица рисков) , где каждый элемент равен разнице между лучшим возможным результатом при данном состоянии среды и фактическим результатом:
Затем выбирается альтернатива, минимизирующая максимальное сожаление:
Ограничение: критерий Сэвиджа нарушает независимость от посторонних альтернатив (Independence of Irrelevant Alternatives, IIA). Добавление в платёжную матрицу новой — даже заведомо неоптимальной — стратегии может перестроить матрицу сожалений и изменить приоритеты между ранее рассмотренными альтернативами.
Условия применения: конкурентные ситуации, задачи с несколькими сопоставимыми альтернативами, когда важно избежать крупной ошибки выбора.
Критерий Лапласа (критерий Байеса-Лапласа, критерий равновозможности)
Основан на принципе недостаточного основания (Лаплас): если нет оснований считать одно состояние среды более вероятным, чем другое, все состояния полагаются равновероятными. Тогда для каждой альтернативы вычисляется средний выигрыш:
Выбирается альтернатива с наибольшим средним:
Ограничение: результат применения критерия зависит от способа определения множества состояний среды. При различном разбиении пространства состояний (более мелком или более крупном) могут быть получены различные оптимальные решения, что делает критерий чувствительным к формулировке задачи.
Условия применения: полная симметрия незнания, отсутствие оснований предпочесть одно состояние другому.
Критерии при частичной информированности
Критерии Вальда, максимакса, Гурвица, Сэвиджа и Лапласа не используют вероятности состояний среды. Однако на практике ЛПР нередко располагает частичной информацией — экспертными оценками вероятностей, в которых нет полной уверенности. Для таких промежуточных ситуаций разработаны критерии, явно сочетающие вероятностную и «защитную» (минимаксную) компоненты.
Критерий Ходжа-Лемана
Комбинированный критерий, представляющий собой компромисс между байесовской и минимаксной процедурами. Название восходит к работе Hodges и Lehmann (1952) по использованию априорной информации в статистических решениях; формула в матричном виде, приводимая ниже, является позднейшей учебной интерпретацией этого подхода. С помощью параметра выражается степень доверия к имеющемуся распределению вероятностей:
где — вероятности (или веса) состояний среды. Первое слагаемое представляет собой математическое ожидание выигрыша альтернативы по распределению ; при равномерном распределении оно совпадает со средним по критерию Лапласа. Выбирается альтернатива с наибольшим .
При критерий совпадает с критерием Байеса, при — с критерием Вальда.
Условия применения: частичная неопределённость — имеются некоторые предположения о вероятностях, но степень доверия к ним невелика.
Критерий Гермейера
Предназначен для задач, в которых все элементы платёжной матрицы отрицательны (матрица потерь). ЛПР оценивает каждую альтернативу по произведению выигрыша на вероятность соответствующего состояния, выбирая минимальное (наихудшее) значение, и затем максимизирует:
где — вероятность (или вес) состояния . При равных вероятностях критерий Гермейера приводит к тому же выбору оптимальной альтернативы, что и критерий Вальда (значения отличаются в раз, но ранжирование альтернатив совпадает).
Требование отрицательности выигрышей () существенно: умножение отрицательного значения (убытка) на вероятность приближает его к нулю, корректно взвешивая величину потерь. Если бы выигрыши были положительными, умножение на малую вероятность искусственно занижало бы результат, и оператор ошибочно отвергал бы благоприятные, но маловероятные исходы.
Условия применения: задачи с заведомо отрицательными исходами (минимизация потерь), когда имеются хотя бы экспертные оценки вероятностей. Критерий характерен преимущественно для отечественной школы исследования операций (Ю. Б. Гермейер, 1971) и редко встречается в западной литературе.
Связь с байесовским подходом и субъективной ожидаемой полезностью
Классические критерии неопределённости (Вальд, максимакс, Гурвиц, Сэвидж, Лаплас) не требуют задания вероятностей; критерии частичной информированности (Ходжа-Лемана, Гермейера) используют вероятности, но дополняют их «защитной» компонентой. Если же ЛПР может приписать состояниям вероятности с достаточной уверенностью — объективные (на основе статистики) или субъективные (на основе экспертных суждений), — задача полностью переходит в режим принятия решений в условиях риска, и применяется модель субъективной ожидаемой полезности (Сэвидж, 1954):
где — вероятность состояния , — функция полезности ЛПР. Выбирается альтернатива с максимальным (критерий Байеса).
Критерий Лапласа можно рассматривать как частный случай байесовского подхода при равномерном распределении и линейной полезности . Критерий Ходжа-Лемана представляет собой явный мост между двумя режимами: при высоком доверии к вероятностям он работает как критерий Байеса, при низком — как критерий Вальда.
Числовой пример
Предположим, предприятие рассматривает три стратегии выпуска продукции () в условиях четырёх возможных сценариев спроса (). Платёжная матрица (прибыль, млн руб.):
| 5 | 8 | 3 | 12 | |
| 7 | 7 | 6 | 7 | |
| 4 | 10 | 2 | 14 |
Критерий Вальда
Минимумы по строкам: , , .
- .
Критерий максимакса
Максимумы по строкам: , , .
- .
Критерий Гурвица (α = 0,5)
- .
Критерий Сэвиджа
Матрица сожалений (максимум по столбцам: 7, 10, 6, 14):
| 2 | 2 | 3 | 2 | 3 | |
| 0 | 3 | 0 | 7 | 7 | |
| 3 | 0 | 4 | 0 | 4 |
- .
Критерий Лапласа
- .
Сводка результатов
| Критерий | Оптимальная альтернатива | Значение |
|---|---|---|
| Вальд (максимин) | 6 | |
| Максимакс | 14 | |
| Гурвиц (α = 0,5) | 8,0 | |
| Сэвидж (минимакс сожалений) | 3 | |
| Лаплас (равновозможности) | 7,5 |
Как видно, разные критерии рекомендуют разные альтернативы. Выбор критерия определяется отношением ЛПР к риску, характером доступной информации и особенностями задачи. Подробное сопоставление критериев приведено в статье Критерии принятия решений.
Расширения и современные подходы
Классические критерии (Вальд, Сэвидж, Гурвиц, Лаплас) рассматривают однократный статический выбор из конечного множества альтернатив. Современная теория принятия решений существенно расширяет эту рамку.
Ценность информации (Value of Information)
Прежде чем принимать окончательное решение, ЛПР может рассмотреть возможность получения дополнительных сведений (проведение эксперимента, заказ экспертизы, тестирование прототипа). Анализ ценности информации (VoI) формализует вопрос: сколько ЛПР готово заплатить за частичное или полное устранение неопределённости?
Важно: VoI — это инструмент вероятностного анализа решений (decision analysis). Классические EVPI и EVSI формулируются в вероятностной (байесовской) модели, то есть предполагают, что ЛПР способно задать (хотя бы субъективно) распределение вероятностей на состояниях среды. Тем не менее в литературе существуют и обобщения понятия ценности информации для задач с критериями максимина, Лапласа и Гурвица, не требующими заданных вероятностей.
Различают:
- Ожидаемую ценность совершенной информации (Expected Value of Perfect Information, EVPI) — верхнюю границу того, сколько стоит полное устранение неопределённости. Вычисляется как разница между ожидаемым выигрышем при совершенном знании состояний среды и ожидаемым выигрышем при оптимальном решении без информации.
- Ожидаемую ценность выборочной (несовершенной) информации (Expected Value of Sample Information, EVSI) — ценность конкретного частичного наблюдения (теста, опроса, пилота).
При этом всегда выполняется неравенство : совершенная информация задаёт абсолютный верхний предел полезности любых исследований.
Если при данной модели и функции полезности EVPI оказывается невысокой, это означает, что дополнительная информация мало изменит оптимальное решение, и затраты на её получение могут быть нецелесообразны.
Последовательные и адаптивные решения
Многие реальные задачи предполагают не одномоментный выбор, а цепочку решений, перемежающихся с поступлением новой информации. Такие задачи моделируются с помощью:
- Деревьев решений — графических моделей, в которых узлы решений (выбор ЛПР) чередуются с узлами неопределённости (состояния среды). Дерево решений — не просто способ визуализации, а формальная модель последовательной задачи принятия решений в условиях неопределённости (sequential decision problem), решаемая методом обратной индукции (backward induction, rollback).
- Динамического программирования (Беллман, 1957) — обобщения метода обратной индукции на задачи с большим числом этапов и состояний.
- Адаптивных стратегий — планов, явно предусматривающих корректировку действий по мере разрешения неопределённости. ЛПР не фиксирует единственное решение, а определяет правило выбора в зависимости от наблюдаемых условий.
Робастное принятие решений и DMDU
При глубокой неопределённости (deep uncertainty) — когда модели системы, распределения вероятностей и/или критерии оценивания исходов невозможно надёжно задать или согласовать — классические критерии и деревья решений становятся недостаточными. Для таких ситуаций разработаны подходы, объединяемые под зонтичным термином DMDU (Decision Making under Deep Uncertainty, Marchau et al., 2019):
- Робастное принятие решений (Robust Decision Making, RDM) — вычислительный подход, при котором стратегия оценивается не по одному сценарию, а по тысячам альтернативных будущих. Цель — найти стратегию, которая работает приемлемо при максимально широком множестве условий, а не оптимально при одном.
- Динамические адаптивные траектории (Dynamic Adaptive Policy Pathways, DAPP; Haasnoot et al., 2013) — подход, в котором ЛПР определяет набор мер и точки перелома (adaptation tipping points — условия, при которых текущая стратегия перестаёт достигать целей). Момент запуска новой стратегии определяется через сигналы адаптации (adaptation signals, на практике часто называемые triggers) и систему мониторинга. Широко применяется в планировании адаптации к изменению климата, управлении инфраструктурными проектами и долгосрочной энергетической политике.
- Сценарное исследование (exploratory scenario analysis) — систематическое построение множества правдоподобных сценариев будущего без приписывания вероятностей.
- Info-Gap Decision Theory (Бен-Хаим, 2006) — теория, ориентированная на максимизацию робастности решения к неизвестному, но ограниченному отклонению реальности от предполагаемой модели. В отличие от RDM, Info-Gap не требует генерации большого числа сценариев, а формализует неопределённость как вложенные множества возможных моделей.
Подходы DMDU принципиально отличаются от классических критериев: вместо поиска единственного оптимального решения они ориентированы на выявление уязвимостей стратегий и проектирование адаптивных планов.
Литература
- Knight F. H. Risk, Uncertainty and Profit. — Boston: Houghton Mifflin, 1921.
- Wald A. Statistical Decision Functions. — New York: John Wiley & Sons, 1950.
- Savage L. J. The Foundations of Statistics. — New York: John Wiley & Sons, 1954.
- Simon H. A. A Behavioral Model of Rational Choice // The Quarterly Journal of Economics. — 1955. — Vol. 69, № 1. — P. 99–118.
- Bellman R. Dynamic Programming. — Princeton: Princeton University Press, 1957.
- Luce R. D., Raiffa H. Games and Decisions: Introduction and Critical Survey. — New York: John Wiley & Sons, 1957.
- Ellsberg D. Risk, Ambiguity, and the Savage Axioms // Quarterly Journal of Economics. — 1961. — Vol. 75, № 4. — P. 643–669.
- Zadeh L. A. Fuzzy Sets // Information and Control. — 1965. — Vol. 8, № 3. — P. 338–353.
- Shafer G. A Mathematical Theory of Evidence. — Princeton: Princeton University Press, 1976.
- Kahneman D., Tversky A. Prospect Theory: An Analysis of Decision under Risk // Econometrica. — 1979. — Vol. 47, № 2. — P. 263–291.
- Gilboa I., Schmeidler D. Maxmin Expected Utility with Non-Unique Prior // Journal of Mathematical Economics. — 1989. — Vol. 18, № 2. — P. 141–153.
- Schmeidler D. Subjective Probability and Expected Utility without Additivity // Econometrica. — 1989. — Vol. 57, № 3. — P. 571–587.
- Ben-Haim Y. Info-Gap Decision Theory: Decisions Under Severe Uncertainty. — 2nd ed. — London: Academic Press, 2006.
- Walker W. E. et al. Deep Uncertainty // Encyclopedia of Operations Research and Management Science. — 2013.
- Haasnoot M. et al. Dynamic Adaptive Policy Pathways: A Method for Crafting Robust Decisions for a Deeply Uncertain World // Global Environmental Change. — 2013. — Vol. 23, № 2. — P. 485–498.
- Marchau V. A. W. J. et al. (eds.) Decision Making under Deep Uncertainty: From Theory to Practice. — Cham: Springer, 2019.
- Гермейер Ю. Б. Введение в теорию исследования операций. — М.: Наука, 1971.
- Вентцель Е. С. Исследование операций: задачи, принципы, методология. — М.: Наука, 1988.
- Орлов А. И. Теория принятия решений: учебник. — М.: Экзамен, 2006.
- Подиновский В. В., Ногин В. Д. Парето-оптимальные решения многокритериальных задач. — М.: Физматлит, 2007.