Критерий Сэвиджа

Материал из Systems analysis wiki
Перейти к навигации Перейти к поиску

Критерий Сэвиджа (также известный как критерий минимального сожаления) — один из методов принятия решений в условиях неопределённости. Он применяется в ситуациях, когда неизвестны вероятности различных исходов, и целью является минимизация потенциальных потерь вследствие принятия неоптимального решения.

Общая характеристика

В условиях неопределённости последствия выбора каждой стратегии не определены точно. Для оценки возможных альтернатив используется ряд критериев, таких как критерии Вальда, Гурвица, Лапласа и Сэвиджа. Критерий Сэвиджа ориентирован не на достижение максимальной прибыли, а на минимизацию максимального сожаления (потерь по сравнению с наилучшим возможным результатом).

Сожаление — это величина, отражающая упущенную выгоду из-за того, что была выбрана не оптимальная стратегия при конкретном исходе.

Алгоритм применения критерия Сэвиджа

  • Формирование платёжной матрицы: Строится таблица, строки которой соответствуют возможным стратегиям, а столбцы — возможным исходам событий. На пересечении записывается ожидаемый результат при конкретной стратегии и исходе.
  • Построение матрицы сожалений (матрицы рисков): Для каждого исхода (столбца) определяется максимальное значение выигрыша. Затем для каждой ячейки вычисляется величина сожаления:
  • Определение максимальных сожалений для каждой стратегии:В каждой строке матрицы сожалений выбирается максимальное значение (наихудший случай для данной стратегии).
  • Выбор оптимальной стратегии: Выбирается та стратегия, для которой максимальное сожаление минимально.

Таким образом, критерий Сэвиджа реализует принцип минимизации возможного убытка от неправильного решения.

Математическая формулировка

Пусть заданы:

  • S={s1,s2,,sm} — множество доступных стратегий (альтернатив).
  • Θ={θ1,θ2,,θn} — множество возможных состояний природы.
  • u(si,θj) — функция выигрыша (полезности) при выборе стратегии si и наступлении состояния θj. Часто представляется платёжной матрицей A=[aij], где aij=u(si,θj).

Критерий Сэвиджа основан на понятии сожаления (regret) или упущенной выгоды. Сожаление r(si,θj) для стратегии si при состоянии природы θj определяется как разница между максимально возможным выигрышем, который мог быть получен при данном состоянии природы θj (если бы была выбрана наилучшая для этого состояния стратегия), и фактическим выигрышем от стратегии si.

Алгоритм применения критерия Сэвиджа:

  1. Расчет матрицы сожалений (рисков):
    a) Найти максимальный выигрыш для каждого состояния природы (каждого столбца платёжной матрицы):
    uj*=maxk=1,,mu(sk,θj)=maxk=1,,makj
    Это наилучший возможный результат, если наступит состояние θj.
    b) Вычислить элементы матрицы сожалений R=[rij]:**
    rij=r(si,θj)=uj*u(si,θj)=(maxk=1,,makj)aij
    Элемент rij показывает, насколько выигрыш от стратегии si меньше максимально возможного при состоянии θj. Все элементы rij0.
  1. Нахождение максимального сожаления для каждой стратегии: Для каждой стратегии si (каждой строки матрицы сожалений R) определяется её наихудший возможный исход с точки зрения сожаления:
    rimax=maxj=1,,nrij=maxj=1,,n((maxk=1,,makj)aij)
  1. Выбор стратегии с минимальным максимальным сожалением (принцип минимакса сожалений): Выбирается та стратегия sSavage*, которая минимизирует найденное максимальное сожаление:
    sSavage*=argmini=1,,m(rimax)=argminsiS(maxθjΘr(si,θj))
    Или, подставляя выражение для rij:
    sSavage*=argmini=1,,m(maxj=1,,n[(maxk=1,,makj)aij])

Минимальное значение максимального сожаления, достигаемое при использовании критерия Сэвиджа, равно: VSavage=mini=1,,m(rimax)=mini=1,,m(maxj=1,,nrij)

Таким образом, критерий Сэвиджа направлен на выбор стратегии, которая гарантирует наименьшие потери относительно наилучшего возможного действия для каждого состояния природы.


Ключевые моменты в математической формулировке:

  • Определение сожаления rij: Это центральное понятие. Важно показать, что оно вычисляется как разница между лучшим исходом в столбце j и текущим исходом a_{ij}.
  • Матрица сожалений R: Явно указано, как она строится.
  • Нахождение rimax: Показан поиск максимума в каждой строке матрицы сожалений.
  • Принцип минимакса: Четко сформулирован выбор стратегии через argmin от max сожалений.
  • Используемые обозначения: Стандартные для теории игр и принятия решений (S, Θ, u, a_ij, r_ij, max, min, arg min).


Достоинства и недостатки

Преимущества:

  • Ориентирован на минимизацию рисков.
  • Особенно эффективен в условиях высокой неопределённости.

Недостатки:

  • Игнорирует ожидаемую прибыль, сосредотачиваясь только на возможных потерях.
  • Может приводить к излишне консервативным решениям.

Критерии принятия решений