Теория субъективной ожидаемой полезности
Тео́рия субъекти́вной ожида́емой поле́зности (англ. subjective expected utility theory, SEU) — нормативная теория принятия решений в условиях риска и неопределённости, согласно которой рациональный агент обладает субъективной вероятностной мерой над состояниями мира и функцией полезности над исходами, и осуществляет выбор между альтернативами так, как если бы он максимизировал математическое ожидание полезности относительно своей субъективной вероятности. Теория предложена американским математиком Л. Дж. Сэвиджем в монографии «The Foundations of Statistics» (1954) на основе предшествующих работ Ф. Рэмси (1926/1931), Б. де Финетти (1937) и Дж. фон Неймана и О. Моргенштерна (1944). В отличие от теории ожидаемой полезности фон Неймана — Моргенштерна, оперирующей лотереями с заданными объективными вероятностями, теория субъективной ожидаемой полезности выводит вероятностную меру и функцию полезности одновременно из наблюдаемых предпочтений агента на множестве актов (англ. acts) — функций из состояний мира в исходы.
Центральный формальный результат — теорема представления Сэвиджа: для любого отношения предпочтения ≼ на множестве актов, удовлетворяющего семи постулатам P1—P7, существуют единственная конечно-аддитивная не-атомарная вероятностная мера P (точнее — мера с выпуклым образом; см. уточнение ниже) и единственная с точностью до положительного аффинного преобразования ограниченная функция полезности u такие, что f ≼ g тогда и только тогда, когда ∫ u(f(s)) dP(s) ≤ ∫ u(g(s)) dP(s). Этот результат рассматривается в современной литературе как каноническое нормативное обоснование байесовского подхода в статистике и экономике и как опорная точка теории выбора при неопределённости. Теория субъективной ожидаемой полезности образует ядро неоклассической теории выбора при неопределённости и служит точкой отсчёта для последующих дескриптивных и обобщённых моделей, включая теорию перспектив, рангово-зависимую полезность, модели с неаддитивной вероятностью и модели с множественными априорными вероятностями.
Исторический контекст
Формирование теории субъективной ожидаемой полезности в середине XX века подготовлено несколькими независимыми линиями исследования, сведёнными воедино в аксиоматической системе Сэвиджа.
Первая линия — развитие идеи субъективной вероятности (англ. subjective probability, personal probability) как степени уверенности отдельного агента, допускающей количественную калибровку через наблюдаемое поведение. Ф. Рэмси в посмертно опубликованном эссе «Truth and Probability» (1926, опубл. 1931 в сборнике «The Foundations of Mathematics») предложил операциональное определение степени уверенности через коэффициенты, при которых агент готов заключать пари, и связал субъективную вероятность с понятием полезности в единой поведенческой конструкции. Б. де Финетти (1906—1985) в работе «Funzione caratteristica di un fenomeno aleatorio» (Atti della R. Accademia Nazionale dei Lincei, 1931) доказал свою знаменитую теорему представления для обмениваемых последовательностей индикаторных (бинарных) случайных величин, показав, что всякая такая последовательность представима как единственная смесь независимо и одинаково распределённых испытаний Бернулли; этот результат лежит в основе байесовской интерпретации наблюдений как выборки из неизвестного распределения и математически оправдывает чисто субъективное представление о вероятности. Распространение теоремы на произвольные вещественнозначные и более общие обмениваемые последовательности — предмет позднейших работ самого де Финетти (1937) и особенно Э. Хьюитта и Л. Дж. Сэвиджа («Symmetric Measures on Cartesian Products», Transactions of the American Mathematical Society, 1955). В статье «La prévision: ses lois logiques, ses sources subjectives» (Annales de l'Institut Henri Poincaré, 1937) де Финетти независимо разработал концепцию субъективной вероятности на основе принципа когерентности ставок, сформулировав аргумент голландской книги (англ. Dutch book argument): система ставок агента когерентна — то есть не допускает гарантированного проигрыша независимо от реализации событий — тогда и только тогда, когда коэффициенты ставок удовлетворяют аксиомам конечно-аддитивной вероятностной меры. До середины 1950-х годов работы де Финетти оставались малоизвестными в англоязычной литературе; в англоязычной академической среде их популяризацией занялись Л. Дж. Сэвидж в США и Д. Линдли в Великобритании.
Вторая линия — аксиоматизация ожидаемой полезности для ситуаций с объективно заданными вероятностями. Дж. фон Нейман и О. Моргенштерн в приложении ко второму изданию «Theory of Games and Economic Behavior» (1-е изд. Princeton University Press, 1944; аксиоматическое приложение впервые добавлено во 2-м изд. 1947) сформулировали теорему об ожидаемой полезности: предпочтения на множестве простых лотерей, удовлетворяющие аксиомам полного упорядочения, непрерывности и независимости, представимы как максимизация математического ожидания полезности относительно функции полезности, единственной с точностью до положительного аффинного преобразования. Этот результат дал количественное описание полезности как интервальной величины, однако не распространялся на ситуации, в которых вероятности объективно не заданы.
Третья линия — разграничение между риском и неопределённостью. Ф. Найт в монографии «Risk, Uncertainty, and Profit» (1921) различал измеримую неопределённость (риск), характеризуемую известными вероятностями, и неизмеримую неопределённость (собственно неопределённость по Найту), для которой численные вероятности недоступны. В современной литературе это различение удобно иллюстрируется метафорой двух типов случайных устройств: рулетки с объективно заданными вероятностями и скачек, в которых вероятности представляют субъективные оценки агента и могут у разных агентов различаться (метафора введена Ф. Дж. Анскомбом и Р. Дж. Ауманом в статье 1963 года). Сэвиджевский синтез середины 1950-х годов фактически устранил найтовское различение на уровне аксиоматики, допустив представление любой неопределённости через субъективные вероятности, но впоследствии оно было восстановлено на поведенческом уровне в парадоксе Эллсберга.
Синтез этих линий осуществил Л. Дж. Сэвидж (1917—1971; родился 20 ноября 1917 года в Детройте в еврейской семье, при рождении носил фамилию Огашевиц — Leonard Ogashevitz; отец Луис Огашевиц родился в Детройте в 1897 году, а его родители — дед и бабушка Леонарда — эмигрировали в США из Российской империи в конце XIX века. В 1920 году отец официально сменил фамилию на Savage, однако по законам штата Мичиган эта перемена не распространилась на несовершеннолетних детей, и Леонард юридически сменил имя на Leonard Jimmie Savage уже самостоятельно во время выполнения секретных работ в годы Второй мировой войны; докторскую степень по математике получил в Мичиганском университете в 1941 году). Сэвидж работал в Институте перспективных исследований в Принстоне, в Статистической исследовательской группе Колумбийского университета, в Чикагском университете (с 1947 года, штатный профессор с 1954 года, заведующий кафедрой статистики в 1956—1959 годах), затем в Мичиганском университете и Йельском университете. Опубликованная в 1954 году монография «The Foundations of Statistics» объединила предложенное Рэмси и де Финетти поведенческое определение субъективной вероятности с аппаратом ожидаемой полезности фон Неймана — Моргенштерна в единой аксиоматической системе. Ключевую роль в формировании книги сыграла интенсивная переписка Сэвиджа с де Финетти в 1949—1954 годах, подробно документированная в исследовании З. Аль-Каффафа «Savage, de Finetti, and the Making of The Foundations of Statistics, 1949—1954» (European Journal of the History of Economic Thought, 2025). Во втором издании «The Foundations of Statistics», вышедшем уже после смерти Сэвиджа (Dover, июнь 1972), автор отказался от попытки совместить субъективистский подход с частотистскими процедурами статистического вывода, что характеризует радикальный байесовский поворот Сэвиджа в поздний период.
К концу 1950-х годов теория субъективной ожидаемой полезности стала рассматриваться как канонический нормативный стандарт рациональности в экономической и статистической литературе. Параллельно Ф. Дж. Анскомб и Р. Дж. Ауман в статье «A Definition of Subjective Probability» (Annals of Mathematical Statistics, 1963) предложили альтернативную, технически более простую аксиоматизацию, использующую двухэтапную конструкцию лотерей с объективными и субъективными вероятностями; эта конструкция впоследствии стала стандартной средой для большинства аксиоматизаций в теории решений при неопределённости.
Основные понятия
Состояния, исходы, акты
Формальный аппарат теории опирается на три примитивных понятия. Состояние мира (англ. state of the world) s ∈ S — полное описание всех обстоятельств, не контролируемых агентом, но релевантных для оценки последствий его действий. Множество состояний S предполагается исчерпывающим и взаимоисключающим: в каждый момент времени реализуется ровно одно состояние. Событие (англ. event) E ⊆ S — подмножество S, то есть совокупность состояний, объединённых некоторым общим свойством. Исход (англ. consequence, outcome) x ∈ X — полное описание того, что происходит с агентом; все субъективно значимые аспекты ситуации предполагаются включёнными в исход.
Акт f — функция f: S → X, сопоставляющая каждому состоянию соответствующий исход. Множество всех актов обозначается F. Предпочтения агента формально описываются бинарным отношением ≼ на F, где f ≼ g интерпретируется как «g слабо предпочитается f». Из ≼ стандартным образом определяются строгое предпочтение f ≺ g и безразличие f ∼ g. Постоянный акт (англ. constant act) — акт, приписывающий один и тот же исход всем состояниям; постоянные акты обеспечивают вложение X в F и тем самым позволяют говорить о предпочтениях агента на множестве исходов через его предпочтения на актах.
Принципиальная особенность сэвиджевской конструкции — требование определённости предпочтения на всех мыслимых актах, то есть на полном множестве функций S → X (так называемое допущение прямоугольного поля, англ. Rectangular Field Assumption; термин введён Дж. Брумом в монографии «Weighing Goods», 1991). Это допущение позволяет получить теорему представления, но одновременно порождает концептуальные трудности: многие элементы F описывают содержательно бессмысленные комбинации состояний и исходов, с которыми реальный агент не сталкивается. Эта внутренняя напряжённость сэвиджевской аксиоматики остаётся предметом продолжающейся дискуссии в философии решений.
Субъективная вероятность
Центральная содержательная идея теории — вывод субъективной вероятностной меры непосредственно из предпочтений на актах. Сравнительное отношение «событие E не менее вероятно, чем событие F» (≽*) определяется через готовность агента ставить благоприятный исход на E, а не на F: если x предпочтительнее y и агент предпочитает акт «x при E, y при ¬E» акту «x при F, y при ¬F», то E считается не менее вероятным, чем F. Сэвиджевские постулаты обеспечивают, что построенное таким образом отношение представимо единственной конечно-аддитивной вероятностной мерой P: 2S → [0, 1], удовлетворяющей стандартным аксиомам вероятности (за исключением счётной аддитивности, которая в исходной формулировке не требуется).
Принципиально, что субъективная вероятность не даётся независимо от предпочтений, а выводится из них как производное понятие. Это отличает теорию от ранних субъективистских подходов, в которых степень уверенности рассматривалась как первичная психологическая величина. Операциональный характер определения вероятности через пари — прямое наследие работ Рэмси и де Финетти; в сэвиджевском изложении он получает полную аксиоматическую форму.
Полезность
Функция полезности u: X → ℝ представляет предпочтения агента на множестве исходов в количественной форме. В теории субъективной ожидаемой полезности u — кардинальная (интервальная) величина: она единственна с точностью до положительного аффинного преобразования u ↦ au + b при a > 0, то есть фиксация нуля и единицы измерения произвольна, но относительные различия полезностей определены однозначно. Эта степень единственности оказывается необходимой и достаточной для того, чтобы операция взятия математического ожидания была корректно определена: при иной, чисто порядковой единственности математические ожидания двух лотерей можно было бы упорядочить противоположным образом, всего лишь заменив представляющую функцию, что лишило бы правило максимизации ожидания содержательного смысла.
Форма функции полезности — выпуклая, вогнутая или S-образная — в нормативной версии теории не фиксируется: рациональность состоит в самой максимизации ожидания, тогда как конкретное отношение к риску (риск-избегание при вогнутой u, риск-склонность при выпуклой u) описывается как индивидуальная характеристика агента. Систематическое измерение кривизны u даётся коэффициентами абсолютного и относительного избегания риска Дж. Пратта («Risk Aversion in the Small and in the Large», Econometrica, 1964) и К. Эрроу («Essays in the Theory of Risk-Bearing», 1971).
Аксиоматика Сэвиджа
Сэвидж формулирует семь постулатов на отношении предпочтения ≼, которые в совокупности эквивалентны существованию представления через максимизацию субъективной ожидаемой полезности. Ниже постулаты излагаются в стандартной современной нотации, восходящей к изложению П. Фишберна в монографии «Utility Theory for Decision Making» (1970) и Д. Крепса в учебнике «Notes on the Theory of Choice» (1988).
Постулат P1 (полное слабое упорядочение). Отношение ≼ полно и транзитивно на F.
Постулат P2 (принцип уверенной вещи, англ. sure-thing principle). Если акты f, g, f′, g′ таковы, что f совпадает с g на дополнении ¬E некоторого события E, f′ совпадает с g′ на ¬E, f совпадает с f′ на E, g совпадает с g′ на E, то f ≼ g тогда и только тогда, когда f′ ≼ g′. Неформально: если два акта дают одинаковые исходы в некотором наборе состояний, то относительное предпочтение между ними определяется исключительно исходами в остальной части пространства состояний, а то, какой именно общий исход они назначают «совпадающим» состояниям, роли не играет. Сам термин «принцип уверенной вещи» Сэвидж ввёл как неформальное обоснование P2 и отчасти P3, мотивируя его известным примером с бизнесменом, рассматривающим покупку недвижимости накануне президентских выборов: если покупка оправдана и при победе демократа, и при победе республиканца, исход выборов нерелевантен для решения и покупку следует совершить сейчас, не дожидаясь результата голосования. Подробный технический результат Ж. Баччелли и Л. Гартмана в статье «The Sure-Thing Principle» (Journal of Mathematical Economics, 2023) состоит в том, что P2 и P3 каждый по отдельности эквивалентен определённому условию доминирования и что их конъюнкция допускает эквивалентное выражение через единое условие доминирования.
Постулат P3 (независимость предпочтения исходов от состояния, англ. state independence). Если E — неничтожное событие, f(s) = x и g(s) = y для всех s ∈ E, то условное предпочтение f ≼ g при E эквивалентно x ≼ y. Неформально: желательность исхода самого по себе не зависит от того, в каком именно состоянии он реализуется. Этот постулат обеспечивает возможность сравнительного оценивания исходов независимо от контекста их реализации. В современной литературе Л. Гартман в статье «Savage's P3 Is Redundant» (Econometrica, 2020; с последующим уточнением формулировок P5 и P6 в erratum Г. Фрама и Л. Гартмана, Econometrica, 2023, не затрагивающим основного результата) показал, что постулат P3 является следствием остальных сэвиджевских аксиом, то есть избыточен в формальной системе; при этом нормативное содержание P3 — независимость желательности исхода от состояния мира — сохраняет концептуальную значимость для интерпретации SEU и при исключении этой аксиомы поглощается остальными постулатами, что меняет нагрузку соответствующих формальных требований. В последующей работе М. Харью, Ю. Лиесиё и К. Виртанена «Independent Postulates for Subjective Expected Utility» (Theory and Decision, 2024) установлено, что после исключения P3 остальные шесть постулатов независимы и образуют минимальную аксиоматическую систему для SEU.
Постулат P4 (независимость сравнительной вероятности от ставки). Сравнение двух событий по вероятности не должно зависеть от конкретной пары «выигрыш — проигрыш», на которой эта вероятность выявляется. Формально: если x ≻ y и x′ ≻ y′, то акт «x при E, y при ¬E» предпочтительнее акта «x при F, y при ¬F» тогда и только тогда, когда акт «x′ при E, y′ при ¬E» предпочтительнее акта «x′ при F, y′ при ¬F». Этот постулат обеспечивает корректность определения сравнительного отношения вероятности через предпочтения.
Постулат P5 (нетривиальность). Существуют исходы x, y ∈ X, для которых x ≺ y. Без этой аксиомы агент был бы индифферентен ко всему и сравнительное отношение вероятности оставалось бы неопределённым.
Постулат P6 (атомарная тонкость, англ. non-atomicity). Для любых актов f, g с f ≺ g и любого исхода x существует конечное разбиение S на события E1, …, En, такое что замена f или g на исход x на любом из Ei сохраняет строгое предпочтение. Это структурная, а не содержательная аксиома: она требует, чтобы в S существовали события сколь угодно малой вероятности, и обеспечивает непрерывность выводимой вероятностной меры. P6 обычно иллюстрируется бесконечной последовательностью независимых подбрасываний монеты, с каждым подбрасыванием дающих всё более тонкое разбиение пространства состояний.
Постулат P7 (доминирование на бесконечных актах). Для любого события E и актов f, g ∈ F: если f ≼ cg(s) условно при E для всех s ∈ E (здесь cx — постоянный акт, принимающий значение x во всех состояниях), то f ≼ g условно при E; симметрично, если cf(s) ≼ g условно при E для всех s ∈ E, то f ≼ g условно при E. Иными словами, акт доминирует над другим, если он доминирует над каждой из постоянных «мгновенных» замен последнего на событии. Этот постулат имеет силу только для актов, принимающих бесконечное число значений, и введён Сэвиджем для обеспечения теоремы представления в общем случае бесконечнозначных (не-простых) актов; для простых актов (принимающих конечное число значений) теорема выводится уже из P1—P6. П. Фишберн в монографии «Utility Theory for Decision Making» (1970) показал, что P7 в комбинации с остальными аксиомами влечёт ограниченность выводимой функции полезности (тем самым предотвращая сэвиджевскую версию Санкт-Петербургского парадокса, в которой интеграл ожидаемой полезности расходился бы); это свойство делает стандартную теорему представления применимой именно к классу ограниченных функций полезности, а распространение представления на неограниченные функции полезности составляет предмет отдельных позднейших расширений — см. П. Ваккер, «Unbounded Utility for Savage's Foundations of Statistics, and Other Models» (Mathematics of Operations Research, 1993).
Теорема представления Сэвиджа. Отношение предпочтения ≼ на множестве актов F удовлетворяет постулатам P1—P7 тогда и только тогда, когда существуют единственная конечно-аддитивная вероятностная мера P с выпуклым образом (англ. convex-ranged) на алгебре событий 2S и непостоянная ограниченная функция полезности u: X → ℝ, единственная с точностью до положительного аффинного преобразования, такие что для любых f, g ∈ F выполнено
- f ≼ g ⇔ ∫S u(f(s)) dP(s) ≤ ∫S u(g(s)) dP(s).
Интеграл понимается в общем смысле относительно меры P; в случае конечного пространства состояний S = {s1, …, sn} он сводится к конечной сумме Σi=1n P(si) · u(f(si)). Свойство выпуклости образа P означает, что для любого события A и любого p ∈ (0, P(A)) существует подсобытие B ⊆ A, для которого P(B) = p; для счётно-аддитивных мер оно эквивалентно обычной не-атомарности, но в конечно-аддитивном контексте Сэвиджа, в котором формулируется теорема, свойство с выпуклым образом строго сильнее и именно оно обеспечивается постулатом P6. Аккуратный анализ этой разницы и эквивалентных формулировок — П. Ваккер, «Unbounded Utility for Savage's Foundations of Statistics, and Other Models» (Mathematics of Operations Research, 1993); Г. Фрам и Л. Гартман, «Some Notes on Savage's Representation Theorem» (Theory and Decision, 2025; online-first — август 2024). В литературе результат традиционно характеризуется как кульминация теории решений (формулировка восходит к учебнику Крепса 1988 года). Техническая сложность оригинального доказательства стимулировала появление упрощённых и обобщённых версий: М. Абделлауи и П. Ваккер в статье «Savage for Dummies and Experts» (Journal of Economic Theory, 2020) дали современное самодостаточное изложение, основанное на технике леммы Гёльдера вместо исходных конструкций Сэвиджа, что позволило ослабить ряд структурных аксиом и сделать аксиоматизацию доступной для педагогических целей.
Постановка Анскомба — Аумана
Параллельно сэвиджевской конструкции Ф. Дж. Анскомб и Р. Дж. Ауман в статье «A Definition of Subjective Probability» (Annals of Mathematical Statistics, 1963) предложили альтернативную аксиоматизацию, в которой примитивы обогащены объективными вероятностями. В этой схеме различаются два типа лотерей: рулетки (англ. roulette lotteries) — лотереи с объективно заданными вероятностями, не связанные с состояниями мира, и скачки (англ. horse lotteries) — ставки на события, для которых объективные вероятности не заданы, но выигрыши представляют собой рулеточные лотереи. Акт в терминологии Анскомба — Аумана — функция f: S → Δ(X), сопоставляющая каждому состоянию мира распределение вероятностей над исходами.
В этой постановке аксиомы включают стандартные требования фон Неймана — Моргенштерна на лотереи (полное упорядочение, непрерывность, независимость по смешиванию), а также монотонность, обеспечивающую, что стохастически доминирующий акт предпочтительнее. Техническая роль объективных рулеток — предоставить эталонную шкалу для калибровки субъективных вероятностей, избавляя от необходимости структурной аксиомы типа P6 Сэвиджа. В исходной постановке Анскомба — Аумана пространство состояний S предполагается конечным; итоговое представление принимает вид
- V(f) = Σs∈S P(s) · EU(f(s))
где EU — ожидаемая полезность рулетки по фон Нейману — Моргенштерну, а P — единственная субъективная вероятностная мера.
Анскомб-Аумановская постановка технически проще сэвиджевской: она не требует бесконечной делимости пространства состояний и работает в конечных моделях. По этой причине она стала доминирующей средой для большинства последующих аксиоматизаций в теории решений — как расширяющих SEU (зависимая от состояния полезность Э. Карни, Д. Шмайдлера и К. Винда, 1983; рангово-зависимая полезность Дж. Квиггина, 1982), так и обобщающих её (теории неоднозначности Д. Шмайдлера, 1989; И. Гилбоа и Д. Шмайдлера, 1989; П. Клибаноффа, М. Мариначчи и С. Мукержи, 2005; Ф. Маккерони, М. Мариначчи и А. Рустичини, 2006). Концептуальная цена простоты — смешение двух типов вероятностей в исходной постановке, что в ряде критических работ рассматривается как ограничение чисто субъективного содержания теории.
Связь с байесианством
Теория субъективной ожидаемой полезности образует поведенческий фундамент байесовского подхода в статистике и теории решений, что отражено в часто используемом её названии — байесовская теория принятия решений (Bayesian decision theory). Связь проявляется в трёх основных аспектах.
Когерентность как согласованность предпочтений. Аргумент голландской книги де Финетти и Рэмси показывает, что всякий агент, чьи ставки не подчиняются аксиомам конечно-аддитивной вероятности, может быть вовлечён в систему пари с гарантированным проигрышем при любой реализации событий. Сэвиджевская теорема усиливает этот результат до полной аксиоматизации поведения: агент, предпочтения которого удовлетворяют P1—P7, действует так, как если бы обладал когерентной субъективной вероятностью и максимизировал ожидаемую полезность. Систематическое изложение аргумента голландской книги и его философских интерпретаций — статья С. Вайнберг «Dutch Book Arguments» в Стэнфордской философской энциклопедии.
Байесовское обучение. Стандартное правило обновления вероятностей в SEU — кондиционализация (англ. conditionalization): при получении новой информации, позволяющей установить истинность события E с положительной априорной вероятностью, агент заменяет априорное P на условное P(· | E). В более общем случае с неопределённостью наблюдения применяется правило Джеффри (англ. Jeffrey conditionalization), введённое Р. Джеффри в монографии «The Logic of Decision» (1965). Теорема И. Дж. Гуда в статье «On the Principle of Total Evidence» (British Journal for the Philosophy of Science, 1967) доказывает, что максимизирующий ожидаемую полезность агент, применяющий кондиционализацию, всегда извлекает неотрицательную ожидаемую выгоду из получения бесплатной информации, относящейся к предстоящему решению; тем самым SEU обосновывает предпочтение более информированного решения менее информированному и задаёт количественный критерий ценности информации.
Основания байесовской статистики. Монография Сэвиджа излагает теорию принятия решений как фундамент статистического вывода: статистические процедуры (оценивание параметров, проверка гипотез, планирование экспериментов) интерпретируются как частные случаи рационального выбора относительно функции потерь, а априорные распределения — как субъективные вероятности, формализованные сэвиджевской теоремой представления. Эта программа подхвачена и развёрнута в монографиях Х. Раиффы и Р. Шлейфера «Applied Statistical Decision Theory» (1961), М. Де Грута «Optimal Statistical Decisions» (1970), Дж. Бергера «Statistical Decision Theory and Bayesian Analysis» (2-е изд., Springer, 1985); современное состояние и основные течения отражены в энциклопедической статье Э. Карни «Savage's Subjective Expected Utility Model» (The New Palgrave Dictionary of Economics, 2-е изд., 2008).
Критика и парадоксы
Несмотря на нормативную элегантность, SEU с момента своего появления подвергалась систематической критике — как на эмпирическом, так и на нормативном уровне. Центральные возражения оформлены в виде устойчивых парадоксов и концептуальных затруднений.
Парадокс Алле
Парадокс Алле — старейший и наиболее известный контрпример к аксиоме независимости, сформулированный М. Алле в статье «Le comportement de l'homme rationnel devant le risque: critique des postulats et axiomes de l'école américaine» (Econometrica, 1953). В оригинальной формулировке Алле сопоставляются две пары лотерей с крупными денежными призами (100 миллионов и 500 миллионов французских франков 1952 года — порядка 285 тысяч и 1,4 миллиона долларов соответственно); компактная версия с суммами 2400 и 2500 единиц, ставшая стандартом в учебной литературе, введена Д. Канеманом и А. Тверски в статье «Prospect Theory» (Econometrica, 1979). В первой паре одна из альтернатив даёт гарантированный выигрыш, в другой — шанс большего выигрыша при малой вероятности получить ноль; во второй паре каждая вероятность уменьшена в одинаковой пропорции. Модальный выбор испытуемых — гарантированный выигрыш в первой паре и рискованная лотерея во второй — несовместим с постулатом P2 Сэвиджа и аксиомой независимости фон Неймана — Моргенштерна, поскольку пропорциональное уменьшение вероятностей в силу аксиомы независимости должно сохранять относительное предпочтение. Эмпирически эффект Алле многократно воспроизведён в лабораторных экспериментах и на реальных финансовых данных; его каноническая интерпретация — эффект уверенности, то есть непропорциональная переоценка гарантированных исходов.
Стандартные нормативные реакции на парадокс Алле включают три направления: (1) утверждение, что наблюдаемые предпочтения иррациональны и при рефлексии пересматриваются в пользу аксиомы независимости; (2) переопределение пространства исходов так, чтобы в состав исхода входили дополнительные аспекты — сожаление о нереализованной гарантированной альтернативе, что формально сохраняет P2 ценой утраты содержательной определимости исходов (этот путь обсуждается Дж. Брумом в «Weighing Goods», 1991); (3) отказ от аксиомы независимости и построение альтернативных, не-ожидаемых теорий полезности (см. раздел Обобщения).
Парадокс Эллсберга
Парадокс Эллсберга (D. Ellsberg, «Risk, Ambiguity, and the Savage Axioms», Quarterly Journal of Economics, 1961) демонстрирует систематическое нарушение постулата P2 Сэвиджа в ситуациях с неоднозначно заданными вероятностями. В двухурновом варианте агенту предлагают поставить на цвет шара, извлечённого из одной из двух урн: первая содержит 50 красных и 50 чёрных шаров, вторая — 100 шаров неизвестных пропорций красного и чёрного. Модальный выбор — первая урна независимо от того, на какой цвет ставится выигрыш, — показывает, что субъекты предпочитают известный риск неоднозначному и тем самым нарушают аксиомы SEU. В трёхцветном варианте (30 красных шаров, 60 чёрных или жёлтых в неизвестной пропорции) нарушение P2 становится прямым и не сводится к какой-либо единой субъективной вероятности.
Эллсберг описал наблюдаемый феномен как отвращение к неоднозначности (англ. ambiguity aversion) и связал его с восстановлением найтовского различения измеримой и неизмеримой неопределённости на поведенческом уровне. Сам Эллсберг, как отмечено в ретроспективной статье И. Москати «Ellsberg 1961: Text, Context, Influence» (Decisions in Economics and Finance, 2024), подчёркивал, что исследовал не только отвращение, но и возможное предпочтение неоднозначности, так что наблюдаемая асимметрия — эмпирический факт, а не логическая необходимость. Систематический обзор моделей неоднозначности дан М. Мачина и М. Синискальки в энциклопедической главе «Ambiguity and Ambiguity Aversion» в сборнике «Handbook of the Economics of Risk and Uncertainty» (North-Holland, 2014, Vol. 1, p. 729—807); монографическое изложение — П. Ваккер, «Prospect Theory: For Risk and Ambiguity» (Cambridge University Press, 2010).
Теория поддержки и неэкстенсиональность субъективной вероятности
Поведенческий анализ А. Тверски и Д. Кёлера в статье «Support Theory: A Nonextensional Representation of Subjective Probability» (Psychological Review, 1994) выявил систематическое нарушение ещё одной структурной предпосылки SEU — экстенсиональности субъективной вероятности, то есть её приписывания событиям как самостоятельным объектам, а не их словесным описаниям. Эмпирически одно и то же событие получает различные вероятностные оценки в зависимости от того, представлено ли оно в обобщённой или детализированной форме: детальное описание активирует больший объём доказательной поддержки в памяти агента и повышает оценку вероятности. Формально теория поддержки приписывает каждой гипотезе A неотрицательное значение поддержки s(A) и определяет субъективную вероятность A относительно альтернативы B как s(A) / (s(A) + s(B)).
Ключевое эмпирическое следствие — субаддитивность суждений о вероятности: разбиение события на компоненты и их последовательное оценивание даёт в сумме больше, чем оценка события целиком, что противоречит аддитивности вероятностной меры, выводимой из сэвиджевских постулатов. Связанное явление — эффект сравнительного незнания (англ. comparative ignorance), зафиксированный К. Фоксом и А. Тверски в статье «Ambiguity Aversion and Comparative Ignorance» (Quarterly Journal of Economics, 1995): отвращение к неоднозначности возникает преимущественно тогда, когда агент оценивает неоднозначные альтернативы в сравнении с однозначными, и существенно ослабевает при изолированном оценивании. Развитие теории поддержки в прикладном контексте байесовского вывода в условиях неполных разбиений — К. Фокс и Р. Клеммен, «Subjective Probability Assessment in Decision Analysis: Partition Dependence and Bias Toward the Ignorance Prior» (Management Science, 2005). Эти результаты ставят под сомнение возможность представить наблюдаемые вероятностные суждения единой аддитивной мерой и вынуждают расширять SEU в направлении моделей с неаддитивной вероятностью (см. раздел Обобщения).
Зависимая от состояния полезность
Постулат P3 Сэвиджа требует, чтобы желательность исхода не зависела от состояния, в котором исход реализуется. Реальные ситуации нередко нарушают это требование: ценность страховой выплаты зависит от того, наступил ли страховой случай; польза пищи зависит от состояния здоровья; ценность денежной суммы в ситуации банкротства отличается от её ценности при платёжеспособности. Для корректного представления таких ситуаций Э. Карни, Д. Шмайдлер и К. Винд в работе «On State-Dependent Preferences and Subjective Probabilities» (Econometrica, 1983) построили обобщение с зависимой от состояния полезностью (англ. state-dependent utility) us(x), где функция полезности параметризована состоянием.
Принципиальная трудность этого расширения — проблема одновременной идентификации субъективной вероятности и полезности: различные комбинации P и (us)s∈S могут порождать одно и то же наблюдаемое поведение, что подрывает операциональный статус субъективной вероятности. Систематический обзор и попытки решения даны в монографии Э. Карни «Decision Making under Uncertainty: The Case of State-Dependent Preferences» (Harvard University Press, 1985), в обзорной работе Э. Карни и Д. Шмайдлера «Utility Theory with Uncertainty» в «Handbook of Mathematical Economics» (1991) и в позднейшей статье Э. Карни и Д. Шмайдлера «An Expected Utility Theory for State-Dependent Preferences» (Theory and Decision, 2016). Аналитическая дискуссия о статусе морального риска (англ. moral hazard) и связанных с ним представлений о субъективной вероятности ведётся в статье Ж. Баччелли «Moral Hazard, the Savage Framework, and State-Dependent Utility» (Erkenntnis, 2021; препринт 2019).
Неполнота предпочтений
Постулат P1 предполагает, что отношение ≼ полно: агент способен сравнить любую пару актов. Это требование оспаривается рядом авторов как нормативно необоснованное. Р. Ауман в ранней работе «Utility Theory without the Completeness Axiom» (Econometrica, 1962) показал, что ослабление полноты приводит к представлению через множества полезностей. Т. Бьюли в распространявшейся с 1986 года рабочей записке, опубликованной под названием «Knightian Decision Theory: Part I» (Decisions in Economics and Finance, 2002), построил систематическую модель найтовской неопределённости с неполными предпочтениями, в которой агент меняет статус-кво только при наличии строгого преобладания альтернативы по всем вероятностям из его множества априорных вероятностей.
Соответствующие модели представляют предпочтения через множества вероятностно-утилитарных пар и опираются на понятие когерентной расширимости (англ. coherent extendibility): неполные предпочтения считаются рациональными, если допускают пополнение без нарушения остальных аксиом. Современное систематическое изложение этого подхода даёт Р. Бредли в монографии «Decision Theory with a Human Face» (Cambridge University Press, 2017). Параллельная линия, восходящая к И. Леви («The Enterprise of Knowledge», MIT Press, 1980), рассматривает неполноту как отражение множественности ценностей, не сводимых к единой кардинальной шкале.
Нормативный статус и «Savage Revisited»
Сводная критика нормативного статуса SEU представлена в статье Г. Шэфера «Savage Revisited» (Statistical Science, 1986): постулаты Сэвиджа апеллируют к свойствам предпочтений (завершённость, независимость от формулировки, транзитивность при произвольных актах), систематически нарушаемым в эксперименте; попытка изолировать нормативное содержание от эмпирики терпит неудачу, поскольку те же самые поведенческие структуры, на которых конструируется теорема представления, оказываются и местом её эмпирической несостоятельности. Шэфер заключает, что нормативная интерпретация SEU требует пересмотра в сторону конструктивистского понимания вероятности и предпочтения. С близкой позиции критиковали теорию П. Слович и А. Тверски («Who Accepts Savage's Axiom?», Behavioral Science, 1974), показавшие, что после предъявления доказательства P2 значительная часть испытуемых предпочитает пересмотреть аксиому, а не свой исходный выбор.
Пропозициональная аксиоматизация Джеффри
Существенную критику сэвиджевского различения актов и состояний мира выдвинул Р. Джеффри в монографии «The Logic of Decision» (1965; 2-е изд. 1983). Джеффри указал, что у реального агента действия не полностью отделимы от состояний мира: состояние мира может зависеть от того, какой выбор делает агент, и наоборот, вследствие чего формальная конструкция Сэвиджа — функции из S в X — представляет собой искусственную идеализацию. Вместо этого Джеффри предложил пропозициональную аксиоматизацию: объектами убеждений и желаний являются не действия и состояния, а пропозиции — элементы произвольной булевой алгебры, причём каждая пропозиция получает как субъективную вероятность, так и меру желательности (англ. desirability). Ожидаемая желательность пропозиции A определяется как взвешенная сумма желательностей её взаимно исключающих конкретизаций, взвешенных по условным вероятностям. Формальная теорема представления для этой системы — теорема Джеффри — Болкера (Ethan Bolker, «Functions Resembling Quotients of Measures», Transactions of the American Mathematical Society, 1966): выполнение аксиом Джеффри эквивалентно существованию представления через пару ⟨P, Des⟩, единственную с точностью до дробно-линейного преобразования (англ. fractional linear transformation, преобразование вида (au + b)/(cu + d)) — а не с точностью до положительного аффинного преобразования, как в SEU.
Принципиальное отличие от Сэвиджа — неединственность пары (P, Des) даже при фиксированной нормировке, что Джеффри интерпретировал как отражение реальной неопределённости разделения убеждений и желаний. Пропозициональная постановка получила развитие в двух ветвях: эвиденциальной теории решений (англ. evidential decision theory), где условная вероятность P(E | A) интерпретируется как представление о том, насколько действие A свидетельствует о наступлении E, и каузальной теории решений (англ. causal decision theory), сформулированной Г. Гиббардом и У. Харпером в статье «Counterfactuals and Two Kinds of Expected Utility» (в сборнике «Foundations and Applications of Decision Theory», 1978) и Д. Льюисом в статье «Causal Decision Theory» (Australasian Journal of Philosophy, 1981), где место условной вероятности занимает вероятность каузального контрфактуала. Современный систематический обзор постановки Джеффри — Болкера и её сопоставление с сэвиджевским каркасом — Р. Бредли, «Decision Theory with a Human Face» (Cambridge University Press, 2017).
Неосознаваемость
Более тонкий вид ограничения сэвиджевской рамки связан с неосознаваемостью (англ. unawareness) — ситуацией, в которой агент не учитывает в пространстве состояний S те события, которые он попросту не способен себе представить или сформулировать. Сэвиджевская аксиоматика молчаливо предполагает, что S задано полно и известно агенту; реальное же принятие решений часто происходит в условиях, когда релевантные «неизвестные неизвестные» отсутствуют в исходной модели. Э. Декель, Б. Липман и А. Рустичини в статье «Standard State-Space Models Preclude Unawareness» (Econometrica, 1998) формально доказали, что стандартные эпистемические модели, удовлетворяющие базовым свойствам оператора знания, исключают возможность неосознаваемости: если пространство состояний содержит все семантически релевантные различения, агент не может «не знать, что он не знает». Это отрицательный результат стимулировал появление аксиоматик с расширяемым пространством состояний — А. Хайфец, М. Майер и Б. Шиппер, «Interactive Unawareness» (Journal of Economic Theory, 2006); Б. Шиппер, «Awareness-Dependent Subjective Expected Utility» (International Journal of Game Theory, 2013) — в которых множество событий может расширяться по мере обнаружения агентом новых различений. Для нормативной интерпретации SEU этот анализ означает, что теорема представления Сэвиджа работает только как условная рациональность относительно фиксированного пространства состояний; вопрос о рациональности самого выбора пространства — открытый и выходит за рамки классической аксиоматики.
Эта граница хорошо согласуется с самоограничением, на которое указывал ещё Сэвидж в книге 1954 года. Сэвидж различал малые миры (англ. small worlds) — замкнутые описания ситуации выбора, в которых все релевантные состояния и исходы заданы заранее, — и большие миры (англ. grand worlds), охватывающие всё разнообразие возможных жизненных обстоятельств агента. Сам Сэвидж подчёркивал, что его теория задумана как нормативная модель именно для малых миров; попытку применить её к большому миру, он сам характеризовал как «нелепую» (англ. preposterous — The Foundations of Statistics, 1954, с. 16). В современной дискуссии эта самокритика Сэвиджа резюмируется, вслед за К. Биннмором, связкой характеристик «preposterous» и «utterly ridiculous», соединяющих несколько мест сэвиджевского обсуждения «малых миров» в единую формулу, — поскольку связанные с большим миром требования к полноте предпочтений и знанию пространства состояний становятся невыполнимыми. Это самоограничение — прямая концептуальная предвестница современной дискуссии о неосознаваемости и о пределах применимости классической аксиоматики: задача построения малого мира, адекватного конкретной ситуации, сама по себе не входит в формальную теорию Сэвиджа и относится к условиям её применения. Современное обсуждение различения малых и больших миров и его последствий для байесианства — К. Биннмор, «Rational Decisions» (Princeton University Press, 2009) и обзорная статья К. Биннмора «On the Foundations of Decision Theory» (Homo Oeconomicus, 2017).
Обобщения
Реакцией на парадоксы Алле и Эллсберга, а также на внутренние трудности SEU, стало широкое семейство обобщённых моделей, сохраняющих ту или иную часть сэвиджевской архитектуры, но ослабляющих ключевые аксиомы — прежде всего принцип уверенной вещи.
Обобщённый анализ без аксиомы независимости
Первое систематическое обобщение, сохраняющее аппарат ожидаемой полезности в локальной форме, предложил М. Мачина в статье «"Expected Utility" Analysis without the Independence Axiom» (Econometrica, 1982). Мачина заменил требование глобальной линейности функционала предпочтений по вероятностям на его локальную дифференцируемость по Фреше: функционал V: Δ(X) → ℝ предполагается гладким, так что в окрестности каждого распределения его можно аппроксимировать линейным функционалом, играющим роль локальной «функции ожидаемой полезности». Мачина показал, что стандартные экономические свойства — монотонность по первому порядку стохастического доминирования, глобальное избегание риска — накладывают жёсткие структурные ограничения на форму V в нелинейном случае; тем самым аппарат обеспечивает нелинейный анализ парадокса Алле, интерпретируя его как сдвиги локальной функции полезности в пределах треугольника вероятностей Маршака — Мачина (англ. Marschak — Machina triangle). Эта конструкция сохраняет преемственность с классическим сравнительным анализом риска по Пратту — Эрроу на локальном уровне и послужила отправной точкой для последующих аксиоматических обобщений, опирающихся на ослабление аксиомы независимости вплоть до её комонотонных версий.
Рангово-зависимая полезность
Дж. Квиггин в работе «A Theory of Anticipated Utility» (Journal of Economic Behavior & Organization, 1982) предложил рангово-зависимую полезность (англ. rank-dependent utility, RDU): функция преобразования вероятностей применяется не к отдельным исходам, а к накопленной вероятности «хвоста» распределения исходов, упорядоченного от худшего к лучшему. Эта конструкция согласована со стохастическим доминированием первого порядка (в отличие от сепарабельного взвешивания вероятностей) и объясняет парадокс Алле без отказа от транзитивности. М. Яари в статье «The Dual Theory of Choice under Risk» (Econometrica, 1987) предложил предельный случай RDU с линейной функцией полезности и всей нелинейностью, отнесённой к взвешиванию вероятностей; совместно с моделью Квиггина эта работа образует аксиоматическую основу рангово-зависимого подхода. Позднее А. Тверски и Д. Канеман в статье «Advances in Prospect Theory: Cumulative Representation of Uncertainty» (Journal of Risk and Uncertainty, 1992) перенесли рангово-зависимый аппарат на теорию перспектив, построив знак-зависимую и несимметричную версию для выигрышей и потерь.
Choquet expected utility
Д. Шмайдлер в статье «Subjective Probability and Expected Utility without Additivity» (Econometrica, 1989; первая версия — рабочий документ 1982 года) ввёл модель ожидаемой полезности по Шоке (англ. Choquet expected utility, CEU): субъективная вероятность заменяется ёмкостью (англ. capacity) — монотонной функцией множеств ν, не обязательно аддитивной, удовлетворяющей только ν(∅) = 0, ν(S) = 1 и монотонности (E ⊆ F ⇒ ν(E) ≤ ν(F)), а ожидаемая полезность вычисляется как интеграл Шоке ∫ u(f) dν. Модель допускает описание отвращения к неоднозначности через выпуклость ёмкости (англ. convex capacity), при которой интеграл Шоке совпадает с минимумом ожидаемых полезностей по набору совместимых с ν аддитивных вероятностей (результат восходит к теории игр Л. Шепли). CEU корректно воспроизводит наблюдаемые предпочтения в парадоксе Эллсберга и редуцируется к стандартной SEU при аддитивности ν. Обзорное изложение — Д. Кельси и Дж. Квиггин, «Theories of Choice under Ignorance and Uncertainty» (Journal of Economic Surveys, 1992).
Maxmin expected utility
И. Гилбоа и Д. Шмайдлер в статье «Maxmin Expected Utility with Non-Unique Prior» (Journal of Mathematical Economics, 1989) предложили модель с множественными априорными вероятностями (англ. multiple priors, MEU): агент обладает не единственной субъективной вероятностью, а замкнутым выпуклым множеством C вероятностных мер, и выбирает акт, максимизирующий минимум ожидаемой полезности по C:
- V(f) = minP ∈ C ∫S u(f(s)) dP(s).
Аксиоматически MEU получается из аксиом Анскомба — Аумана заменой аксиомы независимости на определённо-независимость (англ. certainty-independence) и добавлением аксиомы избегания неоднозначности (англ. uncertainty aversion), согласно которой смесь двух безразличных актов не хуже каждого из них в отдельности. Множество C имеет содержательную интерпретацию как диапазон вероятностей, совместимых с информацией агента, а операция минимума — как осторожный выбор «наихудшего случая». MEU является частным случаем CEU при выпуклой ёмкости и рассматривается как каноническая модель принятия решений при найтовской неопределённости.
Вариационные предпочтения
Ф. Маккерони, М. Мариначчи и А. Рустичини в статье «Ambiguity Aversion, Robustness, and the Variational Representation of Preferences» (Econometrica, 2006) обобщили MEU до класса вариационных предпочтений (англ. variational preferences) с представлением
- V(f) = minP ∈ Δ(S) [∫ u(f(s)) dP(s) + c(P)],
где c — функция «стоимости неоднозначности» на множестве вероятностей Δ(S). При c(P) = 0 для P ∈ C и c(P) = +∞ вне C модель сводится к MEU; при c(P) = θ · R(P ‖ Q), где R — относительная энтропия Кульбака — Лейблера, а Q — референсная вероятность, — к модели мультипликаторных предпочтений Л. Хансена и Т. Сарджента, разработанной в макроэкономической теории робастного управления. Вариационное представление обеспечивает единый формальный аппарат для широкого спектра моделей с неоднозначностью.
Smooth ambiguity model
П. Клибанофф, М. Мариначчи и С. Мукержи в статье «A Smooth Model of Decision Making under Ambiguity» (Econometrica, 2005) предложили модель гладкой неоднозначности (англ. smooth ambiguity model), разделяющую восприятие неоднозначности и отношение к ней. Агент обладает субъективной вероятностью μ над множеством Π вероятностных мер π на состояниях и возрастающей функцией φ, характеризующей его отношение к неоднозначности; значение акта задаётся формулой
- V(f) = ∫Π φ(∫S u(f(s)) dπ(s)) dμ(π).
При линейной φ модель сводится к стандартной SEU относительно усреднённой вероятности; при вогнутой φ описывает отвращение к неоднозначности. Преимущество модели перед MEU — гладкость кривых безразличия, допускающая применение стандартного дифференциального аппарата; MEU получается как предельный случай при бесконечно вогнутой φ. Интертемпоральное расширение модели дано в статье П. Клибаноффа, М. Мариначчи и С. Мукержи «Recursive Smooth Ambiguity Preferences» (Journal of Economic Theory, 2009).
Вероятностная софистицированность
М. Мачина и Д. Шмайдлер в статье «A More Robust Definition of Subjective Probability» (Econometrica, 1992) показали, что существование субъективной вероятности как самостоятельного поведенческого объекта не требует полного выполнения аксиом SEU: достаточно свойства вероятностной софистицированности (англ. probabilistic sophistication), согласно которому агент оценивает акты через порождаемые ими распределения исходов, даже если он не максимизирует ожидаемую полезность. Это открывает возможность сохранить субъективную вероятность в дескриптивных моделях с нарушением независимости — в частности, в моделях Алле-типа, где нарушение происходит на уровне агрегирования, а не на уровне вероятностной оценки событий.
Классическая SEU с модельной неопределённостью
С. Черрейя-Вьольо, Ф. Маккерони, М. Мариначчи и Л. Монтруккьо в статье «Classical Subjective Expected Utility» (Proceedings of the National Academy of Sciences, 2013) предложили двухуровневую версию SEU, формально объединяющую вальдовскую статистическую теорию решений со сэвиджевской. В их конструкции агент знает, что наблюдения порождаются процессом из объективно заданного класса статистических моделей M (в духе А. Вальда, «Statistical Decision Functions», 1950), но неопределён относительно конкретной модели из этого класса; его априорная субъективная вероятность μ над M отражает эту модельную неопределённость. Результирующее представление принимает вид двухэтапного субъективного ожидания:
- V(f) = ∫M [∫S u(f(s)) dm(s)] dμ(m)
где m ∈ M — отдельная статистическая модель. Модель редуцируется к классической SEU относительно усреднённой предсказательной вероятности, но сохраняет явное разделение между объективной информацией о структуре неопределённости (множество M) и субъективными убеждениями об этой структуре (мера μ). Конструкция обеспечивает формальный мост между SEU и статистической теорией Вальда, даёт аксиоматическое обоснование байесовскому усреднению моделей (Bayesian model averaging) в эконометрике и применяется в робастной оценке макроэкономических параметров в условиях спецификационной неопределённости.
Приложения
Теория субъективной ожидаемой полезности лежит в основании целого ряда прикладных направлений в экономике, статистике, теории игр и смежных дисциплинах.
Байесовская статистика и статистическая теория решений. Систематическое приложение SEU к статистическому выводу развёрнуто в монографиях Х. Раиффы и Р. Шлейфера «Applied Statistical Decision Theory» (1961), М. Де Грута «Optimal Statistical Decisions» (1970), Дж. Бергера «Statistical Decision Theory and Bayesian Analysis» (2-е изд., Springer, 1985). Оценка параметров, выбор гипотез, планирование экспериментов формулируются как задачи максимизации ожидаемой полезности относительно апостериорного распределения; априорное распределение интерпретируется как субъективная вероятность, формализованная сэвиджевской теоремой. В современной практике этот подход лежит в основе байесовских методов в эконометрике, биостатистике, машинном обучении и анализе политики.
Теория игр и эпистемические основания. Эпистемический анализ равновесия Нэша Р. Аумана и А. Бранденбургера («Epistemic Conditions for Nash Equilibrium», Econometrica, 1995) опирается на SEU как на базовое предположение о рациональности игрока: каждый игрок максимизирует субъективную ожидаемую полезность относительно своих убеждений о стратегиях оппонентов. Э. Калай и Э. Лерер в статье «Rational Learning Leads to Nash Equilibrium» (Econometrica, 1993) показали, что байесовские агенты, максимизирующие SEU, в бесконечно повторяющихся играх сходятся к равновесию Нэша повторяющейся игры; этот результат — одна из центральных теорем эпистемической теории игр. Систематическое изложение эпистемической теории игр — Э. Пакуит и О. Рой, «Epistemic Foundations of Game Theory», статья Стэнфордской философской энциклопедии.
Финансовая экономика. Модели ценообразования активов, теория портфеля, оценка производных инструментов в значительной мере строятся на допущениях SEU о предпочтениях инвесторов. Обобщения в сторону моделей с неоднозначностью (CEU, MEU, smooth ambiguity) активно применяются для объяснения эмпирических аномалий — загадки премии по акциям, загадки участия на фондовом рынке, поведения инвесторов в периоды кризисов. Р. Нау в рабочем документе «Extensions of the Subjective Expected Utility Model» (Duke University, 2007) и Х. Фёллмер и А. Шид в монографии «Stochastic Finance» (3-е изд., de Gruyter, 2011) систематически излагают применение этого аппарата в финансовой теории.
Медицинские и страховые приложения. Анализ решений о лечении, скрининге, вакцинации, страховании исходит из сопоставления ожидаемых полезностей при различных действиях с учётом субъективных вероятностей медицинских исходов. Метод анализа решений (англ. decision analysis) в клинической медицине, разработанный Х. Раиффой в монографии «Decision Analysis» (1968) и развитый в работах М. Вейнштейна и Х. Фейнберга «Clinical Decision Analysis» (Saunders, 1980), представляет собой прямое практическое приложение SEU. Аналогичные методы применяются в актуарной науке, страховой математике и оценке медицинских технологий.
Робастное управление и климатическая экономика. Приложение обобщений SEU к задачам экономической политики в условиях глубокой неопределённости составляет отдельное направление макроэкономической литературы. Л. Хансен и Т. Сарджент в монографии «Robustness» (Princeton University Press, 2008) развили аппарат робастного управления (англ. robust control), в котором планировщик политики моделируется как вариационно-предпочтительный агент, защищающийся от спецификационной ошибки модели через минимаксную оптимизацию относительно референсной вероятности и штрафа в форме относительной энтропии; этот подход соответствует предельному случаю модели мультипликаторных предпочтений Маккерони — Мариначчи — Рустичини. Для задач оценки социальной стоимости углерода и инвестиционных решений в климатической политике аппарат MEU и вариационных предпочтений позволяет формально учесть неопределённость параметров климатической чувствительности и функции экономического ущерба от потепления; обзор соответствующей программы — С. Черрейя-Вьольо, Л. Хансен, Ф. Маккерони, М. Мариначчи, «Making Decisions under Model Misspecification» (рабочий документ Института Бекера — Фридмана при Чикагском университете, 2021) и Н. Стерн, Дж. Стиглиц, Ч. Тейлор, «The Economics of Immense Risk, Urgent Action and Radical Change: Towards New Approaches to the Economics of Climate Change» (рабочий документ NBER № 28472, 2021; журнальная публикация — Journal of Economic Methodology, 2022).
Нейроэкономика неоднозначности. Аппарат SEU и её обобщений получил эмпирическую поддержку в нейровизуализационных исследованиях начала 2000-х годов. М. Хсу, М. Бхатт, Р. Адольфс, Д. Транел и К. Камерер в статье «Neural Systems Responding to Degrees of Uncertainty in Human Decision-Making» (Science, 2005) на данных функциональной магнитно-резонансной томографии показали, что решения в условиях объективного риска и в условиях неоднозначности опираются на анатомически различные нейронные сети: выбор между лотереями с известными вероятностями коррелирует с активностью дорсального стриатума (структуры, связанной с оценкой ожидаемой ценности), тогда как выбор при неоднозначности — с активностью миндалевидного тела и орбитофронтальной коры (структур, ассоциированных с оценкой ожидаемой ценности при дефиците информации и с эмоциональной обработкой). С. Хёттель, К. Стоу, И. Гордон, Б. Уорнер и М. Платт в статье «Neural Signatures of Economic Preferences for Risk and Ambiguity» (Neuron, 2006) подтвердили биологическое различие двух режимов обработки неопределённости и выявили корреляцию индивидуального отвращения к неоднозначности с активностью латеральной префронтальной коры. Эти результаты согласованы с двухуровневой структурой моделей типа smooth ambiguity, разделяющих оценку распределения вероятностей и отношение к неопределённости самого распределения, и поддерживают интерпретацию найтовского различения как имеющего биологическое основание.
Экспертные системы и искусственный интеллект. Современные архитектуры принятия решений в условиях неопределённости, используемые в робототехнике, медицинской диагностике, планировании действий, опираются на байесовские сети и марковские процессы принятия решений (англ. Markov decision processes, MDP) — математические структуры, реализующие принцип максимизации ожидаемой полезности в последовательной постановке. Оптимальная политика в MDP определяется уравнением Беллмана, которое выражает рекурсивную максимизацию ожидаемой дисконтированной полезности относительно модели переходов между состояниями; в байесовской интерпретации эти вероятности трактуются как субъективные априорные оценки агента, тогда как в стандартной формализации MDP transition function рассматривается как заданная характеристика среды. В обоих прочтениях MDP логически совместимы с сэвиджевской рамкой как операциональной реализацией принципа максимизации ожидаемой полезности в последовательной постановке, хотя формально опираются на собственную математическую конструкцию. Программная монография С. Рассела и П. Норвига «Artificial Intelligence: A Modern Approach» (4-е изд., Pearson, 2020) излагает этот подход как стандарт рационального принятия решений в ИИ; проблематика обучения с подкреплением в работах Р. Саттона и Э. Барто «Reinforcement Learning: An Introduction» (2-е изд., MIT Press, 2018) развивает ту же логику для последовательных задач, в которых вероятности переходов изначально неизвестны и выучиваются из опыта. Переход от статической сэвиджевской постановки к последовательной поднимает отдельную теоретическую проблему динамической согласованности предпочтений (англ. dynamic consistency) — требования, чтобы план действий, оптимальный в начальный момент, оставался оптимальным в каждый последующий момент условно на реализованной истории; для стандартной SEU с байесовским обновлением это требование выполнено автоматически и составляет одно из главных нормативных преимуществ модели, тогда как для большинства ambiguity-моделей (CEU, MEU, вариационные предпочтения) динамическая согласованность — содержательное ограничение, накладывающее жёсткие условия на правила обновления и структуру множества априорных мер.
Значение
Теория субъективной ожидаемой полезности занимает в теории принятия решений центральное место — как нормативный стандарт, от которого отсчитываются все последующие модели. Её систематическое развитие:
- объединило в единой аксиоматической системе поведенческое определение субъективной вероятности (линия Рэмси — де Финетти) и кардинальную полезность для объективных лотерей (линия фон Неймана — Моргенштерна), показав, что обе субъективные величины выводимы из одних и тех же наблюдаемых предпочтений;
- обеспечило нормативное обоснование байесовского подхода в статистике и теории решений, связав когерентность убеждений (аргумент голландской книги) с полной аксиоматизацией поведения;
- задало канонический формальный язык для описания выбора при неопределённости, в терминах которого формулируются как классические модели, так и их обобщения — рангово-зависимая полезность, теория перспектив, Choquet expected utility, maxmin expected utility, smooth ambiguity model;
- стимулировало развитие экспериментальной экономики и поведенческой теории решений за счёт предоставления строго определённого объекта эмпирической проверки — парадоксы Алле и Эллсберга, а также теория поддержки были бы невозможны без чёткой аксиоматизации, на фоне которой систематические отклонения стали наблюдаемыми;
- легло в основу байесовских методов в прикладных областях — от медицинской диагностики и актуарной науки до робастного управления в макроэкономической политике и современных систем искусственного интеллекта.
Вместе с тем статус SEU как дескриптивной модели последовательно подвергается сомнению со стороны поведенческой экономики и экспериментальной психологии, а её нормативный статус — со стороны эпистемологии решений. Эти вызовы не отменяют теорию, но встраивают её в более широкую программу: как предельную идеализацию, полезную для нормативного анализа, но требующую расширения или модификации в задачах с существенной неоднозначностью, ограниченной рациональностью или неполной информацией. В современной литературе принято различать нормативный статус SEU (как эталонной теории логически согласованного выбора) и её дескриптивный статус (как приближённой модели реального поведения): первый в целом сохраняется, второй требует привлечения обобщённых моделей — от рангово-зависимой полезности и теории перспектив до моделей с множественными априорными вероятностями. Ретроспективные обзоры полувековой истории SEU — статьи Э. Карни «Savage's Subjective Expected Utility Model» (The New Palgrave Dictionary of Economics, 2008), М. Абделлауи и П. Ваккера «Savage for Dummies and Experts» (Journal of Economic Theory, 2020), монография П. Ваккера «Prospect Theory: For Risk and Ambiguity» (Cambridge University Press, 2010); обзорная статья в Стэнфордской философской энциклопедии — К. Стил и Х. О. Стефанссон «Decision Theory» (первая редакция 2015, последняя — август 2025 года); монография И. Гилбоа «Theory of Decision under Uncertainty» (Cambridge University Press, 2009).
Литература
- Knight F. H. Risk, Uncertainty, and Profit. — Boston: Houghton Mifflin, 1921.
- Ramsey F. P. Truth and Probability // The Foundations of Mathematics and Other Logical Essays / Ed. by R. B. Braithwaite. — London: Kegan Paul, Trench, Trubner & Co., 1931. — P. 156—198.
- de Finetti B. Funzione caratteristica di un fenomeno aleatorio // Atti della R. Accademia Nazionale dei Lincei. Memorie. Classe di Scienze Fisiche, Matematiche e Naturali. Serie 6. — 1931. — Vol. 4. — P. 251—299.
- de Finetti B. La prévision: ses lois logiques, ses sources subjectives // Annales de l'Institut Henri Poincaré. — 1937. — Vol. 7, № 1. — P. 1—68.
- von Neumann J., Morgenstern O. Theory of Games and Economic Behavior. — Princeton: Princeton University Press, 1944 (2-е изд. 1947, 3-е изд. 1953).
- Wald A. Statistical Decision Functions. — New York: Wiley, 1950.
- Allais M. Le comportement de l'homme rationnel devant le risque: critique des postulats et axiomes de l'école américaine // Econometrica. — 1953. — Vol. 21, № 4. — P. 503—546.
- Savage L. J. The Foundations of Statistics. — New York: Wiley, 1954 (2-е изд. New York: Dover, 1972).
- Hewitt E., Savage L. J. Symmetric Measures on Cartesian Products // Transactions of the American Mathematical Society. — 1955. — Vol. 80, № 2. — P. 470—501.
- Ellsberg D. Risk, Ambiguity, and the Savage Axioms // Quarterly Journal of Economics. — 1961. — Vol. 75, № 4. — P. 643—669.
- Raiffa H., Schlaifer R. Applied Statistical Decision Theory. — Boston: Harvard Business School, 1961.
- Aumann R. J. Utility Theory without the Completeness Axiom // Econometrica. — 1962. — Vol. 30, № 3. — P. 445—462.
- Anscombe F. J., Aumann R. J. A Definition of Subjective Probability // Annals of Mathematical Statistics. — 1963. — Vol. 34, № 1. — P. 199—205.
- Pratt J. W. Risk Aversion in the Small and in the Large // Econometrica. — 1964. — Vol. 32, № 1/2. — P. 122—136.
- Jeffrey R. C. The Logic of Decision. — New York: McGraw-Hill, 1965 (2-е изд. Chicago: University of Chicago Press, 1983).
- Bolker E. D. Functions Resembling Quotients of Measures // Transactions of the American Mathematical Society. — 1966. — Vol. 124, № 2. — P. 292—312.
- Gibbard A., Harper W. L. Counterfactuals and Two Kinds of Expected Utility // Foundations and Applications of Decision Theory. Vol. I: Theoretical Foundations / Ed. by C. A. Hooker, J. J. Leach, E. F. McClennen. — Dordrecht: D. Reidel, 1978. — P. 125—162.
- Lewis D. Causal Decision Theory // Australasian Journal of Philosophy. — 1981. — Vol. 59, № 1. — P. 5—30.
- Good I. J. On the Principle of Total Evidence // British Journal for the Philosophy of Science. — 1967. — Vol. 17, № 4. — P. 319—321.
- Raiffa H. Decision Analysis: Introductory Lectures on Choices under Uncertainty. — Reading, MA: Addison-Wesley, 1968.
- DeGroot M. H. Optimal Statistical Decisions. — New York: McGraw-Hill, 1970.
- Fishburn P. C. Utility Theory for Decision Making. — New York: Wiley, 1970.
- Arrow K. J. Essays in the Theory of Risk-Bearing. — Chicago: Markham, 1971.
- Slovic P., Tversky A. Who Accepts Savage's Axiom? // Behavioral Science. — 1974. — Vol. 19, № 6. — P. 368—373.
- Kahneman D., Tversky A. Prospect Theory: An Analysis of Decision under Risk // Econometrica. — 1979. — Vol. 47, № 2. — P. 263—291.
- Weinstein M. C., Fineberg H. V. Clinical Decision Analysis. — Philadelphia: W. B. Saunders, 1980.
- Levi I. The Enterprise of Knowledge. — Cambridge, MA: MIT Press, 1980.
- Fishburn P. C. Subjective Expected Utility: A Review of Normative Theories // Theory and Decision. — 1981. — Vol. 13, № 2. — P. 139—199.
- Machina M. J. "Expected Utility" Analysis without the Independence Axiom // Econometrica. — 1982. — Vol. 50, № 2. — P. 277—323.
- Quiggin J. A Theory of Anticipated Utility // Journal of Economic Behavior & Organization. — 1982. — Vol. 3, № 4. — P. 323—343.
- Karni E., Schmeidler D., Vind K. On State-Dependent Preferences and Subjective Probabilities // Econometrica. — 1983. — Vol. 51, № 4. — P. 1021—1031.
- Berger J. O. Statistical Decision Theory and Bayesian Analysis. — 2-е изд. — New York: Springer, 1985.
- Karni E. Decision Making under Uncertainty: The Case of State-Dependent Preferences. — Cambridge, MA: Harvard University Press, 1985.
- Shafer G. Savage Revisited // Statistical Science. — 1986. — Vol. 1, № 4. — P. 463—485.
- Fishburn P. C. The Axioms of Subjective Probability // Statistical Science. — 1986. — Vol. 1, № 3. — P. 335—345.
- Yaari M. E. The Dual Theory of Choice under Risk // Econometrica. — 1987. — Vol. 55, № 1. — P. 95—115.
- Kreps D. M. Notes on the Theory of Choice. — Boulder, CO: Westview Press, 1988.
- Gilboa I., Schmeidler D. Maxmin Expected Utility with Non-Unique Prior // Journal of Mathematical Economics. — 1989. — Vol. 18, № 2. — P. 141—153.
- Schmeidler D. Subjective Probability and Expected Utility without Additivity // Econometrica. — 1989. — Vol. 57, № 3. — P. 571—587.
- Broome J. Weighing Goods: Equality, Uncertainty and Time. — Oxford: Blackwell, 1991.
- Karni E., Schmeidler D. Utility Theory with Uncertainty // Handbook of Mathematical Economics / Ed. by W. Hildenbrand, H. Sonnenschein. — Amsterdam: North-Holland, 1991. — Vol. IV. — P. 1763—1831.
- Camerer C., Weber M. Recent Developments in Modeling Preferences: Uncertainty and Ambiguity // Journal of Risk and Uncertainty. — 1992. — Vol. 5, № 4. — P. 325—370.
- Kelsey D., Quiggin J. Theories of Choice under Ignorance and Uncertainty // Journal of Economic Surveys. — 1992. — Vol. 6, № 2. — P. 133—153.
- Machina M. J., Schmeidler D. A More Robust Definition of Subjective Probability // Econometrica. — 1992. — Vol. 60, № 4. — P. 745—780.
- Tversky A., Kahneman D. Advances in Prospect Theory: Cumulative Representation of Uncertainty // Journal of Risk and Uncertainty. — 1992. — Vol. 5, № 4. — P. 297—323.
- Wakker P. P. Unbounded Utility for Savage's "Foundations of Statistics," and Other Models // Mathematics of Operations Research. — 1993. — Vol. 18, № 2. — P. 446—485.
- Kalai E., Lehrer E. Rational Learning Leads to Nash Equilibrium // Econometrica. — 1993. — Vol. 61, № 5. — P. 1019—1045.
- Tversky A., Koehler D. J. Support Theory: A Nonextensional Representation of Subjective Probability // Psychological Review. — 1994. — Vol. 101, № 4. — P. 547—567.
- Dekel E., Lipman B. L., Rustichini A. Standard State-Space Models Preclude Unawareness // Econometrica. — 1998. — Vol. 66, № 1. — P. 159—173.
- Heifetz A., Meier M., Schipper B. C. Interactive Unawareness // Journal of Economic Theory. — 2006. — Vol. 130, № 1. — P. 78—94.
- Schipper B. C. Awareness-Dependent Subjective Expected Utility // International Journal of Game Theory. — 2013. — Vol. 42, № 3. — P. 725—753.
- Aumann R. J., Brandenburger A. Epistemic Conditions for Nash Equilibrium // Econometrica. — 1995. — Vol. 63, № 5. — P. 1161—1180.
- Fox C. R., Tversky A. Ambiguity Aversion and Comparative Ignorance // Quarterly Journal of Economics. — 1995. — Vol. 110, № 3. — P. 585—603.
- Bewley T. F. Knightian Decision Theory: Part I // Decisions in Economics and Finance. — 2002. — Vol. 25, № 2. — P. 79—110 (оригинал в виде рабочего документа — 1986).
- Klibanoff P., Marinacci M., Mukerji S. A Smooth Model of Decision Making under Ambiguity // Econometrica. — 2005. — Vol. 73, № 6. — P. 1849—1892.
- Fox C. R., Clemen R. T. Subjective Probability Assessment in Decision Analysis: Partition Dependence and Bias Toward the Ignorance Prior // Management Science. — 2005. — Vol. 51, № 9. — P. 1417—1432.
- Hsu M., Bhatt M., Adolphs R., Tranel D., Camerer C. F. Neural Systems Responding to Degrees of Uncertainty in Human Decision-Making // Science. — 2005. — Vol. 310, № 5754. — P. 1680—1683.
- Huettel S. A., Stowe C. J., Gordon E. M., Warner B. T., Platt M. L. Neural Signatures of Economic Preferences for Risk and Ambiguity // Neuron. — 2006. — Vol. 49, № 5. — P. 765—775.
- Maccheroni F., Marinacci M., Rustichini A. Ambiguity Aversion, Robustness, and the Variational Representation of Preferences // Econometrica. — 2006. — Vol. 74, № 6. — P. 1447—1498.
- Nau R. F. Extensions of the Subjective Expected Utility Model. — Working Paper, Fuqua School of Business, Duke University, 2007.
- Hansen L. P., Sargent T. J. Robustness. — Princeton: Princeton University Press, 2008.
- Karni E. Savage's Subjective Expected Utility Model // The New Palgrave Dictionary of Economics / Ed. by S. N. Durlauf, L. E. Blume. — 2-е изд. — Basingstoke: Palgrave Macmillan, 2008.
- Gilboa I. Theory of Decision under Uncertainty. — Cambridge: Cambridge University Press, 2009.
- Binmore K. Rational Decisions. — Princeton: Princeton University Press, 2009.
- Klibanoff P., Marinacci M., Mukerji S. Recursive Smooth Ambiguity Preferences // Journal of Economic Theory. — 2009. — Vol. 144, № 3. — P. 930—976.
- Wakker P. P. Prospect Theory: For Risk and Ambiguity. — Cambridge: Cambridge University Press, 2010.
- Föllmer H., Schied A. Stochastic Finance: An Introduction in Discrete Time. — 3-е изд. — Berlin: de Gruyter, 2011.
- Vineberg S. Dutch Book Arguments // The Stanford Encyclopedia of Philosophy / Ed. by E. N. Zalta. — Stanford: Metaphysics Research Lab, Stanford University, 2022.
- Pacuit E., Roy O. Epistemic Foundations of Game Theory // The Stanford Encyclopedia of Philosophy / Ed. by E. N. Zalta. — Stanford: Metaphysics Research Lab, Stanford University, 2017 (первая редакция 2015).
- Cerreia-Vioglio S., Maccheroni F., Marinacci M., Montrucchio L. Classical Subjective Expected Utility // Proceedings of the National Academy of Sciences. — 2013. — Vol. 110, № 17. — P. 6754—6759.
- Machina M. J., Siniscalchi M. Ambiguity and Ambiguity Aversion // Handbook of the Economics of Risk and Uncertainty / Ed. by M. Machina, W. K. Viscusi. — Amsterdam: North-Holland, 2014. — Vol. 1. — P. 729—807.
- Karni E., Schmeidler D. An Expected Utility Theory for State-Dependent Preferences // Theory and Decision. — 2016. — Vol. 81, № 4. — P. 467—478.
- Bradley R. Decision Theory with a Human Face. — Cambridge: Cambridge University Press, 2017.
- Binmore K. On the Foundations of Decision Theory // Homo Oeconomicus. — 2017. — Vol. 34, № 3. — P. 259—273.
- Sutton R. S., Barto A. G. Reinforcement Learning: An Introduction. — 2-е изд. — Cambridge, MA: MIT Press, 2018.
- Baccelli J. Moral Hazard, the Savage Framework, and State-Dependent Utility // Erkenntnis. — 2021. — Vol. 86, № 2. — P. 367—387.
- Abdellaoui M., Wakker P. P. Savage for Dummies and Experts // Journal of Economic Theory. — 2020. — Vol. 186. — Art. 104991.
- Hartmann L. Savage's P3 Is Redundant // Econometrica. — 2020. — Vol. 88, № 1. — P. 203—205.
- Frahm G., Hartmann L. Erratum to "Savage's P3 is Redundant" // Econometrica. — 2023. — Vol. 91, № 3. — P. O33.
- Frahm G., Hartmann L. Some Notes on Savage's Representation Theorem // Theory and Decision. — 2025. — Vol. 98, № 1. — P. 85—93 (online-first 16 августа 2024).
- Russell S., Norvig P. Artificial Intelligence: A Modern Approach. — 4-е изд. — Hoboken: Pearson, 2020.
- Cerreia-Vioglio S., Hansen L. P., Maccheroni F., Marinacci M. Making Decisions under Model Misspecification. — Becker Friedman Institute Working Paper, University of Chicago, 2021.
- Stern N., Stiglitz J., Taylor C. The Economics of Immense Risk, Urgent Action and Radical Change: Towards New Approaches to the Economics of Climate Change. — NBER Working Paper № 28472, 2021 (журнальная версия — Journal of Economic Methodology. — 2022. — Vol. 29, № 3. — P. 181—216).
- Baccelli J., Hartmann L. The Sure-Thing Principle // Journal of Mathematical Economics. — 2023. — Vol. 109. — Art. 102915.
- Harju M., Liesiö J., Virtanen K. Independent Postulates for Subjective Expected Utility // Theory and Decision. — 2024. — Vol. 96, № 4. — P. 597—606.
- Moscati I. Ellsberg 1961: Text, Context, Influence // Decisions in Economics and Finance. — 2024. — Vol. 47, № 2. — P. 627—653.
- Al Kaffaf Z. Savage, de Finetti, and the Making of The Foundations of Statistics, 1949—1954 // The European Journal of the History of Economic Thought. — 2025. — DOI: 10.1080/09672567.2025.2546806.
- Steele K., Stefánsson H. O. Decision Theory // The Stanford Encyclopedia of Philosophy / Ed. by E. N. Zalta, U. Nodelman. — Stanford: Metaphysics Research Lab, Stanford University, редакция от 20 августа 2025 года.