Выбор

Материал из Systems analysis wiki
Перейти к навигации Перейти к поиску

Вы́бор в теории принятия решений (ТПР) — процедура выделения одной альтернативы или подмножества альтернатив из множества допустимых вариантов на основе отношения предпочтения, критерия или правила выбора. В простейшем случае результат выбора — одна альтернатива; в общем случае — несколько альтернатив, неразличимых по принятому способу сравнения.

Выбор — центральный момент принятия решения, но не тождественен ему. Принятие решения охватывает постановку задачи, формирование множества альтернатив, оценку последствий, сравнение вариантов и собственно выбор. В нормативных моделях ТПР выбор рассматривается как рационально обосновываемая процедура, опирающаяся на систему аксиом; дескриптивные модели изучают фактические особенности реального выбора с учётом когнитивных ограничений и эмоций.

Решение и выбор

Термины «решение» (англ. decision) и «выбор» (англ. choice) в ТПР концептуально различаются.

Решение — понятие более широкое и охватывает:

  • процесс преодоления проблемы — выявление, сбор информации, формирование альтернатив, оценку и собственно выбор;
  • результат этого процесса — выбранную альтернативу, правило или план действий;
  • нормативный или управленческий акт, фиксирующий принятую альтернативу в организационной, правовой или управленческой форме (приказ, постановление, алгоритм).

Множество альтернатив само по себе решением не является — оно образует исходное пространство выбора в задаче принятия решений.

Собственно выбор — кульминационная фаза принятия решения: операция сужения множества допустимых альтернатив до искомого результата с учётом системы предпочтений субъекта, факторов среды и ограничений.

Субъект выбора

Центральный субъект ТПР — лицо принимающее решение (ЛПР, англ. decision maker). ЛПР может быть индивидуальным (руководитель, эксперт) или коллективным (совет директоров, комитет, жюри). Наряду с ЛПР в школе О. И. Ларичева выделяют владельца проблемы — субъекта, несущего ответственность за её решение; роли ЛПР и владельца проблемы могут принадлежать разным людям.

В задачах, где решения принимает несколько лиц, говорят о группе, принимающей решение (ГПР), — такой выбор требует процедур агрегирования индивидуальных предпочтений (см. раздел «Коллективный выбор»).

Формализация выбора

В формальной постановке задача выбора задаётся следующими элементами:

  • множеством альтернатив A — возможных вариантов действия;
  • множеством допустимых альтернатив XA — вариантов, удовлетворяющих ограничениям (допустимость и выбор — разные уровни: выбор производится из уже допустимого множества);
  • множеством состояний среды — если результат зависит не только от выбора, но и от внешних условий;
  • множеством исходов — последствий реализации альтернатив;
  • отношением предпочтения, функцией полезности или критерием выбора — способом сравнения альтернатив.

Выбор формально описывается как функция выбора C, определённая на непустых подмножествах множества альтернатив: каждому непустому XA она сопоставляет непустое подмножество C(X) ⊆ X выбранных вариантов. К классическим условиям согласованности выбора относятся:

  • α-условие Сена (условие наследования, contraction consistency): если альтернатива выбрана из широкого множества и принадлежит его подмножеству, она должна быть выбрана и из этого подмножества;
  • β-условие Сена (условие расширения, expansion consistency): если две альтернативы одновременно выбраны в некотором подмножестве, то в любом надмножестве, содержащем их обе, они либо обе выбраны, либо обе отвергнуты.

При условии, что домен функции выбора включает все конечные подмножества множества альтернатив, совместное выполнение α и β эквивалентно её рационализуемости полным и транзитивным отношением предпочтения (слабым порядком); на конечных универсальных множествах этому отвечает слабая аксиома выявленных предпочтений (WARP П. Самуэльсона). В русскоязычной литературе теория выбора на основе функций выбора и бинарных отношений разработана школой М. А. Айзермана и Ф. Т. Алескерова.

Альтернативно выбор задаётся бинарным отношением предпочтения на A. На конечном множестве альтернатив полное и транзитивное отношение допускает порядковое представление функцией полезности u : A → ℝ, такой что u(a) ≥ u(b) тогда и только тогда, когда a не менее предпочтительна, чем b. На счётно-бесконечных множествах представимость также сохраняется (по теореме Кантора о вложении счётных линейных порядков в ℚ). В несчётных (континуальных) пространствах представимость требует дополнительных структурных условий — в частности, существования счётного порядково-плотного подмножества (теорема Биркгофа — Милграма); для представимости непрерывной функцией полезности дополнительно необходима непрерывность самого отношения предпочтения (теорема Дебрё). Классический контрпример — лексикографические предпочтения на ℝ²: они полны и транзитивны, но не допускают никакого счётного порядково-плотного подмножества и потому не представимы никакой вещественнозначной (скалярной) функцией полезности.

При наличии числового критерия выбор часто сводится к оптимизации — максимизации или минимизации целевой функции. Однако не всякий выбор исчерпывается оптимизацией: в ряде задач применяются отношения предпочтения, правила доминирования, процедуры последовательного отсечения альтернатив, принцип удовлетворительности.

Условия выбора

Характер задачи выбора и применимые методы определяются информационными условиями среды. Разграничение риска и неопределённости восходит к работам Фрэнка Найта (1921): риск предполагает объективные или обоснованно оцениваемые вероятности, тогда как неопределённость в узком найтовском смысле характеризуется принципиальной невозможностью их оценить. В современной ТПР выделяют следующие классы условий:

  • Определённость (детерминированность) — каждой альтернативе соответствует однозначный исход; случайность и вариативность в реакциях среды отсутствуют. Задача нередко формализуется как задача оптимизации или математического программирования.
  • Условия риска — каждой альтернативе соответствует несколько возможных исходов с известными или обоснованно оцениваемыми вероятностями.
  • Неопределённость (в найтовском смысле) — объективных вероятностей нет, а достаточных данных для их обоснованной оценки также не существует. В более широком словоупотреблении термином «неопределённость» охватывают и ситуации частичного знания о вероятностях, а крайний случай — полное отсутствие вероятностной информации — отдельно обозначают как неведение (ignorance). Если же ЛПР формирует субъективные вероятности (экспертно или на основе принципов Сэвиджа — де Финетти), задача переходит в рамки байесовского подхода и формально сводится к риску.
  • Условия конфликта — результат выбора зависит от действий других рациональных субъектов, преследующих собственные цели; такие задачи изучает теория игр (классификация условий по Р. Льюсу и Х. Райфе).

Отдельно выделяют выбор в нечёткой среде, где критерии, предпочтения или ограничения заданы лингвистическими переменными с размытыми границами; такие задачи анализируются средствами теории нечётких множеств Л. Заде (1965) и её приложения к принятию решений (Р. Беллман, Л. Заде, 1970).

Выбор в условиях риска

Классический нормативный аппарат — теория ожидаемой полезности (фон Нейман, Моргенштерн, 1944) — применяется к выбору между лотереями (альтернативами с заданными вероятностями исходов). Рациональный субъект выбирает лотерею с максимальным математическим ожиданием полезности:

U(a) = Σi pi · u(xi),

где pi — вероятность исхода xi, u — функция полезности. Аппарат опирается на аксиомы полноты, транзитивности, непрерывности и независимости. Для случая субъективных вероятностей аналогичную нормативную схему (теорию субъективной ожидаемой полезности) построил Л. Сэвидж (1954).

Эмпирические исследования (парадокс Алле, 1953; парадокс Эллсберга, 1961) показали, что реальное поведение систематически отклоняется от предсказаний нормативной теории. Это привело к развитию дескриптивных моделей — прежде всего, теории перспектив Канемана и Тверски (1979), учитывающей эффект точки отсчёта, избегание потерь и искажённое восприятие вероятностей. Параллельно развивался аппарат ранговой зависимой полезности (Дж. Куиггин, 1982), в котором вероятности исходов искажаются в зависимости от их ранга. Синтез этих подходов — кумулятивная теория перспектив (Тверски, Канеман, 1992) — устраняет недостатки оригинальной версии 1979 года и распространяет модель на случай субъективных вероятностей.

Выбор в условиях неопределённости

При отсутствии информации о вероятностях применяются критерии, отражающие отношение ЛПР к неблагоприятным исходам:

  • критерий Вальда (максимин) — пессимистический: выбирается альтернатива с наилучшим из худших исходов;
  • критерий Сэвиджа (минимакс сожаления) — минимизация максимально возможного сожаления (упущенной выгоды);
  • критерий Гурвица — компромисс между оптимизмом и пессимизмом, задаваемый коэффициентом α ∈ [0, 1];
  • критерий Лапласа — исходам приписываются равные вероятности (принцип недостаточного основания).

Классификация задач выбора

Задачи выбора классифицируются по нескольким независимым измерениям.

По размерности оценки: скалярный (однокритериальный) — оценка ведётся по единственному показателю; многокритериальный — по вектору несовпадающих и часто противоречивых критериев.

По повторяемости: однократный — выбор совершается единожды; повторяющийся — аналогичные решения принимаются многократно, и значима устойчивость процедуры в целом.

По структуре задачи: статический (одношаговый) — задача решается в один момент; динамический (многошаговый, последовательный) — выбор на каждом этапе влияет на последующие возможности и результаты; анализируется с помощью деревьев решений и динамического программирования.

По характеру правил сравнения: компенсаторные — снижение оценки по одному критерию может быть скомпенсировано ростом по другому (например, взвешенная сумма); некомпенсаторные — компенсация не допускается (лексикографическое упорядочивание, правила отсечения по порогу).

По форме оценок: количественные и качественные.

Многокритериальный выбор

Когда альтернативы оцениваются по нескольким несопоставимым критериям, возникает задача многокритериального выбора. Её ключевое понятие — Парето-оптимальность: альтернатива a доминируется альтернативой b, если b не хуже a ни по одному критерию и строго лучше хотя бы по одному. Множество недоминируемых альтернатив в пространстве выбора образует множество Парето; его отображение в пространстве критериальных оценок называется фронтом Парето.

Внутри множества Парето применяются:

  • лексикографическое упорядочивание — критерии ранжируются по важности, сравнение ведётся последовательно;
  • свёртки критериев — построение интегрального показателя (взвешенная сумма, произведение, минимаксная свёртка);
  • теория многокритериальной полезности (MAUT/MAVT, Р. Кини и Х. Райфа) — построение многомерной функции полезности с учётом отношения ЛПР к риску и взаимодействия критериев;
  • метод анализа иерархий (AHP, Т. Саати) — попарные сравнения на иерархии критериев;
  • методы семейства ELECTRE и PROMETHEE — учёт порогов предпочтения и безразличия;
  • TOPSIS — выбор альтернативы, наиболее близкой к идеальной и дальней от антиидеальной.

Нормативный, дескриптивный и прескриптивный подходы

В ТПР принято различать три подхода к изучению выбора:

  • нормативный — описывает, каким должен быть выбор идеально рационального субъекта (теория ожидаемой полезности, аксиоматика предпочтений);
  • дескриптивный — каким выбор бывает в действительности, с учётом когнитивных ограничений, эмоций и эвристик (теория перспектив, исследования эвристик); сюда же относятся модели стохастического выбора (аксиома Льюса, модели случайной полезности Д. Макфаддена), описывающие выбор как вероятностный процесс;
  • прескриптивный — как помочь реальному ЛПР приблизить свой выбор к нормативному идеалу (методы поддержки принятия решений, регламенты, экспертные процедуры).

Рациональный и оптимальный выбор

Рациональный выбор — выбор, согласованный с системой предпочтений ЛПР и осуществляемый по непротиворечивому правилу. В нормативных моделях рациональность связывается с аксиомами полноты и транзитивности предпочтений: если a лучше b, а b лучше c, то a лучше c.

Оптимальный выбор — альтернатива, признаваемая наилучшей относительно заданного критерия, модели и ограничений.

Тем самым рациональность характеризует внутреннюю согласованность выбора, а оптимальность — его наилучшее значение в рамках принятой формализации. Не всякий рациональный выбор оптимален вне модели, и не всякая формально оптимальная альтернатива остаётся рациональной при изменении предпочтений, информации или ограничений.

Ограниченная рациональность

На практике выбор часто совершается в условиях:

  • неполной, противоречивой или недостоверной информации;
  • высокой стоимости ошибки и стоимости поиска информации;
  • дефицита времени и ресурсов;
  • ограниченных когнитивных возможностей человека.

Концепция ограниченной рациональности (bounded rationality) Герберта Саймона показывает: реальный субъект, как правило, не ищет глобальный оптимум, а прибегает к принципу удовлетворительности (satisficing) — принимает первую альтернативу, преодолевающую заранее заданный уровень притязаний, и прекращает поиск. В канонической схеме Саймона (1960) выделяются три фазы принятия решения: исследование проблемы (intelligence), проектирование (design) и выбор (choice); в более поздней литературе по СППР к ним нередко добавляют стадию реализации (implementation). Собственно операция выбора занимает лишь одну из фаз.

Наряду с удовлетворительным выбором используются эвристики — упрощённые правила принятия решений, снижающие когнитивные издержки. В одних случаях они приводят к систематическим искажениям (Канеман, Тверски); в других — обеспечивают достаточно точный выбор при малом объёме информации (программа fast-and-frugal heuristics Г. Гигеренцера).

Для компенсации ограничений рациональности применяются системы поддержки принятия решений (СППР), методы экспресс-анализа и экспертные процедуры.

Коллективный выбор

Когда решения принимает ГПР — коллегиальный орган, комитет, совет, избиратели — возникает задача агрегирования индивидуальных предпочтений в коллективное решение. Применяются процедуры голосования (простое большинство, правило Кондорсе, правило Борда, рейтинговые процедуры), методы согласования, механизмы ранжирования.

Коллективный выбор подвержен фундаментальным математическим ограничениям:

  • парадокс Кондорсе (1785) — даже при транзитивных предпочтениях каждого участника коллективное предпочтение, полученное по правилу большинства, может оказаться циклическим: A побеждает B, BC, CA;
  • теорема Эрроу о невозможности (1951) — при трёх и более альтернативах не существует процедуры агрегирования индивидуальных порядков в полное и транзитивное коллективное предпочтение (требование social ordering), одновременно удовлетворяющей универсальности области определения, единогласию (Парето), независимости от посторонних альтернатив и отсутствию диктатора;
  • теорема Гиббарда — Саттертуэйта (Гиббард, 1973; Саттертуэйт, 1975) — при трёх и более альтернативах любая нетривиальная (onto) детерминированная недиктаторская процедура голосования допускает стратегическое манипулирование. При двух альтернативах вопрос манипулирования тривиален, а правило простого большинства — единственная (среди решающих процедур выбора между двумя альтернативами) процедура, удовлетворяющая аксиомам анонимности, нейтральности и положительной реакции (теорема Мэя, 1952);
  • парадокс паретианского либерала (А. Сен, 1970) — несовместимость единогласия (Парето) и минимального либерализма, требующего, чтобы хотя бы двое участников имели решающий голос каждый как минимум по одной паре альтернатив, касающейся его личной сферы.

Поэтому любая процедура коллективного выбора — компромисс между желаемыми свойствами, требующий защиты от манипуляций.

Связанные дисциплины и направления

  • Теория полезности — оценка альтернатив через функции предпочтений; ординалистский и кардиналистский подходы;
  • Теория ожидаемой полезности — нормативная модель выбора при риске;
  • Теория игр — выбор стратегий в условиях взаимодействия интересов;
  • Анализ решений — оценка решений с учётом рисков и неопределённости;
  • Теория нечётких множеств — моделирование расплывчатых ограничений, критериев и целей;
  • Методы поддержки принятия решений — алгоритмизация и автоматизация выбора;
  • Управление рисками — выбор с учётом оценки и управления рисками;
  • Поведенческая экономика — дескриптивные модели реального выбора;
  • Когнитивные искажения — влияние эвристик и систематических ошибок на выбор.

Литература

  • Knight F. H. Risk, Uncertainty and Profit. — Boston: Houghton Mifflin, 1921.
  • Neumann J. von, Morgenstern O. Theory of Games and Economic Behavior. — Princeton: Princeton University Press, 1944.
  • Arrow K. J. Social Choice and Individual Values. — New York: Wiley, 1951 (2nd ed., 1963).
  • Savage L. J. The Foundations of Statistics. — New York: Wiley, 1954.
  • Luce R. D., Raiffa H. Games and Decisions: Introduction and Critical Survey. — New York: Wiley, 1957.
  • Simon H. A. The New Science of Management Decision. — New York: Harper & Row, 1960.
  • Sen A. K. The Impossibility of a Paretian Liberal // Journal of Political Economy. — 1970. — Vol. 78, № 1. — P. 152–157.
  • Keeney R. L., Raiffa H. Decisions with Multiple Objectives: Preferences and Value Tradeoffs. — New York: Wiley, 1976.
  • Kahneman D., Tversky A. Prospect Theory: An Analysis of Decision under Risk // Econometrica. — 1979. — Vol. 47, № 2. — P. 263–291.
  • Quiggin J. A Theory of Anticipated Utility // Journal of Economic Behavior & Organization. — 1982. — Vol. 3, № 4. — P. 323–343.
  • Tversky A., Kahneman D. Advances in Prospect Theory: Cumulative Representation of Uncertainty // Journal of Risk and Uncertainty. — 1992. — Vol. 5, № 4. — P. 297–323.
  • Айзерман М. А., Алескеров Ф. Т. Выбор вариантов: основы теории. — М.: Наука, 1990.
  • Ларичев О. И. Теория и методы принятия решений. — М.: Логос, 2000.

См. также