Maximin criterion (Wald criterion) — 瓦尔德准则

From Systems analysis wiki
Jump to navigation Jump to search

瓦尔德准则(Wald's criterion)是在不确定性条件下做出决策的主要方法之一。它基于极端悲观原则,旨在选择在最坏可能情况下能确保最佳结果的策略。

准则的本质

该准则假定决策者关注每种策略最不利的结果。对于每个备选方案,确定其最坏的可能结果。在所有策略中,选择那个“最坏结果”是所有策略中最优的策略。

换句话说,瓦尔德准则旨在最小化最大损失,并为不利条件提供最大程度的保障。

准则的应用

应用过程包括以下步骤:

  1. 确定每种策略的最坏可能结果。
  2. 比较所有策略的最坏结果。
  3. 选择具有“最坏结果中的最优值”的策略。

这种方法适用于极度谨慎、力求最小化风险的决策者,而不考虑各种结果发生的概率。

数学公式

设给定:

  • S={s1,s2,,sm} — 决策者可选择的策略(备选方案)集合。
  • Θ={θ1,θ2,,θn} — 独立于决策者选择的自然状态(外部条件、情景)集合。
  • u(si,θj) — 收益(效用)函数,表示在选择策略 siS 且自然状态为 θjΘ 时的结果数值评估。通常表示为支付矩阵 A=[aij],其中 aij=u(si,θj)

瓦尔德准则(或称为“最大最小准则”)规定了以下操作顺序:

  1. 为每种策略寻找最小收益: 对于每种策略 si,确定其在所有可能的自然状态下的最坏可能结果(最小收益):
    uimin=minj=1,,nu(si,θj)=minθΘu(si,θ)
  1. 选择具有最大最小收益的策略: 选择能确保在已找到的最小收益中取得最大值的策略 sWald*
    sWald*=argmaxi=1,,m(uimin)=argmaxsiS(minθjΘu(si,θj))

使用瓦尔德准则时,保证(最小)的收益水平等于: VWald=maxi=1,,m(uimin)=maxsiS(minθjΘu(si,θj))

因此,瓦尔德准则实现了最大最小化(maximin)原则——即最大化最小收益。它基于一种悲观的观点,即假设无论做出何种决策,自然界都将以对决策者最不利的方式回应。

关于损失函数的说明

如果使用需要最小化的损失函数 L(si,θj) 来代替收益函数 u(si,θj),那么瓦尔德准则就转变为最小最大化损失(minimax loss)准则:

  1. 对于每种策略 si,找到其最大损失值:Limax=maxθΘL(si,θ)
  2. 选择能使这些最大损失最小化的策略:sWald*=argminsiS(maxθΘL(si,θ))


优点与缺点

优点:

  • 方法简单明了。
  • 在完全不确定的条件下,能确保决策的高度安全性。

缺点:

  • 过度悲观:为了最小化损失而忽略了可能的高收益。
  • 可能导致选择过于保守的策略。

Category:Decision analysis Category:Decision making