Criterio de arrepentimiento minimax (criterio de Savage)
El Criterio de Savage (también conocido como criterio del mínimo arrepentimiento o minimax regret) es uno de los métodos para la toma de decisiones en condiciones de incertidumbre. Se aplica en situaciones donde las probabilidades de los diferentes resultados son desconocidas, y el objetivo es minimizar las pérdidas potenciales resultantes de tomar una decisión subóptima.
Características generales
En condiciones de incertidumbre, las consecuencias de elegir cada estrategia no están definidas con precisión. Para evaluar las posibles alternativas se utilizan varios criterios, como los criterios de Wald, Hurwicz, Laplace y Savage. El criterio de Savage no se centra en lograr el máximo beneficio, sino en la minimización del máximo arrepentimiento (pérdidas en comparación con el mejor resultado posible).
El arrepentimiento es una medida que refleja el beneficio perdido por no haber elegido la estrategia óptima para un resultado específico.
Algoritmo de aplicación del criterio de Savage
- Construcción de la matriz de pagos: Se construye una tabla donde las filas corresponden a las posibles estrategias y las columnas a los posibles resultados de los eventos. En la intersección se anota el resultado esperado para una estrategia y un resultado concretos.
- Construcción de la matriz de arrepentimiento (matriz de riesgos): Para cada resultado (columna), se determina el valor máximo de ganancia. Luego, para cada celda, se calcula la magnitud del arrepentimiento:
- Determinación de los arrepentimientos máximos para cada estrategia: En cada fila de la matriz de arrepentimiento, se selecciona el valor máximo (el peor caso para esa estrategia).
- Selección de la estrategia óptima: Se elige la estrategia para la cual el arrepentimiento máximo es mínimo.
Así, el criterio de Savage implementa el principio de minimizar la pérdida potencial de una decisión incorrecta.
Formulación matemática
Sean:
- — el conjunto de estrategias disponibles (alternativas).
- — el conjunto de posibles estados de la naturaleza.
- — la función de ganancia (utilidad) al elegir la estrategia y ocurrir el estado . A menudo se representa mediante una matriz de pagos , donde .
El criterio de Savage se basa en el concepto de arrepentimiento (regret en inglés) o costo de oportunidad. El arrepentimiento para la estrategia bajo el estado de la naturaleza se define como la diferencia entre la máxima ganancia posible que podría haberse obtenido bajo ese estado (si se hubiera elegido la mejor estrategia para ese estado) y la ganancia real de la estrategia .
Algoritmo de aplicación del criterio de Savage:
- Cálculo de la matriz de arrepentimiento (riesgos):
- a) Encontrar la ganancia máxima para cada estado de la naturaleza (cada columna de la matriz de pagos):
- Este es el mejor resultado posible si ocurre el estado .
- b) Calcular los elementos de la matriz de arrepentimiento :**
- El elemento muestra cuánto menor es la ganancia de la estrategia en comparación con la máxima posible bajo el estado . Todos los elementos .
- Encontrar el arrepentimiento máximo para cada estrategia: Para cada estrategia (cada fila de la matriz de arrepentimiento ), se determina su peor resultado posible desde el punto de vista del arrepentimiento:
- Seleccionar la estrategia con el mínimo arrepentimiento máximo (principio del arrepentimiento minimax): Se elige la estrategia que minimiza el arrepentimiento máximo encontrado:
- O, sustituyendo la expresión para :
El valor mínimo del arrepentimiento máximo, alcanzado mediante el criterio de Savage, es:
Por lo tanto, el criterio de Savage está orientado a seleccionar una estrategia que garantice las menores pérdidas en relación con la mejor acción posible para cada estado de la naturaleza.
Puntos clave en la formulación matemática:
- Definición del arrepentimiento : Este es el concepto central. Es importante mostrar que se calcula como la diferencia entre el mejor resultado en la columna j y el resultado actual a_{ij}.
- Matriz de arrepentimiento : Se indica explícitamente cómo se construye.
- Cálculo de : Se muestra la búsqueda del máximo en cada fila de la matriz de arrepentimiento.
- Principio minimax: La elección de la estrategia se formula claramente a través de del de los arrepentimientos.
- Notación utilizada: Estándar para la teoría de juegos y la toma de decisiones (S, Θ, u, a_ij, r_ij, max, min, arg min).
Ventajas y desventajas
Ventajas:
- Orientado a la minimización de riesgos.
- Especialmente eficaz en condiciones de alta incertidumbre.
Desventajas:
- Ignora el beneficio esperado, centrándose únicamente en las pérdidas potenciales.
- Puede conducir a decisiones excesivamente conservadoras.
Criterios de toma de decisiones
- Criterio de Hurwicz
- Criterio de Laplace
- Criterio de Wald