Función de utilidad
Función matemática que asigna un número a cada estado del mundo según cuánto se prefiere. Un agente racional, en teoría de la decisión, elige la acción cuya utilidad esperada (la utilidad de cada resultado posible ponderada por su probabilidad) es máxima. Von Neumann y Morgenstern (1944) demostraron que cualquier sistema de preferencias coherente puede representarse así. La idea atraviesa la economía, la teoría de juegos, el aprendizaje por refuerzo y el alineamiento de inteligencia artificial.
En IA el término aparece sobre todo en dos contextos. Primero, en sistemas que aprenden por recompensa: el diseñador especifica qué se premia y el agente aprende a maximizarlo. Segundo, en seguridad de IA: una de las preocupaciones centrales es que un sistema suficientemente capaz, optimizando una función de utilidad mal especificada, alcance la meta declarada y destruya lo que no se supo especificar. Es el problema clásico del “rey Midas” o del paperclip maximizer (Bostrom 2003): pedir oro y recibir oro a costa de todo lo demás.
El problema no es la función misma sino la traducción. Felicidad, justicia, bienestar humano: son palabras imprecisas que un optimizador interpreta a la letra y reduce a su descripción literal. Stuart Russell propone, frente a esto, sistemas que sostengan incertidumbre sobre la utilidad humana en lugar de optimizar una traducción fija. La preocupación conversa con la ley de la variedad requerida: un controlador demasiado simple no puede gobernar un mundo demasiado variado.
Dónde aparece en Nuevas Ciencias
- Dioses, mascotas y centauros: Costanza nombra a la función de utilidad como “el abismo”. Plantea el escenario clásico: una máquina perfectamente optimizada que reordena átomos para maximizar una meta que nunca entendimos. El ensayo enmarca la pregunta en la imposibilidad de especificar lo que queremos, cuando lo que queremos cambia con cultura, persona y tiempo.
Conceptos vecinos
- Agencia
- Aprendizaje por refuerzo
- La lección amarga
- Ley de la variedad requerida
- W. Ross Ashby
- Teoría de la mente
- Determinismo
- Posible adyacente
Fuentes
- Stanford Encyclopedia of Philosophy: The Ethics of Artificial Intelligence and Robotics (Categoría 1)
- Russell, S. (2019). Human Compatible: AI and the Problem of Control. Viking. (Categoría 2)
- von Neumann, J., y Morgenstern, O. (1944). Theory of Games and Economic Behavior. Princeton University Press. (Categoría 2)