Richard Sutton

Investigador central del aprendizaje por refuerzo. Junto con Andrew Barto, desarrolló las bases conceptuales y algorítmicas del campo desde los años ochenta; ambos recibieron el Premio Turing 2024, anunciado por la ACM en marzo de 2025. Su libro con Barto, Reinforcement Learning: An Introduction (2.ª ed., 2018), es el manual de referencia.

Sutton entra en el corpus por dos vías. La primera es el propio aprendizaje por refuerzo: el esquema agente-ambiente-recompensa que permite pensar la inteligencia como acción ajustada por consecuencias. La segunda es The Bitter Lesson (2019), una tesis breve que condensa setenta años de IA en una advertencia contra el exceso de conocimiento experto codificado a mano.

Conviene leer su tesis con precisión. No dice que más cómputo siempre gane: dice que los métodos generales capaces de aprovechar más cómputo (búsqueda y aprendizaje) han terminado superando a las arquitecturas con conocimiento experto cuando el tiempo y la escala disponibles son suficientes.

Dónde aparece en Nuevas Ciencias

  • La lección amarga: es el personaje intelectual del ensayo. Su texto de 2019 da título, tesis y conflicto.

Conceptos vecinos

Fuentes