En septiembre, OpenAI presentó una nueva versión de ChatGPT diseñada para analizar tareas que involucran matemáticas, ciencias y programación. A diferencia de las versiones anteriores del chatbot, esta nueva tecnología podía dedicar tiempo a analizar problemas complejos antes de encontrar una solución.

Poco después, la compañía dijo que su nueva tecnología de razonamiento había superado a los sistemas líderes de la industria en una serie de pruebas que rastrean el progreso de la inteligencia artificial .

Ahora, otras empresas, como Google , Anthropic y DeepSeek de China , ofrecen tecnologías similares.

Pero ¿puede la IA realmente razonar como un humano? ¿Qué significa que una computadora piense? ¿Se acercan estos sistemas a la verdadera inteligencia?

Aquí hay una guía.

¿Qué significa cuando un sistema de IA razona?

Razonar simplemente significa que el chatbot dedica algo de tiempo adicional a trabajar en un problema.

“El razonamiento es cuando el sistema realiza un trabajo adicional después de que se formula la pregunta”, dijo Dan Klein, profesor de informática en la Universidad de California, Berkeley, y director de tecnología de Scaled Cognition, una empresa emergente de inteligencia artificial.

Puede dividir un problema en pasos individuales o intentar resolverlo mediante prueba y error.

El ChatGPT original respondía preguntas al instante. Los nuevos sistemas de razonamiento pueden analizar un problema durante varios segundos, o incluso minutos, antes de responder.

¿Puedes ser más específico?

En algunos casos, un sistema de razonamiento perfeccionará su enfoque de una pregunta, intentando repetidamente mejorar el método elegido. En otras ocasiones, puede probar varias maneras de abordar un problema antes de decidirse por una. O puede revisar el trabajo realizado unos segundos antes, solo para comprobar si era correcto.

Básicamente, el sistema intenta todo lo que puede para responder a su pregunta.

Esto es como un estudiante de primaria que está luchando por encontrar una forma de resolver un problema de matemáticas y garabatea varias opciones diferentes en una hoja de papel.

¿Qué tipo de preguntas requieren que un sistema de IA razone?

Potencialmente, puede razonar sobre cualquier cosa. Pero el razonamiento es más efectivo cuando se formulan preguntas relacionadas con las matemáticas, la ciencia y la programación informática.

¿En qué se diferencia un chatbot de razonamiento de los chatbots anteriores?

Podías pedir a los chatbots anteriores que te mostraran cómo habían llegado a una respuesta específica o que revisaran su propio trabajo. Dado que el ChatGPT original había aprendido de textos en internet, donde las personas mostraban cómo habían llegado a una respuesta o revisado su propio trabajo, también podía realizar este tipo de autorreflexión.

Pero un sistema de razonamiento va más allá. Puede hacer este tipo de cosas sin que se le pida. Y puede hacerlas de maneras más extensas y complejas.

Las empresas lo llaman sistema de razonamiento porque dan la sensación de que funciona más como una persona que piensa en un problema difícil.

¿Por qué es importante ahora el razonamiento de la IA?

Empresas como OpenAI creen que esta es la mejor manera de mejorar sus chatbots.

Durante años, estas empresas se basaron en un concepto simple: cuanto más datos de Internet introducían en sus chatbots, mejor funcionaban esos sistemas .

Pero en 2024, agotaron casi todo el texto que había en Internet .

Eso significaba que necesitaban una nueva forma de mejorar sus chatbots. Así que empezaron a desarrollar sistemas de razonamiento.

¿Cómo se construye un sistema de razonamiento?

El año pasado, empresas como OpenAI comenzaron a apoyarse en gran medida en una técnica llamada aprendizaje de refuerzo.

Mediante este proceso, que puede extenderse durante meses, un sistema de IA puede aprender comportamientos mediante un extenso proceso de ensayo y error. Al resolver miles de problemas matemáticos, por ejemplo, puede aprender qué métodos conducen a la respuesta correcta y cuáles no.

Los investigadores han diseñado mecanismos de retroalimentación complejos que muestran al sistema cuándo ha hecho algo bien y cuándo ha hecho algo mal.

"Es un poco como entrenar a un perro", dijo Jerry Tworek, investigador de OpenAI. "Si el sistema funciona bien, le das una galleta. Si no, le dices: 'Perro malo'".

(El New York Times demandó a OpenAI y a su socio, Microsoft, en diciembre por violación de derechos de autor de contenido noticioso relacionado con sistemas de IA).

¿Funciona el aprendizaje de refuerzo?

Funciona bastante bien en ciertas áreas, como las matemáticas, las ciencias y la programación informática. En estas áreas, las empresas pueden definir claramente el buen comportamiento y el mal. Los problemas matemáticos tienen respuestas definitivas.

El aprendizaje por refuerzo no funciona tan bien en áreas como la escritura creativa, la filosofía y la ética, donde la distinción entre el bien y el mal es más difícil de precisar. Los investigadores afirman que este proceso, en general, puede mejorar el rendimiento de un sistema de IA, incluso cuando responde a preguntas ajenas a las matemáticas y la ciencia.

“Aprende gradualmente qué patrones de razonamiento lo llevan en la dirección correcta y cuáles no”, dijo Jared Kaplan, director científico de Anthropic.

¿Son los sistemas de aprendizaje por refuerzo y de razonamiento la misma cosa?

No. El aprendizaje por refuerzo es el método que utilizan las empresas para desarrollar sistemas de razonamiento. Es la etapa de entrenamiento la que, en última instancia, permite a los chatbots razonar.

¿Estos sistemas de razonamiento todavía cometen errores?

Absolutamente. Todo lo que hace un chatbot se basa en probabilidades. Elige la ruta que más se aproxima a los datos que aprendió, ya sean de internet o generados mediante aprendizaje por refuerzo. A veces elige una opción errónea o sin sentido.

¿Es este un camino hacia una máquina que iguale la inteligencia humana?

Los expertos en IA están divididos al respecto. Estos métodos son relativamente nuevos y los investigadores aún intentan comprender sus limitaciones. En el campo de la IA, los nuevos métodos suelen avanzar muy rápidamente al principio, para luego ralentizarse.