OpenAI y Meta preparan lanzamientos

OpenAI y Meta preparan lanzamientos en sus modelos LLMs, que supondrán avances significativos en la capacidad de razonamiento y planificación, clave en el camino hacia la cognición sobrehumana por parte de las máquinas.

Directivos de ambas compañías han anunciado en estas semanas que las nuevas versiones de sus modelos, que impulsan herramientas de IA generativa como ChatGPT, estarán disponibles en breve. Meta lanzará Llama 3 en las próximas semanas, mientras que OpenAI, con el respaldo de Microsoft, anticipa que su próximo modelo, posiblemente denominado GPT-5, estará disponible “pronto”.

«No solo hablen, sino que razonen»

“Estamos trabajando para conseguir que estos modelos no sólo hablen, sino que razonen, planifiquen… tengan memoria”, comentó Joelle Pineau, vicepresidenta de investigación sobre IA en Meta. Este enfoque busca superar las limitaciones actuales, permitiendo que los sistemas de IA asuman tareas más complejas de manera más sofisticada.

Brad Lightcap, director de operaciones de OpenAI, señaló en una entrevista con Financial Times que la próxima generación de GPT mostrará avances notables en la resolución de “problemas difíciles” relacionados con el razonamiento. “Vamos a empezar a ver una IA capaz de asumir tareas más complejas de una forma más sofisticada”, afirmó Lightcap. “Creo que apenas estamos empezando a arañar la superficie de la capacidad que tienen estos modelos para razonar”. A pesar de los progresos, reconoce que las capacidades actuales de la IA siguen siendo “bastante limitadas” en ciertas áreas.

Estas actualizaciones se enmarcan dentro de una oleada de nuevos modelos de lenguaje de gran tamaño que han sido lanzados este año por diversas empresas, entre ellas Google, Anthropic y Cohere. A medida que la carrera por desarrollar una IA generativa más avanzada se intensifica, la velocidad del progreso tecnológico también aumenta. El razonamiento y la planificación, según los expertos, son componentes esenciales en la búsqueda de una “inteligencia artificial general”, una forma de cognición de nivel humano que permitiría a las máquinas realizar secuencias de tareas y anticipar las consecuencias de sus acciones.

Durante un evento celebrado hace unos días en Londres, Yann LeCun, científico jefe de IA en Meta, destacó que los sistemas de IA actuales “producen una palabra tras otra sin pensamiento ni planificación”, lo que les lleva a cometer “errores estúpidos” al enfrentar preguntas complejas o al intentar retener información durante periodos prolongados. La incorporación del razonamiento, según LeCun, permitiría a los modelos de IA “buscar posibles respuestas”, “planificar la secuencia de acciones” y construir un “modelo mental de los efectos que van a tener sus acciones”. Esta capacidad, explicó, es la “gran pieza que nos falta” para que las máquinas alcancen un nuevo nivel de inteligencia.

LeCun también reveló que está trabajando en “agentes” de IA capaces de realizar tareas complejas, como planificar y gestionar todos los pasos de un viaje desde una oficina en París hasta otra en Nueva York, incluyendo el transporte al aeropuerto. Meta planea integrar su nuevo modelo de IA en WhatsApp y en sus gafas inteligentes Ray-Ban, las cuales podrían utilizarse para resolver problemas cotidianos, como reparar una cafetera rota, con la ayuda de un asistente de IA impulsado por Llama 3.

Chris Cox, director de producto de Meta, sugirió en el evento de Londres que en un futuro cercano “hablaremos con estos asistentes de IA todo el tiempo”. LeCun añadió: “Toda nuestra dieta digital estará mediada por sistemas de IA”.

Mientras tanto, Lightcap aseguró que OpenAI tendrá “más que decir pronto” sobre la nueva versión de GPT, subrayando que “con el tiempo… veremos que los modelos se orientan hacia tareas más largas y complejas”, lo que requerirá una mejora en su capacidad de razonamiento.

Share this article
0
Share
Shareable URL
Read next

Suscríbete a nuestra Newsletter