OpenAI no se detiene en su afán de innovación. Con sus recientes actualizaciones, ChatGPT ahora va más allá del texto para ofrecer capacidades multimodales. Esto significa que el chatbot puede ahora «ver, oír y hablar», abriendo un abanico de aplicaciones prácticas y aumentando su atractivo en el mercado.
Imágenes
Una de las funciones más llamativas permite al bot analizar y responder a imágenes. ¿Tienes una foto de una bicicleta y necesitas saber cómo ajustar el asiento? ¿O tal vez una imagen del interior de tu nevera y estás buscando sugerencias de recetas? ChatGPT tiene respuestas para eso.
Voz
Además, ChatGPT ahora permite conversaciones de voz, convirtiéndose en un competidor más cercano a asistentes como Siri y Alexa, pero con la ventaja de una interacción más fluida y natural. La voz de ChatGPT varía en tono y cadencia, ofreciendo una experiencia de conversación más realista. Su sistema de reconocimiento de voz, Whisper, y el nuevo algoritmo de texto a voz le otorgan estas capacidades.
Estas funcionalidades forman parte de una tendencia más amplia hacia sistemas de inteligencia artificial multimodales, que se espera sean la próxima frontera en IA, capaces de procesar diferentes tipos de inputs como texto, imágenes y voz. Los usuarios que se benefician primero son los clientes de pago, pero se espera que estas características estén disponibles para el público general pronto.
![Las Mejoras de ChatGPT](https://bots.blog/wp-content/uploads/2023/10/telefono-inteligente-vidrio-tecnologia-inteligencia-artificial-innovacion-alta-tecnologia-1-1024x1024.jpg)
¿Infalible?
A pesar de su avanzada tecnología, ChatGPT no es infalible. Aunque realiza un buen trabajo al reconocer objetos y describirlos, falla en tareas como resolver crucigramas o identificar con precisión ciertos elementos en imágenes. Además, por razones de ética y privacidad, la función de reconocimiento de imágenes de ChatGPT se niega a responder preguntas sobre rostros humanos.
Y aquí viene la guinda del pastel: el acceso a Internet a través de Bing, reintegrado recientemente, rompe la barrera de datos del chatbot, que estaba limitada hasta 2021. Esta funcionalidad abre nuevas puertas para que ChatGPT se mantenga actualizado, pudiendo consultar la web en tiempo real.
En resumen
Las actualizaciones de ChatGPT lo posicionan como una herramienta aún más versátil, acercándonos al futuro donde los asistentes de IA forman parte integral de nuestras vidas, no solo como herramientas de productividad sino también como compañeros conversacionales. Sin embargo, el futuro de cómo se utilizarán estas nuevas capacidades sigue siendo una incógnita.