OpenAI lanza GPT-4o y versión de escritorio de ChatGPT

OpenAI lanza GPT-4o y ChatGPT: Avances en IA generativa

Armando Nevárez Acuña

OpenAI presentó el lunes un nuevo modelo de IA y una versión de escritorio de ChatGPT, junto con una interfaz de usuario actualizada, en su último esfuerzo por expandir el uso de su popular chatbot.

La actualización trae GPT-4 a todos, incluidos los usuarios gratuitos de OpenAI, dijo la directora de tecnología, Mira Murati, en un evento transmitido en vivo. Agregó que el nuevo modelo, GPT-4o, es “mucho más rápido”, con capacidades mejoradas en texto, video y audio. OpenAI dijo que eventualmente planea permitir a los usuarios chatear por video con ChatGPT.

“Esta es la primera vez que realmente estamos dando un gran paso adelante en cuanto a la facilidad de uso”, dijo Murati.

OpenAI, respaldada por Microsoft, ha sido valorada en más de $80 mil millones por inversores. La compañía, fundada en 2015, está bajo presión para mantenerse en la cima del mercado de IA generativa mientras busca formas de ganar dinero mientras gasta sumas masivas en procesadores e infraestructura para construir y entrenar sus modelos.

La o en GPT-4o significa omni. El nuevo modelo permite que ChatGPT maneje 50 idiomas diferentes con una velocidad y calidad mejoradas, y también estará disponible a través de la API de OpenAI, lo que permite a los desarrolladores comenzar a construir aplicaciones utilizando el nuevo modelo hoy, dijo Murati.

Añadió que GPT-4o es el doble de rápido y la mitad del costo que GPT-4 Turbo.

Los miembros del equipo de OpenAI demostraron las capacidades de audio del nuevo modelo, por ejemplo, pidiéndole que ayudara a calmar a alguien antes de un discurso público. El investigador de OpenAI, Mark Chen, dijo que el modelo puede “percibir tu emoción”, y agregó que el modelo también puede manejar a los usuarios que lo interrumpen. El equipo también le pidió que analizara la expresión facial de un usuario para comentar sobre las emociones que la persona puede estar experimentando.

“¡Hola! ¿Qué tal? ¿Cómo puedo alegrarte el día hoy?” dijo el modo de audio de ChatGPT cuando un usuario lo saludó.

La compañía planea probar el Modo de Voz en las próximas semanas, con acceso temprano para suscriptores pagados de ChatGPT Plus, según una publicación en el blog. OpenAI también dijo que el nuevo modelo puede responder a las indicaciones de audio de los usuarios “en tan solo 232 milisegundos, con un promedio de 320 milisegundos, similar al tiempo de respuesta humano en una conversación”.

Chen demostró la capacidad del modelo para contar una historia antes de dormir y le pidió que cambiara el tono de su voz para que fuera más dramático o robótico. Incluso le pidió que cantara la historia.

Además, el nuevo modelo de OpenAI puede funcionar como traductor, incluso en modo de audio, dijo la compañía. Chen demostró la capacidad de la herramienta para escuchar a Murati hablando italiano mientras él hablaba inglés y para traducir a sus respectivos idiomas mientras conversaban.

Los miembros del equipo también demostraron la capacidad del modelo para resolver ecuaciones matemáticas y ayudar a escribir código, posicionándolo como un competidor más fuerte del GitHub Copilot de Microsoft.

Para OpenAI, el lanzamiento fue uno de los anuncios más importantes de la compañía desde el lanzamiento de ChatGPT Enterprise en agosto, la capa empresarial del chatbot de IA. Esa herramienta estuvo en desarrollo durante “menos de un año” y contó con la ayuda de más de 20 empresas de diferentes tamaños e industrias, dijo el director de operaciones de OpenAI, Brad Lightcap, a CNBC en ese momento.

OpenAI, Microsoft y Google están a la vanguardia de una fiebre del oro de la IA generativa, ya que empresas de prácticamente todas las industrias compiten por agregar chatbots y agentes con IA a servicios clave para no quedarse atrás de los competidores. A principios de este mes, el rival de OpenAI, Anthropic, anunció su primer oferta empresarial y una aplicación gratuita para iPhone.

Según PitchBook, se invirtieron un récord de $29.1 mil millones en casi 700 acuerdos de IA generativa en 2023, un aumento de más del 260% respecto al año anterior. Se predice que el mercado superará el $1 billón en ingresos dentro de una década.

Algunos en la industria han expresado preocupaciones sobre la rapidez con la que los nuevos servicios no probados están llegando al mercado, y los académicos y éticos están angustiados por la tendencia de la tecnología a propagar prejuicios.

Después del lanzamiento de ChatGPT en noviembre de 2022, rompió récords en ese momento como la aplicación de consumo de más rápido crecimiento de la historia, y ahora tiene aproximadamente 100 millones de usuarios activos semanales. OpenAI dice que más del 92% de las empresas de Fortune 500 están utilizando la plataforma.

Murati dijo durante el evento del lunes que OpenAI quiere “eliminar algo del misticismo de la tecnología”.

“Durante las próximas semanas, implementaremos estas capacidades para todos”, dijo.

El nuevo modelo se lanzará primero el martes para los clientes de ChatGPT Plus y Team, y luego para Enterprise más adelante, dijo una publicación en el blog el lunes. También estará disponible para los usuarios gratuitos de ChatGPT a partir del lunes, con límites de uso. Los usuarios de ChatGPT Plus tendrán cinco veces más capacidad de mensajes que los usuarios gratuitos, y los clientes de ChatGPT Team y Enterprise tendrán límites de uso aún mayores.

Murati concluyó el evento transmitido en vivo agradeciendo al CEO de Nvidia, Jensen Huang, y a su empresa por proporcionar las unidades de procesamiento gráfico (GPU) necesarias para alimentar la tecnología de OpenAI.

“Quiero agradecer al increíble equipo de OpenAI, y también gracias a Jensen y al equipo de Nvidia por traernos las GPUs más avanzadas para hacer posible esta demostración hoy”, dijo.

OpenAI lanza GPT-4o y ChatGPT: Avances en IA generativa

Noticias relacionadas: