Omni: el nuevo y mejorado ChatGPT

Omni, que significa totalidad, hace referencia a su capacidad de comprender, analizar y generar respuestas en “cualquier combinación de texto, audio e imagen”

OpenAI anunció este lunes una nueva versión de su ya popular sistema de inteligencia artificial (IA) ChatGPT, que promete responder con mayor naturalidad, más rápido y de forma más inteligente que cualquiera de sus antecesores.

Se trata de GPT-4 Omni (GPT-4o), un modelo cuyo nombre —Omni significa totalidad— hace referencia a su capacidad de comprender, analizar y generar respuestas en “cualquier combinación de texto, audio e imagen”. “Es un paso hacia una interacción persona-computadora mucho más natural”, aseguran sus creadores.

Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN

Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx
— OpenAI (@OpenAI) May 13, 2024

A diferencia de sus predecesores, que requieren de modelos separados para procesar texto, audio e imagen, GPT-4o lo hace como una sola red neuronal, siendo la primera herramienta de su clase que combina las tres modalidades; característica que le ha permitido reducir la latencia de sus respuestas. “Puede responder a entradas de audio en tan solo 232 milisegundos, con un promedio de 320 milisegundos, lo que es similar al tiempo humano de respuesta en una conversación”, según OpenAI.

Si bien la llamada GPT-4 Turbo, considerada la versión líder y más potente de OpenAI, podía analizar imágenes y texto, GPT-4 Omni mejora enormemente la experiencia al añadir procesamiento de voz. En este sentido, es posible conversar con el modelo e incluso interrumpirlo mientras responde, como podría suceder en una charla entre dos personas. Se comunica en un lenguaje natural y comprensible, es capaz de captar matices de voz del usuario, ‘lee’ las emociones y transmite la entonación pertinente.

Entre sus novedades destaca también su multilingüismo, pues ofrece un rendimiento mejorado en una gran cantidad de idiomas —alrededor de 50— distintos del inglés. Así, GPT-4o podría traducir una conversación en tiempo real de un idioma a otro, lo que permitiría a dos personas de distinta lengua conversar de manera más natural, explica el portal Xataka.

Dog meets GPT-4o pic.twitter.com/5C0hlYq5ws
— OpenAI (@OpenAI) May 13, 2024

Ya disponible

Este nuevo modelo está disponible a partir de hoy tanto a nivel gratuito como para sus usuarios de pago, estos últimos con algunos beneficios extra en cuanto a límites de uso. No obstante, por el momento solo aporta sus capacidades de texto e imagen. OpenIA asegura que el “modo voz” será lanzado en las próximas semanas, aunque únicamente dentro de su plan ChatGPT Plus.

Cabe señalar que la empresa lanzó, además, una aplicación de escritorio de ChatGPT para macOS, a través de la cual será posible hacer preguntas sobre lo que se ve en pantalla, desde un atajo de teclado. Los usuarios de ChatGPT Plus tiene desde hoy acceso a la aplicación. Una versión para Windows llegará en los próximos meses.

Plus users will get up to 5x higher limits, and earliest access to features like our new macOS desktop app and next-generation voice and video capabilities. pic.twitter.com/9smAHkgvhn
— OpenAI (@OpenAI) May 13, 2024

Diario EL NORTE – edición digital viernes 26 de julio 2024

╬Rossi, Nélida Lidia

Un día como hoy: sábado 27 de julio

El film con acción y comedia que estrenó Netflix y busca ser furor

Polémica en River Plate: Demichelis y el mensaje de los hinchas en su pared

Omni, que significa totalidad, hace referencia a su capacidad de comprender, analizar y generar respuestas en “cualquier combinación de texto, audio e imagen”

Ya disponible

NOSOTROS

SEGUINOS EN REDES