Cover Image for El nuevo modelo de video generativo de IA de Google ya está disponible.

El nuevo modelo de video generativo de IA de Google ya está disponible.

La vista previa privada de Veo se presenta antes del lanzamiento de Sora por parte de OpenAI.

Veo, el más reciente modelo de video generativo de Google, ya está disponible para que las empresas lo incorporen en sus procesos de creación de contenido. Este modelo fue presentado por primera vez en mayo, tres meses después de que OpenAI mostrara su producto competidor, Sora. Veo ha logrado adelantarse en el mercado al lanzarse en una vista previa privada a través de la plataforma Vertex AI de Google.

El modelo tiene la capacidad de generar videos en resolución 1080p de “alta calidad” en una variedad de estilos visuales y cinematográficos a partir de indicaciones basadas en texto o imágenes. Al anunciarse inicialmente, se mencionó que los clips generados podían durar más de un minuto; sin embargo, Google no ha especificado restricciones de longitud para esta versión previa. Algunos de los nuevos ejemplos de clips presentes en el anuncio de Google son comparables a lo que ya se ha observado de Veo, siendo muy difícil distinguir que estos videos son generados por inteligencia artificial sin observar detenidamente.

Uno de los ejemplos más impresionantes de los clips de Veo es un perro, donde se puede notar cómo el patrón de su pelaje y su collar se mantienen consistentes durante su movimiento. La última versión del generador de texto a imagen de Google, Imagen 3, también estará disponible para todos los clientes de Google Cloud a través de Vertex “a partir de la próxima semana”, ampliando su lanzamiento inicial en EE. UU. que tuvo lugar en agosto. Los usuarios incluidos en la lista de acceso de Google podrán disfrutar de nuevas características, como la edición de fotos basada en incitaciones y la capacidad de “infundir su propia marca, estilo, logo, sujeto o características de producto” en las imágenes generadas.

No obstante, Veo no es perfecto, como se puede observar en un video generado de un concierto donde la luz brilla a través de la mano de una persona en la esquina superior izquierda. Google asegura que Veo e Imagen 3 cuentan con salvaguardias integradas para prevenir la generación de contenido dañino o violaciones a los derechos de autor, aunque se ha descubierto que la última no es difícil de eludir. Además, todo lo producido por Veo e Imagen 3 está incrustado con la tecnología SynthID de DeepMind, un tipo de marca de agua digital invisible que, según Google, puede “disminuir la desinformación y las preocupaciones sobre la atribución incorrecta”. Este concepto es similar al sistema de Credenciales de Contenido de Adobe, que puede ser integrado en el contenido producido por sus propios modelos generativos de imagen y video.

Con el modelo de video de Google ya disponible, OpenAI se encuentra notablemente rezagado respecto a sus competidores y está quedándose sin tiempo para cumplir su promesa de lanzar Sora antes de finales de 2024. La aparición de contenido generado por inteligencia artificial en anuncios, como la reciente campaña navideña de Coca-Cola, indica que las empresas no están dispuestas a esperar por Sora; de hecho, según Google, el 86 por ciento de las organizaciones que ya utilizan inteligencia artificial generativa están viendo un aumento en sus ingresos.