Amazon presenta su nueva familia de modelos fundamentales Nova.
Amazon Web Services presentó una serie de seis nuevos modelos de inteligencia artificial generativa multimodal, que han sido nombrados Nova.
En la conferencia re:Invent de la compañía, el CEO de Amazon, Andy Jassy, presentó seis nuevos modelos de generación de texto, imágenes y videos, conocidos como Amazon Nova. Esta nueva serie de IA generativa multimodal incluye una variedad de modelos como Nova Micro, diseñado para ofrecer respuestas de bajo costo y latencia con texto únicamente; Nova Lite, que es un modelo multimodal asequible para procesar entradas de texto, imagen y video; y Nova Pro, un modelo multimodal versátil que busca equilibrar la precisión, velocidad y costo para diversas tareas.
Además, está Nova Premier, que es calificado como el modelo multimodal más avanzado para tareas de razonamiento complejo, y Nova Canvas, que actúa como un motor dedicado para crear imágenes a partir de texto. Por otro lado, Nova Reel está diseñado específicamente para la generación de videos. Los modelos textuales han sido optimizados para funcionar en 15 idiomas diferentes. Nova Micro permite un contexto de 128,000 tokens, mientras que Nova Lite y Nova Pro pueden gestionar hasta 300,000 tokens. Se prevé que la empresa amplíe las ventanas de contexto de sus modelos más grandes hasta 2 millones de tokens para principios del próximo año.
Canvas permite a los usuarios generar y editar imágenes utilizando indicaciones en lenguaje natural. Por su parte, Nova Reel puede generar clips de video de hasta seis segundos de duración, tomando como referencia tanto indicaciones textuales como imágenes. Este generador de videos también incluye controles de cámara, permitiendo movimientos de paneo y zoom.
Jassy enfatizó los avances de los modelos y su progreso significativo en los últimos meses. Aseguró que estos modelos son rápidos y económicos, aunque la compañía aún no ha proporcionado datos de referencia que respalden estas afirmaciones. Resaltó que los modelos han sido optimizados para trabajar con sistemas y APIs propietarias, facilitando la automatización de pasos orquestados.
Actualmente, los modelos Micro, Lite, Pro, Canvas y Reel están disponibles para clientes de AWS, mientras que el modelo Premiere se espera para el primer trimestre de 2025.