Cover Image for OpenAI presenta Flex, un procesamiento más económico y lento para tareas de IA.

OpenAI presenta Flex, un procesamiento más económico y lento para tareas de IA.

OpenAI ha presentado una nueva opción de API llamada procesamiento Flex, diseñada para tareas más económicas y con menor velocidad, que utiliza sus modelos de inteligencia artificial o3 y o4-mini para razonamiento.

OpenAI ha decidido intensificar su competencia contra otros actores del sector de la inteligencia artificial, como Google, a través del lanzamiento de Flex processing. Esta nueva opción de API ofrece precios más bajos para el uso de modelos de inteligencia artificial a cambio de tiempos de respuesta más lentos y, en ocasiones, limitaciones en la disponibilidad de recursos. Actualmente, Flex processing está disponible en beta para los modelos de razonamiento o3 y o4-mini, los cuales están destinados a tareas de menor prioridad y que no son de producción, tales como evaluaciones de modelos, enriquecimiento de datos y cargas de trabajo asincrónicas.

El uso de Flex processing permite una reducción del 50% en los costos de API. Para el modelo o3, el coste es de $5 por 1 millón de tokens de entrada (aproximadamente 750,000 palabras) y $20 por 1 millón de tokens de salida, en comparación con los precios estándar de $10 y $40, respectivamente. En el caso de o4-mini, la tarifa se reduce a $0.55 por 1 millón de tokens de entrada y $2.20 por 1 millón de tokens de salida, desde los $1.10 y $4.40 que se cobran normalmente.

Este lanzamiento se produce en un contexto donde los precios de la inteligencia artificial de vanguardia continúan aumentando, mientras que las empresas competidoras están presentando modelos más eficientes y asequibles. Recientemente, Google introdujo su modelo Gemini 2.5 Flash, que ofrece un rendimiento comparable o superior al R1 de DeepSeek a un costo menor por tokens de entrada.

Además, al anunciar la introducción de Flex pricing a sus clientes, OpenAI comunicó que los desarrolladores que se encuentran en los niveles 1 a 3 de su jerarquía de uso deberán completar un nuevo proceso de verificación de identidad para acceder a o3. Esta jerarquía de niveles se determina según el gasto en los servicios de OpenAI. La disponibilidad de resúmenes de razonamiento y el soporte de API de streaming de o3, así como de otros modelos, también están sujetos a esta verificación. OpenAI ha señalado anteriormente que esta medida busca prevenir el abuso de sus políticas de uso.