OpenAI Lança 'Flex processing': Use IA de Ponta pela Metade do Preço, Mas com Menos Velocidade
Em uma jogada estratégica para acirrar a competição com gigantes da IA como o Google, a OpenAI anunciou o lançamento do Flex processing. Trata-se de uma nova opção de API que promete reduzir significativamente os custos de uso de seus modelos de inteligência artificial, mas com uma contrapartida: tempos de resposta mais lentos e a possibilidade de "indisponibilidade ocasional de recursos".
O Que é e Como Funciona o Flex Processing?
Disponível em versão beta para os recém-lançados modelos de raciocínio o3 e o4-mini, o Flex processing é voltado, segundo a OpenAI, para tarefas de menor prioridade e que não estão em ambiente de produção. Isso inclui atividades como avaliações de modelos, enriquecimento de dados e cargas de trabalho assíncronas, onde a velocidade de resposta não é o fator mais crítico.
A principal vantagem é o custo: o Flex processing reduz os preços da API exatamente pela metade. Veja os detalhes:
- Modelo o3: Com o Flex, o custo cai para US$ 5 por milhão de tokens de entrada e US$ 20 por milhão de tokens de saída (comparado aos US$ 10 e US$ 40 do plano padrão, respectivamente).
- Modelo o4-mini: O preço com Flex é de US$ 0,55 por milhão de tokens de entrada e US$ 2,20 por milhão de tokens de saída (contra US$ 1,10 e US$ 4,40 do padrão).
Contexto de Mercado e Competição
O lançamento do Flex processing ocorre em um momento de escalada nos custos da IA de fronteira e com concorrentes lançando modelos mais eficientes e focados em custo-benefício. Recentemente, o Google apresentou o Gemini 2.5 Flash, um modelo de raciocínio que rivaliza em performance com alternativas de mercado, mas com um custo de entrada menor.
A iniciativa da OpenAI busca oferecer maior flexibilidade de preços aos desenvolvedores, permitindo que otimizem seus gastos conforme a prioridade de cada tarefa.
Verificação de ID para Acesso ao Modelo o3
Paralelamente ao anúncio do Flex, a OpenAI também comunicou aos seus clientes que desenvolvedores nos níveis 1 a 3 de uso (definidos pelo gasto com os serviços da empresa) precisarão completar o recém-introduzido processo de verificação de identidade para acessar o modelo o3. O acesso a resumos de raciocínio e suporte à API de streaming do o3 também estão condicionados a essa verificação. A empresa justifica a medida como uma forma de impedir que agentes mal-intencionados violem suas políticas de uso.
Com o Flex processing, a OpenAI diversifica suas ofertas, tentando equilibrar performance, custo e acessibilidade em um mercado de IA cada vez mais dinâmico e competitivo.