OpenAI Lança 'Flex Processing': IA Avançada pela Metade do Preço, Mas com Menos Velocidade

OpenAI Lança 'Flex Processing': IA Avançada pela Metade do Preço, Mas com Menos Velocidade

OpenAI Lança 'Flex processing': Use IA de Ponta pela Metade do Preço, Mas com Menos Velocidade

Em uma jogada estratégica para acirrar a competição com gigantes da IA como o Google, a OpenAI anunciou o lançamento do Flex processing. Trata-se de uma nova opção de API que promete reduzir significativamente os custos de uso de seus modelos de inteligência artificial, mas com uma contrapartida: tempos de resposta mais lentos e a possibilidade de "indisponibilidade ocasional de recursos".

O Que é e Como Funciona o Flex Processing?

Disponível em versão beta para os recém-lançados modelos de raciocínio o3 e o4-mini, o Flex processing é voltado, segundo a OpenAI, para tarefas de menor prioridade e que não estão em ambiente de produção. Isso inclui atividades como avaliações de modelos, enriquecimento de dados e cargas de trabalho assíncronas, onde a velocidade de resposta não é o fator mais crítico.

A principal vantagem é o custo: o Flex processing reduz os preços da API exatamente pela metade. Veja os detalhes:

  • Modelo o3: Com o Flex, o custo cai para US$ 5 por milhão de tokens de entrada e US$ 20 por milhão de tokens de saída (comparado aos US$ 10 e US$ 40 do plano padrão, respectivamente).
  • Modelo o4-mini: O preço com Flex é de US$ 0,55 por milhão de tokens de entrada e US$ 2,20 por milhão de tokens de saída (contra US$ 1,10 e US$ 4,40 do padrão).

Contexto de Mercado e Competição

O lançamento do Flex processing ocorre em um momento de escalada nos custos da IA de fronteira e com concorrentes lançando modelos mais eficientes e focados em custo-benefício. Recentemente, o Google apresentou o Gemini 2.5 Flash, um modelo de raciocínio que rivaliza em performance com alternativas de mercado, mas com um custo de entrada menor.

A iniciativa da OpenAI busca oferecer maior flexibilidade de preços aos desenvolvedores, permitindo que otimizem seus gastos conforme a prioridade de cada tarefa.

Verificação de ID para Acesso ao Modelo o3

Paralelamente ao anúncio do Flex, a OpenAI também comunicou aos seus clientes que desenvolvedores nos níveis 1 a 3 de uso (definidos pelo gasto com os serviços da empresa) precisarão completar o recém-introduzido processo de verificação de identidade para acessar o modelo o3. O acesso a resumos de raciocínio e suporte à API de streaming do o3 também estão condicionados a essa verificação. A empresa justifica a medida como uma forma de impedir que agentes mal-intencionados violem suas políticas de uso.

Com o Flex processing, a OpenAI diversifica suas ofertas, tentando equilibrar performance, custo e acessibilidade em um mercado de IA cada vez mais dinâmico e competitivo.

Compartilhe este artigo