O custo de ter 100 programadores IA
Peter Steinberger, fundador do OpenClaw, está rodando 100 agentes de IA que codificam, revisam pull requests e caçam bugs. E a conta da OpenAI no mês passado? US$ 1,3 milhão. Sim, por mês. Para 603 bilhões de tokens e 7,6 milhões de requisições. O modelo principal foi o GPT-5.5 (ou algo próximo, o nome exato não foi revelado). A pergunta que fica: isso é visão de futuro ou gasto descontrolado?
O que exatamente esses agentes fazem
A equipe de Steinberger – cerca de três pessoas – mantém 100 instâncias do Codex rodando em nuvem. Esses agentes não estão só gerando código aleatório. Eles revisam PRs, encontram falhas de segurança em commits, deduplicam issues, escrevem correções. Alguns abrem PRs baseados na visão do projeto, outros monitoram benchmarks e reportam regressões no Discord. Tem até agente que escuta reuniões e já começa a implementar funcionalidades discutidas. Além da OpenAI, usam ferramentas como Clawpatch.ai, Deepsec da Vercel e Codex Security para análise de bugs e segurança.
Visão de operador: como isso funciona tecnicamente
Para sustentar 100 agentes ativos, a arquitetura precisa ser resiliente. Cada agente é uma instância Codex que consome tokens continuamente. Com 603 bilhões de tokens em 30 dias, estamos falando de cerca de 200 bilhões de tokens por dia – ou ~8,3 bilhões por hora. Isso exige paralelismo massivo e gerenciamento de filas. Provavelmente usam chamadas de API assíncronas com rate limiting interno. A latência deve ser gerenciada com batch requests e talvez streaming. O custo de US$ 1,3 milhão reflete o preço do GPT-5.5, que é premium. Steinberger mencionou que desligar o 'Fast Mode' cortaria 70% do custo. Fast Mode provavelmente é um modo que sacrifica precisão por velocidade – ou usa mais inferência em paralelo. Isso sugere que a conta poderia cair para ~US$ 390 mil se optassem por modo mais lento, mas talvez com impacto na produtividade dos agentes.
O que isso muda na prática
Para quem está pensando em adotar agentes de IA para desenvolvimento, a lição é clara: o custo de token cresce rápido quando você escala. Mas Steinberger defende que o ROI é alto porque tudo é open source e os agentes geram valor contínuo. Se você tem uma base de código grande e complexa, esse tipo de automação pode reduzir drasticamente o trabalho manual de revisão e correção. Por outro lado, poucas empresas podem bancar US$ 1,3 milhão por mês só de API. Uma ação prática: simule seu próprio uso. Se você tem 10 agentes, comece com modelos mais baratos (como GPT-4o mini) e desative Fast Mode. Teste antes de escalar.
Quem ganha e quem perde
Ganha quem precisa de revisão de código 24/7 e tem capital para investir. Perde quem acredita que IA vai substituir programadores de uma vez – ainda é caro e requer supervisão. Steinberger tem uma equipe de três humanos, então os agentes são amplificadores, não substitutos.
Tensão: escala ou só muda o gargalo?
US$ 1,3 milhão por mês é muito, mas Steinberger diz que se token custasse zero, a forma de construir software seria completamente diferente. Isso levanta uma questão: estamos apenas transferindo o custo de pessoas para tokens? E quando o preço cair (e vai cair), essa abordagem se torna padrão? Mas hoje, para a maioria, o gargalo não é mais contratar humanos – é pagar a conta da API. Será que esse modelo vai escalar para equipes médias ou continuará restrito a quem tem bolso fundo?
Conclusão
Steinberger está testando um limite que muitos só especulam: a automação total do ciclo de desenvolvimento. O custo é proibitivo para a maioria, mas abre uma janela para o futuro. Fica a pergunta: quando os tokens ficarem 10x mais baratos, sua empresa estará pronta para operar 100 agentes?
Nenhum comentário ainda. Seja o primeiro a comentar!
Deixe seu comentário