Inteligência Artificial 05 Jun, 2026 • Filippe Barreto Sims • 2

Claude escreve 90% do código da Anthropic – e empresa pede pausa

Uma empresa que constrói modelos de IA afirma que seu próprio modelo já escreve mais de 90% do código de produção. E, ao mesmo tempo, pede que o mundo tenha um botão de pausa para o desenvolvimento de IA. A tensão entre velocidade e controle nunca foi tão explícita. É sobre isso que o relatório interno recém-publicado pela Anthropic trata — e os números são ao mesmo tempo impressionantes e preocupantes.

O fato: dados internos e um pedido de pausa

A Anthropic compartilhou pela primeira vez dados internos mostrando o quanto o Claude acelerou o desenvolvimento da própria empresa. No segundo trimestre de 2026, cada engenheiro entrega em média oito vezes mais código por dia do que em 2024. Mais de 80% do código que entra na base de produção vem do Claude — número que, antes do lançamento do Claude Code em fevereiro de 2025, era de apenas alguns pontos percentuais. A liderança estima que, incluindo scripts e código experimental, o total ultrapassa 90%. Um funcionário relata que já faz cinco meses desde que escreveu código manualmente.

Paralelamente, a Anthropic defende a criação de um mecanismo global verificável para pausar o desenvolvimento de IA. A empresa argumenta que uma paralisação unilateral por qualquer laboratório não seria suficiente — e que a capacidade de autoaperfeiçoamento recursivo, ainda não plenamente alcançada, pode chegar mais cedo do que a maioria das instituições está preparada.

Como funciona: métricas, limitações e o que os números escondem

O aumento de oito vezes em linhas de código é a métrica mais chamativa, mas a própria Anthropic admite que é uma medida imperfeita. Uma pesquisa interna com 130 engenheiros, de março de 2026, apontou um ganho mediano de 4x com o modelo Mythos Preview — número que a empresa considera ainda superestimado. Estudos do METR mostram que desenvolvedores tendem a exagerar os ganhos de produtividade com IA.

Em qualidade, o relatório afirma que o código escrito pelo Claude era um pouco pior que o humano no final de 2025, está no mesmo nível hoje e deve ser estritamente melhor dentro do ano. Um revisor automatizado baseado no Claude teria capturado cerca de um terço dos bugs que causaram incidentes no claude.ai antes de irem para produção. Em outro exemplo, o Claude entregou mais de 800 correções em abril de 2026 que reduziram uma classe de erros de API por um fator de 1.000 — trabalho que um humano levaria quatro anos para fazer, segundo o engenheiro responsável.

A duração das tarefas que os sistemas de IA conseguem executar de forma confiável está dobrando a cada quatro meses, ante sete antes. Em março de 2024, o Claude Opus 3 conseguia lidar com tarefas de quatro minutos. Um ano depois, o Claude Sonnet 3.7 já alcançava uma hora e meia. O Claude Opus 4.6 agora lida com tarefas de 12 horas. O Claude Mythos Preview, segundo o METR, trabalhou por pelo menos 16 horas e está no limite superior do que conseguem medir com tarefas existentes. Se a tendência continuar, tarefas de um dia inteiro podem estar ao alcance ainda este ano, e tarefas de uma semana, em 2027.

O que isso muda na prática

Para quem desenvolve software, o recado é claro: a IA não é mais só uma ferramenta de autocomplete. Ela está assumindo o fluxo principal de produção. Engenheiros precisam repensar o processo de revisão de código — se 90% vem de IA, a revisão humana precisa ser mais estratégica e focada em arquitetura, não em cada linha. Para equipes de QA, a capacidade de detectar bugs automaticamente com revisores de IA pode se tornar obrigatória. Empresas que não integram esses fluxos correm o risco de ficar para trás em produtividade.

Para concorrentes como OpenAI e Google, os números da Anthropic são um sinal de alerta. Se a recursividade já está tão avançada, o ciclo de inovação pode acelerar ainda mais. Uma ação prática imediata: começar a medir o impacto real da IA no seu próprio ciclo de desenvolvimento, não apenas em linhas de código, mas em bugs evitados e tempo de entrega.

Por outro lado, o pedido de pausa levanta questões. Se o Claude é tão produtivo, por que frear? A resposta está no risco de um salto qualitativo não controlado. A própria Anthropic admite que a linha entre assistência e autonomia total é tênue. Para reguladores e formuladores de políticas, o relatório é um argumento forte para discutir mecanismos de verificação e pausa — mas a pergunta que fica é: como verificar globalmente algo que avança tão rápido?

Tensão: produtividade real ou apenas mais código?

O aumento de oito vezes em código não significa necessariamente oito vezes mais valor de negócio. Código precisa ser mantido, testado e entendido. Se a IA gera mais código, o gargalo pode se deslocar para a capacidade humana de revisar, integrar e operar esses sistemas. A Anthropic reconhece que a métrica de linhas de código é imperfeita — mas ainda assim a usam como destaque. Há um viés natural em mostrar o que impressiona.

Além disso, o pedido de pausa soa contraditório vindo de quem mais se beneficia do avanço rápido. Não é ceticismo gratuito, mas uma tensão real: a empresa que mais acelera é a mesma que pede freio. Isso pode ser visto como responsabilidade ou como estratégia de market share — afinal, se todos pararem, quem já está na frente mantém a vantagem.

Do ponto de vista de custo, usar Claude para gerar código tem um preço. A Anthropic não divulgou o custo por tarefa, mas sabemos que modelos como o Opus 4.6 e Mythos Preview são caros para executar. A relação custo-benefício precisa ser avaliada caso a caso. Para tarefas curtas, pode não valer a pena; para tarefas longas e complexas, o ganho de produtividade pode compensar. Mas a conta não é trivial.

Conclusão: o relógio acelera, e o botão de pausa ainda é um conceito

A Anthropic mostrou que a IA já é parte central do seu próprio desenvolvimento. O código gerado por máquina superou o humano em volume e está alcançando em qualidade. O pedido de pausa é um reconhecimento de que o ritmo atual pode ser insustentável sem salvaguardas. A pergunta que fica é prática: se o Claude continua melhorando a si mesmo, quem vai apertar o botão de pausa — e será que ele ainda funciona?

Claude escreve 90% do código da Anthropic – e empresa pede pausa

O fato: dados internos e um pedido de pausa

Como funciona: métricas, limitações e o que os números escondem

O que isso muda na prática

Tensão: produtividade real ou apenas mais código?

Conclusão: o relógio acelera, e o botão de pausa ainda é um conceito

Compartilhe este artigo

Comentários (0)

Deixe seu comentário