AlphaProof Nexus resolve problemas de décadas por centenas de dólares

AlphaProof Nexus resolve problemas de décadas por centenas de dólares

O problema de sempre, o custo de agora

Você já tentou depurar um raciocínio longo e viu o erro lógico no final? Agora imagine escalar isso para problemas que ficaram sem solução por 56 anos. É o que o AlphaProof Nexus, da Google DeepMind, está fazendo: resolver conjecturas matemáticas antigas com um custo de inferência de algumas centenas de dólares por problema.

O Fato

O sistema resolveu 9 dos 353 problemas de Erdős que tentou, incluindo dois sem resposta há 56 anos. Também provou 44 de 492 conjecturas da Online Encyclopedia of Integer Sequences (OEIS), resolveu uma questão de 15 anos sobre funções de Hilbert e melhorou um limite em otimização convexa. O custo total por problema ficou na casa das centenas de dólares, segundo o artigo de pesquisa.

Como Funciona (Visão de Operador)

AlphaProof Nexus usa o Gemini 3.1 Pro como modelo de linguagem, mas a diferença está no feedback simbólico. Em vez de gerar a prova inteira em linguagem natural, o modelo gera passos em Lean, uma linguagem formal de prova. O compilador Lean verifica cada passo e erros são realimentados para o modelo. Isso ancora o raciocínio do LLM, compensando suas fraquezas lógicas.

O sistema é composto por quatro agentes com complexidade crescente. O mais simples, Agente A, apenas executa loops de geração e verificação com o LLM. O Agente B adiciona consultas ao AlphaProof, o sistema de reinforcement learning da DeepMind para problemas olímpicos. O Agente C introduz um componente evolutivo, com subagentes compartilhando esboços de prova ranqueados por um sistema Elo. O Agente D combina tudo. Surpreendentemente, uma análise posterior mostrou que o Agente A resolveu todos os 9 problemas de Erdős, embora com custo maior nos mais difíceis. Segundo os pesquisadores, isso indica uma tendência: loops simples com LLMs cada vez mais capazes podem substituir sistemas especializados.

O Que Isso Muda na Prática

Quem ganha? Pesquisadores que podem explorar conjecturas sem depender de intuição humana pura, gastando pouco. Quem perde? Talvez a mística de que a matemática pura é intocável por IA. A ação prática é clara: se você trabalha com matemática formal ou otimização, vale integrar loops de prova com Lean e LLMs. O custo baixo permite testar muitas hipóteses rapidamente.

Além disso, o sistema se mostrou útil mesmo quando não encontra a prova completa. Matemáticos relataram que tentativas fracassadas aprofundaram a compreensão do problema. E como os esboços são formais, especialistas podem focar nas submetas não resolvidas, sem precisar revisar todo o argumento.

Tensão

Mas será que isso escala? O sistema falhou na maioria dos problemas de Erdős, especialmente os que exigem teoria nova. A dependência do Lean e da biblioteca Mathlib limita o escopo a áreas onde a formalização já é madura, como combinatória e otimização convexa. Além disso, o LLM ainda é inerentemente não confiável – o verificador é que salva. O custo por problema é baixo, mas para milhares de problemas, o total acumula. E a pergunta central: isso realmente resolve o problema ou apenas move o gargalo para a formalização das conjecturas? Enquanto a matemática não for totalmente formalizada, o sistema depende de humanos para traduzir problemas informais em Lean. Isso é um passo, não o fim.

Conclusão

AlphaProof Nexus mostra que a combinação de LLMs com verificadores formais pode gerar resultados concretos a custo irrisório. A pergunta que fica: quanto tempo até que esse tipo de loop se torne padrão em pesquisa matemática? E, mais importante: o que faremos com o tempo que sobrar?

Compartilhe este artigo

Comentários (0)

Nenhum comentário ainda. Seja o primeiro a comentar!

Deixe seu comentário