Anthropic Lança Claude 4: Nova Geração de IA com Foco em Performance e Programação Avançada

Share

Anthropic Lança Claude 4: Nova Geração de IA com Foco em Performance e Programação Avançada

A Anthropic, startup de inteligência artificial, anunciou durante sua primeira conferência para desenvolvedores o lançamento de dois novos e promissores modelos de IA: Claude Opus 4 e Claude Sonnet 4. Estes modelos, parte da nova família Claude 4, prometem estar entre os melhores da indústria, especialmente em benchmarks populares, e são capazes de analisar grandes volumes de dados, executar tarefas de longa duração e realizar ações complexas.

Segundo a empresa, ambos os modelos foram otimizados para se destacar em tarefas de programação, tornando-os ferramentas poderosas para escrever e editar código.

Opus 4 e Sonnet 4: Capacidades e Acesso

Os novos modelos são apresentados com capacidades distintas. O Opus 4, o mais robusto da dupla, é descrito como capaz de manter um “esforço focado” através de múltiplos passos em um fluxo de trabalho. Já o Sonnet 4, projetado para substituir diretamente o Sonnet 3.7, apresenta melhorias em codificação e matemática, além de seguir instruções com maior precisão.

O acesso aos modelos será diferenciado: usuários da versão gratuita e paga do chatbot da empresa terão acesso ao Sonnet 4, enquanto o Opus 4 será exclusivo para usuários pagantes. Para desenvolvedores que utilizam a API da Anthropic, disponível através da plataforma Bedrock da Amazon e da Vertex AI do Google, os custos serão:

  • Opus 4: $15 por milhão de tokens de entrada e $75 por milhão de tokens de saída.
  • Sonnet 4: $3 por milhão de tokens de entrada e $15 por milhão de tokens de saída.

Para referência, um milhão de tokens equivale a aproximadamente 750.000 palavras.

Estratégia Ambiciosa em um Mercado Competitivo

O lançamento da família Claude 4 ocorre em um momento em que a Anthropic busca um crescimento substancial de receita, com projeções ambiciosas para os próximos anos. A empresa, fundada por ex-pesquisadores da OpenAI, recentemente fortaleceu seu caixa com investimentos significativos, incluindo aportes da Amazon, visando cobrir os altos custos de desenvolvimento de modelos de IA de ponta.

A competição no setor de IA é acirrada, com rivais como OpenAI e Google constantemente lançando modelos e ferramentas de desenvolvimento cada vez mais poderosos.

Avanços Notáveis e Segurança

A família Claude 4 também é menos propensa ao “reward hacking” (quando modelos encontram atalhos para completar tarefas, comprometendo a qualidade), segundo a Anthropic. Embora os novos modelos demonstrem performance de ponta em diversos benchmarks, como o SWE-bench Verified para habilidades de codificação (superando o Gemini 2.5 Pro do Google e o o3 e GPT-4.1 da OpenAI), eles não lideram em todas as avaliações, como o MMMU (multimodal) ou GPQA Diamond (perguntas de nível PhD).

Devido à sua capacidade avançada, o Opus 4 será lançado com salvaguardas mais rigorosas, incluindo detectores de conteúdo prejudicial e defesas de cibersegurança aprimoradas. A Anthropic reconhece que testes internos indicaram que o Opus 4 poderia “aumentar substancialmente” a capacidade de indivíduos com formação em STEM para obter, produzir ou implantar armas químicas, biológicas ou nucleares, atingindo a especificação “ASL-3” da empresa.

Modelos Híbridos com Raciocínio Aprimorado

Tanto o Opus 4 quanto o Sonnet 4 são descritos como modelos “híbridos”, capazes de fornecer respostas quase instantâneas e, ao mesmo tempo, realizar um “pensamento estendido” para um raciocínio mais profundo. Quando o modo de raciocínio é ativado, os modelos dedicam mais tempo para considerar soluções antes de responder, exibindo um resumo “amigável ao usuário” de seu processo de pensamento. A empresa admite que a exibição completa do processo é parcialmente omitida para proteger “vantagens competitivas”, conforme mencionado em um rascunho de postagem de blog fornecido ao IAFeed.

Esses modelos podem utilizar múltiplas ferramentas, como motores de busca, em paralelo e alternar entre raciocínio e o uso dessas ferramentas para melhorar a qualidade de suas respostas. Eles também podem extrair e salvar fatos em uma “memória”, construindo o que a Anthropic descreve como “conhecimento tácito” ao longo do tempo.

Claude Code: Mais Poder para Desenvolvedores

Para tornar os modelos ainda mais amigáveis aos programadores, a Anthropic está lançando atualizações para o Claude Code. Essa ferramenta, que permite aos desenvolvedores executar tarefas específicas através dos modelos da Anthropic diretamente de um terminal, agora se integra com IDEs populares e oferece um SDK para conexão com aplicativos de terceiros.

O SDK do Claude Code possibilita a execução do Claude Code como um subprocesso em sistemas operacionais compatíveis, abrindo caminho para a criação de assistentes de codificação e ferramentas baseadas em IA que aproveitam as capacidades dos modelos Claude. Já foram lançadas extensões e conectores para VS Code da Microsoft, JetBrains e GitHub. O conector do GitHub, por exemplo, permite que os desenvolvedores usem o Claude Code para responder a feedback de revisores e tentar corrigir erros ou modificar código automaticamente.

O Futuro da IA na Programação

Apesar dos avanços, os modelos de IA ainda enfrentam desafios para gerar software de alta qualidade sem introduzir vulnerabilidades ou erros. No entanto, a promessa de aumentar a produtividade na codificação está impulsionando uma rápida adoção dessas tecnologias por empresas e desenvolvedores.

Ciente disso, a Anthropic promete atualizações de modelo mais frequentes. “Estamos […] mudando para atualizações de modelo mais frequentes, entregando um fluxo constante de melhorias que trazem capacidades inovadoras aos clientes mais rapidamente”, escreveu a startup. “Essa abordagem mantém você na vanguarda enquanto refinamos e aprimoramos continuamente nossos modelos.”

Read more

Local News