GPT-5.5 supera Mythos em exploração cibernética, diz instituto

GPT-5.5 supera Mythos em exploração cibernética, diz instituto

O problema real não é o Mythos

Você lembra do Mythos? Aquele modelo da Anthropic que, segundo eles, era tão perigoso que precisava ser mantido em segredo? Pois o AI Security Institute (AISI) acabou de testar o GPT-5.5 da OpenAI e os resultados colocam essa narrativa em xeque. O GPT-5.5 não só igualou o Mythos em tarefas complexas de exploração cibernética como o superou em métricas agregadas. A pergunta que fica: o pânico era marketing ou realmente subestimamos o que um modelo de fronteira pode fazer?

O Fato

O AISI publicou uma avaliação das capacidades cibernéticas do GPT-5.5. O modelo completou o desafio TLO (uma tarefa de exploração de ponta a ponta) em 2 de 10 tentativas, contra 3 de 10 do Mythos Preview. Mas nas tarefas de nível especializado, o GPT-5.5 atingiu 71.4% de taxa de aprovação média, contra 68.6% do Mythos, 52.4% do GPT-5.4 e 48.6% do Opus 4.7. Nas palavras do instituto: GPT-5.5 pode ser o modelo mais forte que testamos.

Como Funciona (Visão de Operador)

Para quem está acostumado a lidar com APIs de linguagem, o desempenho em tarefas cibernéticas não é mágica. O TLO, por exemplo, exige que o modelo encadeie ações como reconhecimento, exploração de vulnerabilidades e execução de payload. Isso significa que o GPT-5.5 provavelmente foi treinado com dados que incluem sequências longas de raciocínio técnico, talvez com técnicas de chain-of-thought e fine-tuning focado em segurança ofensiva. A latência para esses casos deve ser alta, já que o modelo precisa gerar múltiplos passos. Não temos custo por token divulgado, mas é seguro assumir que o GPT-5.5 é mais caro que versões anteriores, especialmente em modo de raciocínio estendido. O AISI não especificou a arquitetura, mas a consistência nas respostas sugere que a OpenAI otimizou o alinhamento para tarefas de nicho, o que pode aumentar o risco de usos maliciosos.

O Que Isso Muda na Prática

Primeiro, para equipes de segurança: você precisa atualizar seus testes de penetração. Se o GPT-5.5 está disponível via API (mesmo que restrita), ele pode ser usado para automatizar ataques que antes exigiam habilidades humanas raras. Segundo, para desenvolvedores de aplicações: cuidado ao expor o modelo a prompts que envolvam comandos de rede ou sistemas – um jailbreak bem-feito pode transformar seu assistente em uma ferramenta de ataque. Terceiro, para executivos: o Mythos não é mais a preocupação exclusiva; o GPT-5.5 está no mesmo patamar, e talvez mais acessível. Uma ação prática imediata: revisar as políticas de uso da API para detectar padrões de requisições que lembrem exploração cibernética (e.g., sequências de comandos, tentativas de escalonamento de privilégios). Ferramentas de monitoramento de tráfego de API precisam incorporar esses novos vetores.

Tensão / Reflexão

Agora, a parte desconfortável. O AISI é um órgão governamental, mas seu teste é público. Ao divulgar que o GPT-5.5 é excelente em exploração, eles estão essencialmente dando um manual para quem quiser usar o modelo para o mal. Isso escala? Duvido que a OpenAI vá disponibilizar acesso irrestrito, mas vazamentos ou contas comprometidas são riscos reais. O custo compensa? Para um atacante, sim: pagar alguns dólares para ter um especialista em segurança virtual 24h é barato comparado a salários humanos. Resolve o problema de segurança ou só move o gargalo? Antes o gargalo era treinar um modelo ofensivo; agora é controlar o acesso a ele. Não me parece que a indústria esteja preparada para isso.

Conclusão

O GPT-5.5 não é apenas um modelo de linguagem; é uma ferramenta cibernética de alto nível. O instituto jogou luz sobre um fato que muitos preferiam ignorar: os modelos de fronteira já são armas, e a diferença entre defesa e ataque é só uma permissão de API. Você já revisou suas credenciais hoje?

Compartilhe este artigo

Comentários (0)

Nenhum comentário ainda. Seja o primeiro a comentar!

Deixe seu comentário