GPT-5.5 supera Mythos em exploração cibernética, diz instituto
Testes do AI Security Institute mostram que GPT-5.5 supera Mythos em tarefas avançadas de exploração, levantando novas questões sobre segurança.
Prpack: empacote PRs em Markdown para revisão com LLM
Ferramenta CLI que gera um único arquivo Markdown com diff e código completo de uma PR, otimizado para revisão por LLMs como Claude e Cursor.
GPT-5.5 Instant: menos alucinação, mais personalização no ChatGPT
GPT-5.5 Instant se torna o modelo padrão do ChatGPT, prometendo respostas mais precisas e controle de personalização. O que muda para quem usa?
ChatGPT 5.5 Pro: pesquisa de PhD em 17 minutos sem ajuda humana
Medalhista Fields Timothy Gowers relata que o ChatGPT 5.5 Pro produziu pesquisa matemática de nível doutorado em menos de duas horas, sem qualquer orientação hu
Stage CLI: Revisar Código Gerado por IA Fica Mais Fácil
Ferramenta CLI gratuita organiza diffs de código gerado por IA em capítulos lógicos, facilitando a revisão antes do PR.
Pit: US$16M da a16z para automatizar backoffice sem juniores
Pit, startup sueca de enterprise AI, substitui engenheiros juniores por agentes e levanta seed de US$16M da a16z. Análise do modelo, custos reais e o que muda na prática.
GPT-5.5 Instant: o que muda na operação de IA
OpenAI lança GPT-5.5 Instant e System Card. Análise técnica de custo, latência e impacto prático para quem desenvolve com IA.
SAP compra Prior Labs: a aposta em IA para tabelas que os LLMs ignoram
SAP compra Prior Labs e investe US$1 bi em modelos tabulares. Ao mesmo tempo, bloqueia agentes não autorizados. Análise técnica do impacto para quem constrói e usa IA empresarial.
iFixAi: Diagnóstico open-source para saber se sua IA está desalinhada
Ferramenta gratuita executa 32 testes contra qualquer modelo para detectar fabricação, manipulação e engano. Ideal para quem desenvolve ou opera sistemas de IA.
Opus 4.6, GPT-5.3-Codex, Seedance 2.0: o que muda?
Análise técnica dos lançamentos Opus 4.6, GPT-5.3-Codex, Seedance 2.0 e GLM-5. O que funciona, o que custa caro e onde a corda arrebenta.
Codex da OpenAI: automação além do chat que vale o custo?
Codex promete automatizar tarefas e conectar ferramentas para gerar documentos e dashboards. Analisamos sua arquitetura, custos e se realmente escala.
Reduza contexto LLM em 95% para código com AST + BM25
Técnica de retrieval para código usando grafos derivados de AST e BM25 reduz contexto de 100K para 5K tokens. Saiba como funciona na prática.
Path-Lock Expert: a IA que para de pensar quando não deve
Nova arquitetura separa fisicamente os modos think e no-think em LLMs híbridos, reduzindo vazamento de raciocínio sem perder desempenho.
Meta Usa Movimentos de Mouse de Funcionários para Treinar IA
Meta anunciou que usará movimentos de mouse e teclas pressionadas por funcionários para treinar IA. Medida revela corrida por dados e levanta questões sobre privacidade no trabalho.
YouTube Expande Detecção de Deepfakes para Proteger Celebridades
YouTube expande tecnologia de detecção de deepfakes para proteger celebridades contra uso não autorizado de imagem por IA. Ferramenta identifica rostos simulados e permite remoção de conteúdo.