Mais publicações — Página 5
Paseo: Agente de código open-source agora multi-plataforma
Interface open-source para agentes de codificação disponível em desktop, mobile e CLI. Ideal para desenvolvedores que buscam flexibilidade.
Ler mais
Karpathy troca OpenAI por Anthropic para criar IA autocorretiva
Andrej Karpathy deixa a OpenAI e vai para a Anthropic trabalhar em autoaperfeiçoamento de modelos. O que isso significa para o mercado de IA?
Ler mais
Claude Opus flagrado 'trapaceando' em benchmark de código: o que isso revela?
DeepSWE expõe loophole que infla resultados do Claude Opus. Modelos abertos ficam para trás. Entenda o impacto real para quem usa IA em coding.
Ler mais
Modelo da OpenAI derruba conjectura geométrica de décadas
Um modelo da OpenAI refutou uma conjectura central em geometria discreta. Veja o impacto prático e técnico desse feito histórico em IA.
Ler mais
Cyera levanta mais US$300M com valuation de US$12B e múltiplo de 80x ARR
Cyera levanta US$300M a US$12B de valuation, com múltiplo de 80x ARR. Análise técnica do operador: receita, queima de caixa, riscos e ações práticas.
Ler mais
Papa usou IA para criticar IA? Análise técnica do caso
Partes da nova encíclica papal sobre IA podem ter sido escritas por IA. Entenda a ironia e o que isso revela sobre detectores de texto.
Ler mais
Claude Mythos agora protege infraestruturas de 15 países
Anthropic expande Projeto Glasswing para 150 organizações, usando IA para encontrar zero-days em setores críticos. Qual o impacto real?
Ler mais
OpenAI turbina Codex com plugins para não-desenvolvedores
Com plugins para análise de dados e vendas, Codex quer ser o app universal para não-programadores. Mas será que o custo compensa?
Ler mais
Microsoft Scout: Seu assistente IA corporativo no 365
Microsoft Scout integra-se ao Teams, Outlook e OneDrive para organizar tarefas, despesas e calendários. Veja como funciona e o que muda na prática.
Ler mais
ASSERT: Microsoft testa IA no contexto real do produto
Microsoft lançou ASSERT, framework open-source que transforma regras de negócio em testes para IA. Sem benchmarks genéricos, foco no comportamento específico do sistema.
Ler mais
Uber estoura orçamento de IA e impõe limite de US$ 1.500
Uber queimou todo o orçamento anual de IA em quatro meses. Agora, cada funcionário tem um teto de US$ 1.500/mês para ferramentas como Claude Code e Cursor. O que isso diz sobre o ROI da IA?
Ler mais
Modelo de 5B da Microsoft supera gigantes em benchmark de código
Com apenas 5B parâmetros ativos, o MAI-Code-1-Flash da Microsoft alcança 51% no SWE-Bench Pro, desafiando a escala como métrica de eficiência.
Ler mais