Artigos de Filippe Barreto Sims — Página 21 | IA Feed

Inteligência Artificial 28/05/2026

MiniMax-M2: 9,8B ativos contra 229,9B totais?

MoE com ativação mínima promete inteligência máxima em agentes. Entenda a arquitetura, o sistema de RL Forge e o que isso muda na prática.

Ler mais

Notícias 28/05/2026

3.000 tokens/s em GPUs padrão: o novo limite da inferência de LLM?

Kog AI alcança 3.000 tokens/s por requisição em GPUs AMD e NVIDIA com seu Kog Inference Engine. O que isso muda para agentes de IA e aplicações em tempo real?

Ler mais

Ética em IA 28/05/2026

Claude Opus 4.8: menos confiança cega, mais honestidade ao errar

Anthropic lança o Claude Opus 4.8 com foco em honestidade: o modelo sinaliza incertezas e reduz afirmações sem base. Controle de esforço e workflows dinâmicos.

Ler mais

Ética em IA 28/05/2026

Laguna M.1 e XS.2: MoEs gigantes para codificação agêntica

Novos modelos MoE para codificação agêntica: Laguna M.1 (225B) e XS.2 (33B). Saiba como funcionam e o que mudam na prática.

Ler mais

Ferramentas de IA 28/05/2026

Bolsa de futuros de tokens de IA: o novo mercado de derivativos

Enquanto CME e ICE lançam futuros de GPU, Xangai projeta derivativos baseados em tokens de IA. Hedge para custo de computação?

Ler mais

Ética em IA 28/05/2026

US$65 bilhões na Anthropic: a aposta no Claude e no IPO

Anthropic levanta US$65 bilhões valuation pós-money de US$965 bi, mostra Claude Opus 4.8 e mira IPO. O que isso muda no custo de inferência e na briga por escala?

Ler mais

Ética em IA 28/05/2026

Anthropic Opus 4.8: o modelo que aprendeu a apontar as próprias falhas

Opus 4.8 chega 41 dias após a versão anterior, focando em sinalizar incertezas. Dynamic Workflows e melhorias em codebase. A pressa tem razão de ser.

Ler mais

Notícias 28/05/2026

O enterprise não quebrou. Suas suposições sobre ele, sim.

Empresas não rejeitam IA, rejeitam instabilidade operacional. Entenda por que pilotos brilham mas deployments morrem, e como construir IA que escala no enterprise sem criar caos.

Ler mais

Ética em IA 28/05/2026

Sesame AI Conversa Fluida: Custo e Latência em Paralelo

Sesame lança app iOS com agentes que falam e pesquisam em paralelo. Como funciona a busca durante a fala e o que isso custa em termos de latência e arquitetura.

Ler mais

Filippe Barreto Sims

Publicações de Filippe Barreto Sims

MiniMax-M2: 9,8B ativos contra 229,9B totais?

3.000 tokens/s em GPUs padrão: o novo limite da inferência de LLM?

Claude Opus 4.8: menos confiança cega, mais honestidade ao errar

Laguna M.1 e XS.2: MoEs gigantes para codificação agêntica

Bolsa de futuros de tokens de IA: o novo mercado de derivativos

US$65 bilhões na Anthropic: a aposta no Claude e no IPO

Anthropic Opus 4.8: o modelo que aprendeu a apontar as próprias falhas

O enterprise não quebrou. Suas suposições sobre ele, sim.

Sesame AI Conversa Fluida: Custo e Latência em Paralelo