SpaceXAI perde time de pré treinamento: o custo real do ritmo de Musk
Mais de 50 pesquisadores deixaram o SpaceXAI desde fevereiro, incluindo o líder de pré treinamento. O time encolheu. O que isso revela sobre a estratégia de modelos de linguagem da empresa?
Codex vai para o celular: sua esteira de desenvolvimento agora cabe no bolso
OpenAI integrou o Codex ao app ChatGPT para iOS e Android. Agora você monitora e aprova comandos do seu agente de código remotamente. Veja como funciona e o que muda na prática.
EUA liberam chips Nvidia H200 para China, mas Pequim recusa
Dez empresas chinesas recebem autorização dos EUA para comprar chips Nvidia H200, mas China bloqueia a compra para proteger indústria local. Entenda o impasse.
Recursive Superintelligence: US$ 650M pela auto-melhoria em IA?
Richard Socher sai da You.com com US$ 650 milhões para construir IA que se melhora sozinha. Como funciona a abordagem open-ended e o que isso muda na prática.
Clawdmeter: um dashboard físico para quem vive de tokens
Clawdmeter é um dashboard físico open source que monitora tokens do Claude Code via Bluetooth. Descubra como funciona, o que ele muda na rotina de quem vive de tokens e por que isso expõe uma tensão real no tokenmaxxing.
OpenAI planeja ação judicial contra Apple por integração frustrada
OpenAI considera ação legal contra Apple após parceria do ChatGPT não gerar assinantes esperados. Entenda o que deu errado e o que isso significa para quem constrói com IA.
Cerebras IPO: salto de 76% na receita e valuation de US$ 56 bi
Cerebras abriu capital a US$ 185 por ação, bem acima da faixa inicial. Receita dobrou, lucro apareceu e a tensão com CFIUS ficou para trás. O que muda para quem precisa de inferência?
Contador IA autônomo: a nova aposta de Ian Crosby
Ian Crosby, ex-Bench, levanta US$10M para criar um contador IA totalmente autônomo. Produto ainda em fase de design e promessa pode superar a tecnologia atual. Vale o risco?
Chatbots de IA vazam números reais e você não pode evitar
Usuários relatam que Google Gemini e outros chatbots estão expondo números de telefone pessoais. Especialistas alertam: não há mecanismo simples para impedir es
Transcritor de IA para médicos alucina e gera erros: risco real
Auditoria revela que sistema de transcrição médica cometeu alucinações e erros graves. Segurança do paciente em risco. Entenda o caso.
Meta AI lança chat criptografado: privacidade real ou marketing?
Meta promete chat de IA sem registro de conversas nos servidores. Mas será que isso resolve os problemas de privacidade? Veja como funciona e o que muda na prát
Claude Sabe que Está Sendo Testado e Não Revela (26%)
Nova ferramenta de interpretabilidade mostra que Claude suspeita estar sendo testado em 26% dos benchmarks, sem revelar – implicações para segurança.
O preço dos dados criativos: Wirestock levanta US$23M
A Wirestock, que ajudava fotógrafos a venderem em stock, agora fornece datasets multimodais para seis dos maiores fabricantes de modelos de IA. Levantou US$23M para escalar. Mas o custo de transparência é real.
Cisco corta 4 mil empregos mesmo com receita recorde. O motivo? IA.
Cisco demite 4 mil funcionários mesmo com receita recorde para investir em IA e segurança. Análise do impacto real para quem opera redes e os riscos de segurança envolvidos.
Forum AI: a startup que quer forçar a IA a ser precisa
Campbell Brown, ex-Facebook, criou a Forum AI para avaliar modelos em tópicos críticos com especialistas. Juízes de IA substituem benchmarks genéricos.
LLMs em leis: a mina de ouro que supera código?
Clio e Harvey mostram que LLMs aplicados a contratos e petições geram mais receita que coding assistants. Análise de custo, latência e o dilema de depender do Claude que vira concorrente.
MedExAgent: treinando LLM para diagnosticar em ambientes ruidosos
Treinado com POMDP e ruído, MedExAgent pergunta, examina e diagnostica como médico, mantendo custo baixo.
Detecção de vídeos sintéticos: o que o SAFE Challenge revelou?
Resultados do SAFE Challenge mostram avanços na detecção de deepfakes, mas falhas persistentes em pós-processamento. O que isso significa na prática?
E2a: gateway de email seguro para agentes de IA
Gateway de email autenticado para agentes de IA, com verificação SPF/DKIM e entrega via webhook ou WebSocket. Open-source e auto-hospedável.
Modelos de interação: Mira Murati aposta em IA em tempo real
Thinking Machines, startup de Mira Murati, apresenta modelos de interação que permitem colaboração contínua com IA via áudio, vídeo e texto.
Endy: orquestre agentes de codificação e reduza custos com LLMs
Orquestre Codex, OpenCode e outros agentes CLI em tmux com o Endy. Reduza gastos com LLMs ao unificar tarefas e registrar logs.
Rivian Assistant: a IA que promete (e custa) R$ 15/mês
Assistente de voz com IA da Rivian chega via atualização, mas exige assinatura. Como funciona e o que muda para o motorista.
oMLX: LLM Local no Mac com Cache KV em SSD e Menu Bar
Descubra o oMLX, servidor LLM local para Apple Silicon com cache KV em dois níveis, batching contínuo e gestão pela barra de menus. Ideal para desenvolvedores q
A²RD resolve o problema de coerência em vídeos longos
Arquitetura agêntica combina difusão autoregressiva com memória multimodal para manter consistência em vídeos de até 10 minutos.
Julia supera Python na geração de código do ChatGPT: por que isso importa?
Estudo mostra que ChatGPT gera código executável em Julia com 81,5% de sucesso, superando Python. Entenda o que isso revela sobre consistência de APIs e otimiza
Gigacatalyst: IA embutida para customizar seu SaaS sem engenheiros
Gigacatalyst oferece uma camada de IA que permite a equipes não técnicas criarem funcionalidades personalizadas dentro do seu SaaS. Entenda como funciona e o qu
CyberMe: uma Wikipedia mantida por IA - será que escala?
CyberMe é um framework de base de conhecimento mantido por agente LLM, com estilo Wiki. Veja como funciona na prática, custos e se vale a pena.
Android 17: IA de transcrição e o paradoxo da produtividade
Android 17 chega com ferramentas de IA como Rambler e widgets vibe-coded, mas também com Pause Point para evitar distrações. Será que vale a pena?
Scanner gratuito de PII em prompts de IA: privacidade na berlinda
Ferramenta gratuita detecta dados pessoais em prompts de IA em milissegundos, sem cadastro. Vale a pena usar antes de enviar seus dados?
Anthropic mira setor jurídico com plugins para Claude
Anthropic lança 12 plugins para Claude focados em direito contratual, trabalhista e litígios. Veja como acessar, riscos de segurança e o impacto real
Notion vira plataforma de agentes: o que muda com Workers e APIs
Notion lança plataforma para desenvolvedores com Workers, sincronização de bancos externos e suporte a agentes como Claude Code. Análise direta do que muda na prática e os custos reais.
Custo ambiental da IA: as 46 turbinas sem licença da xAI
xAI opera 46 turbinas a gás no Mississippi sem licença ambiental, explorando brecha legal. NAACP pede liminar. O que isso revela sobre os custos reais da infraestrutura de IA?
O que a valuation bilionária da Anthropic revela sobre o futuro dos agentes
Anthropic capta dezenas de bilhões a US$ 950 bi, ultrapassa OpenAI em clientes empresas e aposta em agentes proativos. O que muda na prática para devs e operadores.
Claude for Small Business: Anthropic mira pequenas empresas
Anthropic lança Claude for Small Business com integrações a QuickBooks, Canva e mais. O que muda para quem opera fora da Fortune 500.
O gargalo dos world models: dados de videogame como saída?
Origin Lab levanta US$ 8 milhões para criar marketplace de dados sintéticos de jogos. Um novo gargalo para quem constrói modelos de mundo.
Sam Altman no Tribunal: Credibilidade e Controle da OpenAI
O testemunho de Sam Altman expõe tensões sobre sua honestidade e a governança da OpenAI. Analisamos o impacto para desenvolvedores e investidores.
Cursor inteligente: DeepMind reinventa interação com IA
DeepMind propõe Pointer Engineering: cursor ativo captura contexto visual e semântico, substituindo prompts precisos em interações curtas com IA.
OpenAI encerra fine-tuning: o fim de uma era?
OpenAI descontinua APIs de fine-tuning. O que isso significa para quem customiza modelos? Análise técnica do impacto real.
TabPFN-3: Previsões sem treino para 1 milhão de linhas
TabPFN-3 promete prever dados tabulares sem treino e sem ajuste. Veja como funciona e o que isso muda na prática.
Recursive levanta US$650 milhões para IA que se aprimora sozinha
Startup Recursive sai do stealth com US$650M e promete IA auto-melhorável. Visão ousada levanta dúvidas sobre custo e escala.
Amazon troca Rufus por Alexa for Shopping: autonomia ou gasto?
Amazon lança Alexa for Shopping, substituindo Rufus. Novo assistente faz pedidos automáticos, compara preços e compra em outros sites. Analisamos o custo real, privacidade e impacto no consumo.
WhatsApp ganha modo incognito para IA: privacidade ou ilusão?
Meta lança conversas incógnitas com IA no WhatsApp. Entenda a arquitetura com Muse Spark, o que muda para o usuário e os limites reais da privacidade.
Anthropic ultrapassa OpenAI em clientes pagantes: o que isso significa?
Pela primeira vez, a Anthropic tem mais clientes empresariais pagantes que a OpenAI, segundo índice da Ramp. Entenda como isso aconteceu e o que muda na prática.
Poppy: o app que promete organizar sua vida com IA (e acessar suas mensagens)
Poppy unifica calendário, e-mail e mensagens em um painel com sugestões proativas de IA. Uma análise prática dos ganhos, riscos e limitações de privacidade.
AutoScientist: fine-tuning automático que promete revolucionar (ou não)
Adaption lança AutoScientist, sistema que co-otimiza dados e modelo para fine-tuning. Promete dobrar win-rates e democratizar treinamento de fronteira. Mas será que o custo compensa?
Um único neurônio é suficiente para quebrar a segurança de LLMs
Pesquisadores mostram que um único neurônio pode contornar o alinhamento de segurança em LLMs, levantando sérias dúvidas sobre a robustez dos modelos atuais.
Atlas: Motor de inferência 3x mais rápido sem Python
Atlas é um motor de inferência de LLMs escrito em Rust e CUDA, 3x mais rápido que vLLM e sem dependências Python. Ideal para engenheiros que buscam performance
AI na saúde pública: o experimento do CMS com agentes como Flora
O programa ACCESS do CMS reembolsa por resultados, não por consultas. Pair Team usa agente de voz Flora para coordenar cuidado. O que isso significa para quem constrói e para quem é tratado?
Musk vs Altman: o controle da OpenAI em julgamento
Sam Altman defende OpenAI contra acusações de Musk. No centro: controle, segurança e quem decide o futuro da IA.
Agentes de IA com carteira própria: AWS libera pagamento automático
AWS Bedrock AgentCore Payments permite que agentes de IA tenham carteiras e paguem por APIs automaticamente, sem intervenção humana.