Mais publicações
Sesame AI Conversa Fluida: Custo e Latência em Paralelo
Sesame lança app iOS com agentes que falam e pesquisam em paralelo. Como funciona a busca durante a fala e o que isso custa em termos de latência e arquitetura.
Ler mais
Contrato de Computação: Musk Diz 180 Dias, SEC Diz 3 Anos
Musk afirma que o aluguel do cluster Colossus para a Anthropic é de 180 dias, mas o SEC filing da SpaceX mostra compromisso até 2029. Análise do impasse e implicações.
Ler mais
Replit e Visa: o custo real dos pagamentos com agentes de IA
Visa investe no Replit e integra protocolo de pagamentos para agentes de IA. Análise técnica do custo real, latência e dependência de infraestrutura. O que muda para quem constrói agentes.
Ler mais
IA para podcasts: YouTube testa recomendação e velocidade adaptativa
YouTube Premium ganha curadoria por IA e ajuste inteligente de velocidade. Análise dos novos recursos e impacto para criadores e ouvintes.
Ler mais
Apple usa Gemini no Siri: atalho ou dependência?
Novos vazamentos mostram Siri redesenhadado com Dynamic Island e app próprio. Apple terceiriza IA com Gemini, mas escala de 2,5 bi de dispositivos pesa.
Ler mais
RSI: A corrida da IA que se autoaperfeiçoa e o que falta
Apesar do hype, a Recursive Self-Improvement (RSI) ainda é distante. O que os laboratórios estão fazendo e por que o salto não é trivial.
Ler mais
Inferência: 700 tok/s com chips SambaNova, a aposta da General Compute
A neocloud General Compute levantou US$15M para usar chips SambaNova, prometendo 700 tokens/s em inferência. O que isso muda no custo e na latência para quem constrói com IA?
Ler mais