Mais publicações
SubQ: contexto de 12M tokens com custo sub-quadrático?
SubQ promete LLM com 12 milhões de tokens de contexto usando atenção sub-quadrática. Analisamos a arquitetura, ganhos reais e os gargalos de memória que ainda p
Ler mais
Shopify revela plano de IA para 2026: token ilimitado e ferramentas internas
Shopify CTO detalha explosão de uso de IA em 2026, token ilimitado e ferramentas como Tangle e SimGym. Dados reais de adoção dentro da empresa.
Ler mais
ClinicBot: RAG com citações verificáveis para diagnósticos médicos
ClinicBot usa RAG com evidência hierárquica e citações para reduzir alucinações em diagnósticos. Entenda como isso muda a prática clínica.
Ler mais
Telefone da OpenAI chega antes do previsto?
OpenAI acelera desenvolvimento de telefone com IA integrada. Saiba o que esperar do dispositivo que promete mudar a forma como interagimos com assistentes.
Ler mais
Transformer 2.0: o que mudou na arquitetura que domina LLMs
Lilian Weng atualizou seu clássico artigo sobre a família Transformer, incorporando três anos de avanços em arquiteturas de atenção, eficiência e escalabilidade
Ler mais
xAI vende computação para Anthropic: neocloud ou recuo?
A xAI alugou 300MW do seu datacenter Colossus para a Anthropic. O movimento sinaliza que a empresa de Musk pode estar virando uma revendedora de GPUs, em vez de focar em seus próprios modelos e softwares.
Ler mais
Snap e Perplexity: fim do acordo de US$ 400 milhões
Snap encerrou o acordo com Perplexity que traria busca conversacional ao Snapchat. Sem receita prevista, o que muda para quem usa ou desenvolve com IA? Análise técnica.
Ler mais