a

Filippe Barreto Sims

Autor contribuidor em nosso blog.

Publicações de Filippe Barreto Sims

2.5x mais rápido: Qwen3-27B com MTP bate recorde de desempenho local
Inteligência Artificial 07/05/2026

2.5x mais rápido: Qwen3-27B com MTP bate recorde de desempenho local

Engenheiro consegue 2.5x de throughput no Qwen3-27B usando Multi-Token Prediction com GGUF quantizado e PR não-mergeado do llama.cpp.

Ler mais
SubQ: contexto de 12M tokens com custo sub-quadrático?
Inteligência Artificial 07/05/2026

SubQ: contexto de 12M tokens com custo sub-quadrático?

SubQ promete LLM com 12 milhões de tokens de contexto usando atenção sub-quadrática. Analisamos a arquitetura, ganhos reais e os gargalos de memória que ainda p

Ler mais
Shopify revela plano de IA para 2026: token ilimitado e ferramentas internas
Ética em IA 07/05/2026

Shopify revela plano de IA para 2026: token ilimitado e ferramentas internas

Shopify CTO detalha explosão de uso de IA em 2026, token ilimitado e ferramentas como Tangle e SimGym. Dados reais de adoção dentro da empresa.

Ler mais
ClinicBot: RAG com citações verificáveis para diagnósticos médicos
Visão Computacional 07/05/2026

ClinicBot: RAG com citações verificáveis para diagnósticos médicos

ClinicBot usa RAG com evidência hierárquica e citações para reduzir alucinações em diagnósticos. Entenda como isso muda a prática clínica.

Ler mais
Telefone da OpenAI chega antes do previsto?
Notícias 07/05/2026

Telefone da OpenAI chega antes do previsto?

OpenAI acelera desenvolvimento de telefone com IA integrada. Saiba o que esperar do dispositivo que promete mudar a forma como interagimos com assistentes.

Ler mais
Transformer 2.0: o que mudou na arquitetura que domina LLMs
Ética em IA 07/05/2026

Transformer 2.0: o que mudou na arquitetura que domina LLMs

Lilian Weng atualizou seu clássico artigo sobre a família Transformer, incorporando três anos de avanços em arquiteturas de atenção, eficiência e escalabilidade

Ler mais
xAI vende computação para Anthropic: neocloud ou recuo?
Ética em IA 06/05/2026

xAI vende computação para Anthropic: neocloud ou recuo?

A xAI alugou 300MW do seu datacenter Colossus para a Anthropic. O movimento sinaliza que a empresa de Musk pode estar virando uma revendedora de GPUs, em vez de focar em seus próprios modelos e softwares.

Ler mais
Snap e Perplexity: fim do acordo de US$ 400 milhões
Notícias 06/05/2026

Snap e Perplexity: fim do acordo de US$ 400 milhões

Snap encerrou o acordo com Perplexity que traria busca conversacional ao Snapchat. Sem receita prevista, o que muda para quem usa ou desenvolve com IA? Análise técnica.

Ler mais
Ataques adversários em LLMs: como quebrar a segurança de propósito
Ética em IA 06/05/2026

Ataques adversários em LLMs: como quebrar a segurança de propósito

Entenda como jailbreaks e ataques adversários exploram vulnerabilidades em LLMs, e o que isso significa para quem desenvolve e usa esses modelos.

Ler mais