Mais publicações
Groq levanta US$ 650 mi para inferência: o custo de escalar sem Nvidia?
A Groq busca US$ 650 milhões para expandir seu neocloud de inferência, após acordo com Nvidia. Para quem opera modelos, o movimento levanta dúvidas sobre dependência e custo real.
Ler mais
Glossario de IA: o que voce precisa saber antes de construir
Entenda os termos tecnicos de IA que afetam custo, latencia e arquitetura. Um guia pratico para quem constroi ou usa modelos de linguagem.
Ler mais
Groq consegue US$ 650 milhões para expandir nuvem de inferência
Groq levanta US$ 650 milhões para expandir sua nuvem de inferência. Acordo com Nvidia e hardware próprio são a aposta para enfrentar o mercado dominado por inferência.
Ler mais
Devin levanta US$ 1 bi: o agente que já comita 89% do código
Devin, agente de IA da Cognition, levanta US$ 1 bi com valuation de US$ 26 bi. CEO diz que não substitui humanos, mas empresa já usa agente para 89% dos commits. O que isso muda para quem programa?
Ler mais
Alimentador com IA: 10 mil espécies, mas contagem falha
Testamos o Kiwibit Bird Feeder Pro com câmera 4K e IA para identificar pássaros. A precisão na espécie é boa, mas a contagem de visitas gera falsos positivos. Eis o que isso revela sobre edge AI e custo real.
Ler mais
O chip que resolve o gargalo de memória na inferência de IA
Startup XCENA levanta US$135M para levar computação para perto da DRAM, cortando o custo infernal de roteamento entre CPU, GPU e memória. Será que escala?
Ler mais
Glean chega a $300M e mostra que o contexto vale ouro
Glean atinge $300M de ARR com foco em contexto empresarial e economia de tokens. Análise do modelo de consumo e do valor do context graph.
Ler mais