OpenRouter levanta US$ 113M: gateway de IA vale US$ 1,3 bi

OpenRouter captou US$ 113M e processa 100 trilhões de tokens por mês. O que isso significa para quem escolhe modelos de IA?

O problema que ninguém resolveu direito

Escolher o modelo de IA certo para cada tarefa ainda é um pesadelo de custo e latência. Você quer um modelo rápido para classificação de sentimento, mas precisa de um modelo mais pesado para gerar código complexo. Sem um gateway, você acaba pagando caro por modelo único ou reescrevendo integrações toda vez que troca de provedor. É aí que entra o OpenRouter.

O fato

OpenRouter, startup de gateway de modelos, anunciou uma rodada Série B de US$ 113 milhões liderada pela CapitalG, fundo da Alphabet. O valuation pós-money chegou a US$ 1,3 bilhão, mais que o dobro do valuation da Série A há um ano. A empresa processa hoje 100 trilhões de tokens por mês, um crescimento de 5x em seis meses. São 8 milhões de usuários globais e acesso a mais de 400 modelos.

Como funciona na prática

OpenRouter funciona como um roteador de inferência. Você envia uma requisição para a API deles, e o gateway decide qual modelo atende melhor com base em custo, latência e capacidade. A seleção pode ser explícita (você escolhe o modelo) ou automática (o sistema roteia para o modelo mais barato que atende aos requisitos de qualidade). Do ponto de vista de operador, isso resolve dois problemas: lock-in e otimização de custo. Você pode usar um modelo barato para tarefas simples e um caro para raciocínio profundo, tudo via uma única API. A latência adicional do roteamento é mínima, da ordem de milissegundos.

O que isso muda na prática

Quem ganha: times de engenharia que precisam de flexibilidade sem reescrever integrações. Quem perde: provedores que contavam com exclusividade e fixação de clientes. Ação prática: se você usa um único provedor hoje, avalie o custo de adicionar um gateway como o OpenRouter para balancear entre DeepSeek e Claude conforme a tarefa. O ganho de otimização de custo pode chegar a 40% em workloads mistos.

Tensão real

Mas isso escala? 100 trilhões de tokens é muito, mas o gargalo continua sendo a capacidade de inferência dos provedores. O gateway não resolve a escassez de GPUs, só redistribui a demanda. E o custo de operar essa camada? OpenRouter precisa cobrar uma margem sobre cada token. Em workloads de alto volume, essa margem pode corroer a economia que a troca de modelo proporciona. O custo real do gateway precisa ser calculado em cada cenário.

Fechamento

O futuro não é um modelo único. É um ecossistema de modelos trocáveis, e o gateway vira a camada invisível que decide qual motor usar. Se você ainda não pensou em como seu sistema vai escolher o modelo certo no momento certo, está atrasado. A OpenRouter mostrou que o mercado está disposto a pagar caro por essa orquestração.

O problema que ninguém resolveu direito

O fato

Como funciona na prática

O que isso muda na prática

Tensão real

Fechamento

Filippe Barreto Sims

Comentários

OpenRouter levanta US$ 113M: gateway de IA vale US$ 1,3 bi

O problema que ninguém resolveu direito

O fato

Como funciona na prática

O que isso muda na prática

Tensão real

Fechamento

Filippe Barreto Sims

Continue lendo

Bun troca Zig por Rust com IA: 1 milhão de linhas em 11 dias

Claude Tag: Anthropic no Slack gera 65% do código interno

Corte 70% da sua conta de API LLM sem alterar uma linha de código

Comentários