US$6 bi em CPUs: o que muda no custo de inferência com Snowflake e AWS

US$6 bi em CPUs: o que muda no custo de inferência com Snowflake e AWS

O problema do custo de inferência

Se você roda modelos de linguagem em produção, sabe que o custo de inferência assombra qualquer projeto. Para quem usa Snowflake como data warehouse, a conta chega via armazenamento e processamento. Agora, com o novo acordo de US$6 bilhões entre Snowflake e AWS, a conta pode mudar de figura.

O fato

Snowflake fechou um contrato de cinco anos com a AWS, focado em acesso aos chips Graviton, CPUs ARM proprietárias da Amazon. O valor total do acordo é de US$6 bilhões. Para efeito de comparação, desde 2012 a Snowflake vendeu US$7 bilhões em serviços via AWS Marketplace. Quase o mesmo valor de todo o histórico em um só contrato.

O que está impulsionando esse gasto acelerado? A inteligência artificial. A Snowflake oferece o Cortex AI, ferramenta que permite consultas em linguagem natural, resumos e outras tarefas diretamente sobre os dados armazenados. E a demanda por processamento de IA está dobrando: em 2025, o gasto dos clientes Snowflake na AWS chegou a US$2 bilhões em um ano.

Como funciona (visão de operador)

O Graviton é um chip ARM desenvolvido pela AWS, focado em eficiência energética e custo por transação. Diferente das GPUs da Nvidia, que são projetadas para treinamento e inferência de modelos grandes, os CPUs como Graviton lidam melhor com tarefas de orquestração, pré e pós-processamento, e agentes de IA que exigem baixa latência e muitos requests simultâneos.

Quando você usa Snowflake com Cortex AI, a maior parte do trabalho de inferência pode ser alocada em CPUs Graviton, especialmente para modelos menores ou tarefas de RAG (Retrieval Augmented Generation). O custo por token pode cair significativamente. A AWS afirma que seus chips próprios oferecem melhor relação custo-desempenho que Nvidia, embora ainda dependa das GPUs Nvidia para cargas pesadas.

Na prática, isso significa que para cenários de agentes de IA, fine-tuning leve e consultas em linguagem natural, o Graviton pode ser o caminho mais barato. A Snowflake está basicamente apostando em uma arquitetura que separa o que pede GPU do que pode rodar em CPU, otimizando o custo total.

O que isso muda na prática

Quem ganha: Empresas que já usam Snowflake e querem reduzir o custo de inferência sem migrar para outro provedor. Também ganha a AWS, que fortalece seu ecossistema de chips próprios e atrai contratos bilionários.

Quem perde: Nvidia, que vê uma fatia do mercado de inferência em CPU ser tomada por alternativas mais baratas. Também perdem provedores de nuvem concorrentes, como Google Cloud e Azure, que podem ver clientes Snowflake migrarem mais carga para AWS.

Ação prática: Se você utiliza Snowflake, comece a revisar suas consultas e pipelines de IA. Identifique quais tarefas podem ser executadas em CPUs Graviton em vez de GPUs. A Snowflake já oferece suporte a isso via Cortex AI. Teste o custo por query antes e depois da migração. Se não usar Snowflake, vale monitorar como o preço do Cortex AI muda com esse acordo.

Tensão e reflexão

Mas será que essa mudança realmente escala? A AWS está vendendo Graviton como alternativa, mas a dependência de Nvidia para treinamento e inferência de modelos gigantes continua. O acordo com Meta, que também levou milhões de Graviton, mostra que até empresas com forte capacidade interna de IA estão optando por CPUs para redução de custos. Porém, a Nvidia já respondeu com a linha Vera, mirando um mercado de US$200 bilhões em CPUs para IA.

O risco de lock-in também aparece. Quanto mais você otimiza para Graviton, mais difícil migrar para outro provedor. A economia de curto prazo pode custar flexibilidade futura. Vale a pena? Depende da previsão de crescimento e da maturidade da sua stack.

Fechamento

O acordo Snowflake-AWS de US$6 bilhões sinaliza que a batalha por custo de inferência está esquentando. Para quem opera IA em produção, o recado é claro: CPUs de propósito específico estão chegando para ocupar um espaço que antes era exclusivo de GPUs. Teste, meça e decida se a troca faz sentido para sua conta. O mercado não espera.

Compartilhe este artigo

Comentários (0)

Nenhum comentário ainda. Seja o primeiro a comentar!

Deixe seu comentário