Aluguel de GPU bateu US$ 1.000/hora – o que está acontecendo?

Aluguel de GPU bateu US$ 1.000/hora – o que está acontecendo?

Se você tentou alugar uma GPU nos últimos dias, provavelmente levou um susto. Na Vast, mithril e até na Runpod, os preços dispararam. H100, H200, B200 – tudo acima de US$ 1.000 por hora. Para quem está acostumado a rodar experimentos por alguns dólares, a conta simplesmente não fecha. O que está rolando?

O Fato

Usuários da comunidade LocalLLaMA reportaram que, pela primeira vez, GPUs de servidor como B200 e H100 estão custando mais de US$ 1.000/hora em múltiplas plataformas simultaneamente. A oferta de GPUs abaixo de B200 praticamente sumiu da Vast. Até mesmo a mithril, conhecida por preços competitivos, está com valores nas alturas. Acadêmicos e startups que dependem de aluguel de GPU para treinar modelos estão sendo forçados a pausar projetos.

Como Funciona (Visão de Operador)

O aluguel de GPU funciona como um mercado spot: provedores como Vast, Runpod e Lambda Labs oferecem capacidade ociosa de datacenters. O preço sobe quando a demanda supera a oferta. O que vemos agora é uma tempestade perfeita: empresas de grande porte (provavelmente as big techs) estão alocando clusters enormes para treinar modelos de última geração, consumindo toda a capacidade disponível. Some a isso a escassez global de chips avançados e o ciclo de upgrade para Blackwell (B200), que reduz a oferta de GPUs mais antigas. O resultado é um pico de preços que lembra um ataque de DDoS no seu bolso.

O Que Isso Muda na Prática

Quem ganha? Provedores de nuvem como AWS, Azure e GCP, que têm contratos de longo prazo e não estão expostos ao mercado spot. Quem perde? Startups bootstrapped, pesquisadores independentes e pequenos estúdios de IA generativa. A ação prática imediata: considere comprar hardware próprio se você tem previsibilidade de uso. Ou, se for treinar modelos menores, mude para GPUs de consumo (RTX 4090, por exemplo) em configurações multi-GPU – o custo por hora é bem menor. Outra saída: use serviços serverless que cobram por token, como Replicate ou Together, mas fique de olho nas taxas.

Tensão / Reflexão

Isso escala? Duvido. A demanda atual é sazonal e deve arrefecer quando os grandes players concluírem seus treinos. Mas o sinal de alarme é claro: o mercado de GPU spot é volátil e depende de cadeias de suprimento frágeis. O custo compensa? Para um protótipo, talvez não. Para produção, você precisa de previsibilidade. E a dúvida que fica: será que a computação em nuvem para IA está se tornando um luxo de poucos?

Conclusão

O aluguel de GPU virou um termômetro do aquecimento do setor. Se você está treinando modelos, repense sua estratégia de computação agora, antes que o próximo pico chegue. E a pergunta que fica: até onde vamos empurrar o limite antes que o hardware pare de acompanhar? Fonte original

Compartilhe este artigo

Comentários (0)

Nenhum comentário ainda. Seja o primeiro a comentar!

Deixe seu comentário