Você monitora os rankings de LLMs no OpenRouter para escolher o modelo ideal. De repente, um tal de Hy3 preview aparece no topo, superando Claude Opus 4.7 e GPT 5.5 por mais de 50% no uso de tokens. Ninguém sabe direito o que é. Nem o Google, nem o Hacker News, nem o Reddit têm respostas claras. Só o ranking.
O fato
O Hy3 preview é um modelo open-source lançado pela Tencent. No Hugging Face, a página é esparsa e os benchmarks são honestamente fracos em comparação com outros modelos chineses abertos. Mesmo assim, no OpenRouter, ele está consumindo mais tokens que qualquer outro modelo pago. E não é de graça: depois de um período promocional, o acesso agora é cobrado a $0.066 por milhão de tokens de entrada, mais barato que o DeepSeek V4 Flash ($0,10).
Como funciona – visão de operador
Pelo gráfico de uso, o Hy3 preview não tem nenhum pico artificial. O consumo é estável ao longo de semanas, o que sugere adoção orgânica ou um esquema muito caro para falsificar. A relação input/output é de 98% para 2% – basicamente, todo mundo está mandando prompts enormes e recebendo respostas curtas. Isso dica um caso de uso específico: tarefas de avaliação, classificação ou geração de dados sintéticos, onde o output não precisa ser criativo.
Na API, o Hy3 preview é servido por um único provedor: a SiliconFlow, de Singapura. Diferente de modelos como DeepSeek V4 Flash, que têm 13 provedores, o Hy3 tem só um. E a SiliconFlow tinha pouco tráfego até o Hy3 aparecer. Coincidência? Talvez não. A infraestrutura parece preparada para alto volume, com custo baixo.
O que isso muda na prática
Se você precisa de inferência em larga escala, com orçamento apertado e não exige raciocínio profundo, o Hy3 pode ser uma opção. Ele é rápido, barato e atende a tarefas repetitivas. Mas cuidado: a qualidade é mediana. Testes informais mostram que ele não chega perto de Claude ou GPT-5.5 em benchmarks.
Ação prática: Se você tem um pipeline de classificação de texto ou geração de dados sintéticos, experimente o Hy3 no OpenRouter. Compare o custo e o resultado com seu modelo atual. Pode valer a pena para tarefas que toleram respostas imperfeitas.
Tensão / Reflexão
O que está realmente impulsionando esse uso? Pode ser que o Hy3 tenha um nicho não documentado – talvez desempenhe bem em chinês ou em domínios específicos. Mas também pode ser que agentes de código estejam usando como padrão por ser barato, mesmo sem ser o melhor. A falta de transparência é um problema: sem benchmarks confiáveis, fica difícil justificar a adoção em produção. E se o modelo for descontinuado ou mudar de preço? A dependência de um único provedor traz risco.
Conclusão
O Hy3 preview é um lembrete de que rankings de LLMs escondem históricos de uso que nem sempre refletem qualidade. Ele resolve um problema de custo, mas não de precisão. A pergunta que fica: você está disposto a trocar desempenho por economia, ou prefere esperar para entender melhor o que está por trás desse modelo misterioso?
Nenhum comentário ainda. Seja o primeiro a comentar!
Deixe seu comentário