Alibaba Lança Qwen 3: Nova Geração de IA Promete Superar Modelos Ocidentais
A gigante chinesa de tecnologia Alibaba apresentou nesta segunda-feira sua mais recente inovação no campo da inteligência artificial: a família de modelos Qwen 3. A empresa afirma que seus novos modelos não apenas rivalizam, mas em alguns casos superam o desempenho dos principais modelos disponíveis de potências ocidentais como Google e OpenAI.
Modelos Abertos e Poderosos
Uma parte significativa da família Qwen 3 está, ou estará em breve, disponível para download em plataformas populares como Hugging Face e GitHub, sob uma licença "aberta". A série abrange uma vasta gama de complexidade, com modelos variando de 0.6 bilhão a 235 bilhões de parâmetros.
- Parâmetros são um indicador aproximado da capacidade de resolução de problemas de um modelo.
- Modelos com mais parâmetros geralmente apresentam melhor desempenho.
Esta iniciativa de código aberto da Alibaba, juntamente com outras séries de modelos originadas na China, intensifica a pressão sobre laboratórios americanos como a OpenAI para acelerarem o desenvolvimento de tecnologias de IA mais capazes. Essa ascensão também motivou restrições políticas visando limitar o acesso de empresas chinesas aos chips essenciais para o treinamento desses modelos avançados.
Capacidade Híbrida e Desempenho
Segundo a Alibaba, os modelos Qwen 3 são "híbridos", capazes tanto de dedicar tempo para "raciocinar" sobre problemas complexos quanto de fornecer respostas rápidas para solicitações mais simples. Essa capacidade de raciocínio permite uma espécie de auto-verificação, similar a modelos como o o3 da OpenAI, embora possa implicar uma latência maior.
"Integramos perfeitamente os modos de pensamento e não-pensamento, oferecendo aos usuários a flexibilidade de controlar o orçamento de pensamento," escreveu a equipe Qwen em um post de blog.
Os modelos Qwen 3 suportam 119 idiomas e foram treinados com um impressionante conjunto de dados de quase 36 trilhões de tokens (onde 1 milhão de tokens equivale a cerca de 750.000 palavras), incluindo livros didáticos, pares de perguntas e respostas, trechos de código e mais.
Superando Benchmarks
A Alibaba destaca que essas melhorias impulsionaram significativamente o desempenho do Qwen 3 em relação ao seu antecessor, Qwen 2. Em plataformas de competição de programação como a Codeforces, o maior modelo da série, Qwen-3-235B-A22B (ainda não disponível publicamente), superou o o3-mini da OpenAI. Ele também obteve melhores resultados em benchmarks desafiadores de matemática (AIME) e raciocínio (BFCL).
Embora o modelo mais potente ainda não esteja acessível ao público, o Qwen3-32B, o maior modelo público da série, demonstra competitividade contra vários modelos proprietários e abertos, incluindo o R1 do laboratório chinês DeepSeek e superando o modelo o1 da OpenAI em testes como o benchmark de precisão LiveBench.
Além disso, a Alibaba afirma que o Qwen 3 se destaca em capacidades de "tool-calling" (uso de ferramentas externas), seguimento de instruções e replicação de formatos de dados específicos.
Disponibilidade
Além do download direto, os modelos Qwen 3 estão sendo disponibilizados através de provedores de nuvem como Fireworks AI e Hyperbolic.
O lançamento do Qwen 3 marca mais um passo significativo na evolução da inteligência artificial global, evidenciando a crescente capacidade tecnológica da China e acirrando a competição no desenvolvimento dos modelos de linguagem mais avançados do mundo.