DeepSeek: A Revolução Chinesa na Inteligência Artificial que Alerta o Ocidente

Share

Uma nova força emergiu no cenário da inteligência artificial, capturando a atenção global e redefinindo as dinâmicas do setor. O laboratório chinês de IA, DeepSeek, tornou-se um nome conhecido quase da noite para o dia, especialmente após seu aplicativo de chatbot alcançar o topo das paradas na Apple App Store e no Google Play, um feito notável que levantou discussões acaloradas.

Os modelos de IA da DeepSeek, desenvolvidos com foco em técnicas de computação eficientes, levaram analistas de Wall Street e tecnólogos a questionar a manutenção da liderança dos EUA na corrida pela IA e a sustentabilidade da demanda por chips de IA. Mas de onde surgiu a DeepSeek e como alcançou fama internacional tão rapidamente?

As Origens da DeepSeek: Do Mercado Financeiro à Vanguarda da IA

A DeepSeek é apoiada pela High-Flyer Capital Management, um fundo de hedge quantitativo chinês que utiliza IA para embasar suas decisões de investimento. Liang Wenfeng, um entusiasta da IA, cofundou a High-Flyer em 2015, lançando-a como um fundo de hedge em 2019, focado no desenvolvimento e implantação de algoritmos de IA.

Em 2023, a High-Flyer iniciou a DeepSeek como um laboratório dedicado à pesquisa de ferramentas de IA, separadamente de seus negócios financeiros. Com a High-Flyer como um de seus investidores, o laboratório se transformou em sua própria empresa, também chamada DeepSeek.

Desde o início, a DeepSeek construiu seus próprios clusters de data centers para treinamento de modelos. No entanto, como outras empresas de IA na China, a DeepSeek foi afetada pelas proibições de exportação de hardware dos EUA. Para treinar um de seus modelos mais recentes, a empresa foi forçada a usar chips Nvidia H800, uma versão menos potente do chip H100 disponível para empresas americanas.

A equipe técnica da DeepSeek é predominantemente jovem, com a empresa recrutando agressivamente pesquisadores de doutorado em IA das principais universidades chinesas. Curiosamente, a DeepSeek também contrata pessoas sem formação em ciência da computação para ajudar sua tecnologia a compreender uma gama mais ampla de assuntos, conforme relatado pelo The New York Times.

Modelos Poderosos e Disruptivos

A DeepSeek revelou seus primeiros modelos — DeepSeek Coder, DeepSeek LLM e DeepSeek Chat — em novembro de 2023. Contudo, foi na primavera seguinte, com o lançamento da família de modelos DeepSeek-V2, que a indústria de IA realmente começou a prestar atenção.

O DeepSeek-V2, um sistema de análise de texto e imagem de propósito geral, demonstrou excelente desempenho em vários benchmarks de IA e era significativamente mais barato de operar do que modelos comparáveis na época. Isso forçou concorrentes domésticos da DeepSeek, incluindo ByteDance e Alibaba, a cortar os preços de uso de alguns de seus modelos e tornar outros totalmente gratuitos.

O DeepSeek-V3, lançado em dezembro de 2024, apenas aumentou a notoriedade da DeepSeek. De acordo com testes internos, o DeepSeek V3 supera tanto modelos de código aberto disponíveis para download, como o Llama da Meta, quanto modelos “fechados” acessíveis apenas por API, como o GPT-4o da OpenAI.

Igualmente impressionante é o modelo de “raciocínio” R1 da DeepSeek. Lançado em janeiro, a DeepSeek afirma que o R1 tem um desempenho tão bom quanto o modelo o1 da OpenAI em benchmarks importantes. Sendo um modelo de raciocínio, o R1 efetivamente verifica seus próprios fatos, o que o ajuda a evitar algumas das armadilhas que normalmente confundem outros modelos. Embora levem um pouco mais de tempo para chegar a soluções, os modelos de raciocínio tendem a ser mais confiáveis em domínios como física, ciência e matemática.

No entanto, há uma ressalva importante para o R1, DeepSeek V3 e outros modelos da DeepSeek. Por serem desenvolvidos na China, estão sujeitos à avaliação pelo regulador de internet do país para garantir que suas respostas “incorporem os valores socialistas centrais”. No aplicativo de chatbot da DeepSeek, por exemplo, o R1 não responde a perguntas sobre a Praça Tiananmen ou a autonomia de Taiwan.

Estratégia de Mercado e Impacto Global

Em março, a DeepSeek ultrapassou 16,5 milhões de visitas, figurando em segundo lugar em visitas diárias, apesar de uma queda em relação a fevereiro, de acordo com David Carr, editor da Similarweb, em declaração ao IAFeed. Ainda assim, esses números são modestos em comparação com o ChatGPT, que ultrapassou 500 milhões de usuários ativos semanais em março.

O modelo de negócios da DeepSeek não é claro. A empresa precifica seus produtos e serviços bem abaixo do valor de mercado — e oferece outros gratuitamente. Também não está aceitando dinheiro de investidores, apesar do grande interesse de VCs. A DeepSeek atribui sua competitividade de custos extrema a avanços em eficiência, embora alguns especialistas contestem os números fornecidos pela empresa.

Independentemente disso, os desenvolvedores adotaram os modelos da DeepSeek, que, embora não sejam de código aberto no sentido comum, estão disponíveis sob licenças permissivas que permitem o uso comercial. Segundo Clem Delangue, CEO da Hugging Face, uma das plataformas que hospedam os modelos da DeepSeek, os desenvolvedores criaram mais de 500 modelos “derivados” do R1, que acumularam 2,5 milhões de downloads combinados.

Reações e Controvérsias

O sucesso da DeepSeek tem sido descrito tanto como “revolucionando a IA” quanto “superestimado”. O impacto da empresa foi parcialmente responsável pela queda de 18% no preço das ações da Nvidia em janeiro e provocou uma resposta pública do CEO da OpenAI, Sam Altman. Em março, departamentos do Comércio dos EUA informaram que a DeepSeek seria banida de seus dispositivos governamentais.

A Microsoft anunciou que a DeepSeek está disponível em seu serviço Azure AI Foundry. Questionado sobre o impacto da DeepSeek nos gastos com IA da Meta, o CEO Mark Zuckerberg afirmou que o investimento em infraestrutura de IA continuará sendo uma “vantagem estratégica” para a Meta. Em março, a OpenAI chamou a DeepSeek de “subsidiada pelo estado” e “controlada pelo estado”, recomendando que o governo dos EUA considerasse a proibição de modelos produzidos pela DeepSeek.

Durante a teleconferência de resultados do quarto trimestre da Nvidia, o CEO Jensen Huang enfatizou a “excelente inovação” da DeepSeek, afirmando que ela e outros modelos de “raciocínio” são ótimos para a Nvidia porque exigem muito mais computação.

Paralelamente, algumas empresas estão banindo a DeepSeek, assim como países inteiros, incluindo a Coreia do Sul, e governos como o do estado de Nova York, que proibiu o uso da DeepSeek em dispositivos governamentais. Em maio, o vice-presidente e presidente da Microsoft, Brad Smith, disse em uma audiência no Senado que os funcionários da Microsoft não estão autorizados a usar a DeepSeek devido a preocupações com segurança de dados e propaganda.

O Futuro Incerto

O futuro da DeepSeek permanece incerto. Melhorias nos modelos são esperadas, mas o governo dos EUA parece estar cada vez mais cauteloso com o que percebe como influência estrangeira prejudicial. Em março, o The Wall Street Journal relatou que os EUA provavelmente proibirão a DeepSeek em dispositivos governamentais.

Esta história, originalmente publicada em 28 de janeiro de 2025, será atualizada regularmente.

Read more

Local News