Uma nova força surgiu no cenário da inteligência artificial, vinda diretamente da China e abalando as estruturas do setor. O DeepSeek, um laboratório de IA chinês, tornou-se o centro das atenções globais recentemente, com seu aplicativo de chatbot alcançando o topo das paradas na Apple App Store e também no Google Play, gerando um intenso debate sobre o futuro da liderança tecnológica.
Origens: De Fundo de Hedge a Potência em IA
A trajetória do DeepSeek é, no mínimo, intrigante. A empresa tem suas raízes na High-Flyer Capital Management, um fundo de hedge quantitativo chinês que utiliza inteligência artificial para embasar suas decisões de investimento. Liang Wenfeng, um entusiasta da IA, cofundou a High-Flyer em 2015 e, em 2019, lançou-a como um fundo de hedge focado no desenvolvimento e implantação de algoritmos de IA.
Em 2023, a High-Flyer iniciou o DeepSeek como um laboratório dedicado à pesquisa de ferramentas de IA, separado de seus negócios financeiros. Com a High-Flyer como uma de suas investidoras, o laboratório se tornou uma empresa independente, também chamada DeepSeek. Desde o início, a empresa investiu na construção de seus próprios clusters de data centers para treinamento de modelos, embora tenha enfrentado obstáculos devido às proibições de exportação de hardware impostas pelos EUA, sendo forçada a usar chips Nvidia H800, uma versão menos potente do H100 disponível para empresas americanas.
A equipe técnica do DeepSeek é predominantemente jovem, com a empresa recrutando ativamente pesquisadores de IA com doutorado das principais universidades chinesas e, curiosamente, contratando também pessoas sem formação em ciência da computação para ampliar a compreensão de seus sistemas sobre uma vasta gama de assuntos.
A Força dos Modelos DeepSeek: Inovação e Eficiência
O DeepSeek começou a ganhar notoriedade no cenário da IA com o lançamento de sua família de modelos DeepSeek-V2 na primavera passada. Este sistema de análise de texto e imagem de propósito geral demonstrou um desempenho impressionante em diversos benchmarks de IA, com um custo operacional significativamente inferior aos modelos comparáveis da época. Essa eficiência forçou concorrentes domésticos, como ByteDance e Alibaba, a reduzir os preços de uso de alguns de seus modelos e a oferecer outros gratuitamente.
O lançamento do DeepSeek-V3 em dezembro de 2024 apenas aumentou o burburinho. De acordo com testes internos da empresa, o DeepSeek V3 supera tanto modelos de código aberto disponíveis para download, como o Llama da Meta, quanto modelos “fechados” acessíveis via API, como o GPT-4o da OpenAI.
Igualmente notável é o modelo de “raciocínio” R1 do DeepSeek, lançado em janeiro. A empresa afirma que o R1 tem um desempenho comparável ao modelo o1 da OpenAI em benchmarks importantes. Modelos de raciocínio, como o R1, realizam uma espécie de auto-verificação de fatos, o que os ajuda a evitar algumas das armadilhas comuns que afetam outros modelos, oferecendo maior confiabilidade em domínios como física, ciência e matemática, embora levem um pouco mais de tempo para chegar às soluções.
Desafios e Controvérsias: Entre Sanções e Censura
Apesar do sucesso técnico, os modelos do DeepSeek, por serem desenvolvidos na China, estão sujeitos à supervisão do regulador de internet do país para garantir que suas respostas “incorporem os valores socialistas centrais”. Por exemplo, o chatbot da empresa evita responder a perguntas sobre temas sensíveis como a Praça Tiananmen ou a autonomia de Taiwan.
Além disso, a empresa enfrenta o escrutínio internacional. O Departamento de Comércio dos EUA e o estado de Nova York baniram o uso do DeepSeek em dispositivos governamentais. A Coreia do Sul suspendeu o serviço localmente e bloqueou downloads do aplicativo. Diversas empresas também estão restringindo o uso da plataforma devido a preocupações com a segurança dos dados e o risco de propaganda, conforme destacado por Brad Smith, Vice-Presidente e Presidente da Microsoft, em uma audiência no Senado.
Impacto Disruptivo no Mercado Global de IA
A ascensão do DeepSeek tem sido descrita como um evento que está “revirando a IA”. Seu sucesso, atribuído em parte a avanços em eficiência que permitem preços extremamente competitivos, causou um impacto notável, incluindo uma queda de 18% nas ações da Nvidia em janeiro, segundo o IAFeed. Figuras proeminentes da indústria, como Sam Altman da OpenAI e Jensen Huang da Nvidia, reconheceram publicamente a inovação da empresa chinesa.
Apesar das controvérsias, os modelos do DeepSeek, disponíveis sob licenças permissivas para uso comercial (embora não sejam “open source” no sentido tradicional), ganharam popularidade entre os desenvolvedores. Clem Delangue, CEO da Hugging Face, relatou que mais de 500 modelos “derivados” do R1 foram criados na plataforma, acumulando milhões de downloads.
A Microsoft, por sua vez, anunciou a disponibilidade do DeepSeek em seu serviço Azure AI Foundry. Questionado sobre o impacto do DeepSeek nos gastos da Meta com IA, o CEO Mark Zuckerberg afirmou que o investimento em infraestrutura de IA continuará sendo uma “vantagem estratégica” para sua empresa.
Modelo de Negócios Misterioso e o Futuro Incerto
O modelo de negócios exato do DeepSeek permanece uma incógnita. A empresa precifica seus produtos e serviços bem abaixo do valor de mercado e oferece outros gratuitamente, além de, surpreendentemente, não estar aceitando investimento de capital de risco, apesar do grande interesse. O DeepSeek atribui sua competitividade extrema a avanços em eficiência, embora alguns especialistas contestem os números fornecidos pela empresa.
O futuro do DeepSeek é incerto. Embora a melhoria contínua de seus modelos seja esperada, a crescente cautela do governo dos EUA em relação ao que percebe como influência estrangeira prejudicial pode representar um desafio significativo. Relatos indicam que os EUA provavelmente proibirão o DeepSeek em dispositivos governamentais, e a OpenAI já classificou a empresa como “subsidiada pelo estado” e “controlada pelo estado”, recomendando que o governo americano considere banir modelos produzidos na China.
Enquanto o mundo observa, o DeepSeek continua a ser uma força disruptiva, levantando questões cruciais sobre competição, inovação e as complexas intersecções entre tecnologia e geopolítica na era da inteligência artificial.
