DeepSeek: A Revolução Chinesa na Inteligência Artificial

DeepSeek: A Revolução Chinesa na Inteligência Artificial

DeepSeek: A Revolução Chinesa na Inteligência Artificial

A DeepSeek, um laboratório de inteligência artificial da China, tornou-se um fenômeno viral após seu aplicativo de chatbot alcançar o topo das paradas da Apple App Store e do Google Play. A ascensão meteórica da DeepSeek tem levantado questões sobre a liderança dos EUA na corrida da IA e a sustentabilidade da demanda por chips de IA.

Origens da DeepSeek

Fundada por Liang Wenfeng, entusiasta de IA e cofundador do fundo quantitativo chinês High-Flyer Capital Management, a DeepSeek começou como um laboratório de pesquisa em 2023. Com o apoio do High-Flyer, a DeepSeek se tornou uma empresa independente, focada em desenvolver ferramentas de IA.

A empresa enfrentou desafios devido a restrições de exportação dos EUA, forçando-a a utilizar chips Nvidia H800 menos potentes para treinar seus modelos. A equipe técnica da DeepSeek é jovem e diversificada, recrutando agressivamente pesquisadores de doutorado de universidades chinesas e até mesmo pessoas sem formação em ciência da computação para enriquecer a compreensão de seus modelos.

Modelos Poderosos da DeepSeek

A DeepSeek lançou sua primeira série de modelos em novembro de 2023, mas foi com o lançamento da família de modelos DeepSeek-V2 na primavera seguinte que a indústria de IA começou a prestar atenção. O DeepSeek-V2, um sistema de análise de texto e imagem de propósito geral, destacou-se em benchmarks de IA e era significativamente mais barato de operar do que modelos comparáveis.

O DeepSeek-V3, lançado em dezembro de 2024, consolidou ainda mais a reputação da empresa. De acordo com testes internos, o DeepSeek V3 superou modelos abertos como o Llama da Meta e modelos fechados como o GPT-4o da OpenAI. O modelo de raciocínio R1, lançado em janeiro, também se destacou, oferecendo uma verificação de fatos interna que aumenta a confiabilidade em áreas como física, ciência e matemática.

No entanto, os modelos da DeepSeek estão sujeitos a regulamentações chinesas, o que pode limitar suas respostas em tópicos sensíveis como Tiananmen Square ou a autonomia de Taiwan.

Abordagem Disruptiva

A DeepSeek adota uma abordagem de negócios disruptiva, oferecendo seus produtos e serviços a preços bem abaixo do mercado ou até mesmo de graça. A empresa não está aceitando investimentos de capital de risco, apesar do grande interesse. A DeepSeek atribui sua competitividade de custos a avanços em eficiência, embora alguns especialistas questionem essas afirmações.

Desenvolvedores têm adotado os modelos da DeepSeek, disponíveis sob licenças permissivas que permitem uso comercial. A plataforma Hugging Face, que hospeda os modelos da DeepSeek, relatou a criação de mais de 500 modelos derivados do R1, com downloads combinados de 2,5 milhões.

O sucesso da DeepSeek contra rivais maiores e mais estabelecidos tem sido descrito como "revolucionário" e "supervalorizado". A empresa foi parcialmente responsável pela queda de 18% no preço das ações da Nvidia em janeiro e provocou respostas públicas de líderes da indústria como Sam Altman da OpenAI.

Enquanto isso, algumas empresas e governos estão banindo a DeepSeek devido a preocupações com a influência estrangeira. O futuro da DeepSeek é incerto, mas melhorias nos modelos são esperadas, enquanto o governo dos EUA parece estar cada vez mais preocupado com a influência estrangeira percebida como prejudicial.

Compartilhe este artigo