Deep Cogito Revela IA Híbrida: Modelos Open Source que Alternam entre Raciocínio e Rapidez
Uma nova força surge no cenário da inteligência artificial: a Deep Cogito. Fundada por ex-membros da equipe do Google AI DeepMind e financiada por investidores como South Park Commons, a startup sediada em São Francisco saiu do modo furtivo apresentando uma família inovadora de modelos de IA, batizada de Cogito 1.
O grande diferencial? Esses modelos são híbridos e estão disponíveis em código aberto. Eles possuem a capacidade única de alternar entre um modo de "raciocínio", similar ao explorado por modelos como o o1 da OpenAI, e um modo de operação padrão, mais rápido.
Modelos com capacidade de raciocínio têm se mostrado promissores em áreas complexas como matemática e física, pois conseguem, essencialmente, verificar seus próprios passos e lógica ao resolver problemas. No entanto, essa profundidade analítica exige maior poder computacional e aumenta a latência (o tempo de resposta). É por isso que laboratórios como a Anthropic também exploram arquiteturas híbridas: a agilidade para tarefas simples e o tempo necessário para questões desafiadoras.
A Deep Cogito afirma que seus modelos Cogito 1 superam os melhores modelos abertos de tamanho comparável, incluindo os da Meta e da startup chinesa DeepSeek. "Cada modelo pode responder diretamente [...] ou autorrefletir antes de responder (como modelos de raciocínio)", explica a empresa em seu blog. Notavelmente, toda a família Cogito 1 foi desenvolvida por uma equipe pequena em aproximadamente 75 dias.
A linha Cogito 1 varia de 3 bilhões a 70 bilhões de parâmetros – uma métrica que geralmente se correlaciona com a capacidade de resolução de problemas do modelo. A empresa já anunciou planos para lançar versões ainda maiores, chegando a 671 bilhões de parâmetros, nas próximas semanas e meses.
É importante notar que o Cogito 1 não foi criado do zero. A Deep Cogito utilizou como base os modelos abertos Llama (Meta) e Qwen (Alibaba), aplicando o que descreve como "abordagens de treinamento inovadoras" para aprimorar o desempenho e habilitar o raciocínio alternável.
Segundo benchmarks internos da Deep Cogito:
- O modelo Cogito 70B (com raciocínio ativado) supera o modelo R1 da DeepSeek em algumas avaliações de matemática e linguagem.
- O mesmo Cogito 70B (com raciocínio desativado) ultrapassa o recém-lançado Llama 4 Scout da Meta no teste de propósito geral LiveBench.
Todos os modelos Cogito 1 estão disponíveis para download ou uso via APIs em provedores de nuvem como Fireworks AI e Together AI, reforçando o compromisso com a comunidade de código aberto.
Fundada em junho de 2024 por Drishan Arora (ex-engenheiro de software sênior do Google) e Dhruv Malhotra (ex-gerente de produto do Google AI DeepMind), a Deep Cogito tem uma meta ambiciosa: construir uma "superinteligência geral", definida como uma IA capaz de superar humanos na maioria das tarefas e descobrir capacidades que ainda nem imaginamos.
"Atualmente, ainda estamos nos estágios iniciais de [nossa] curva de escalonamento [...] No futuro, estamos investigando abordagens complementares de pós-treinamento para autoaperfeiçoamento", conclui a empresa em seu comunicado.