Google DeepMind Lança Modelo de IA para Robôs que Funciona sem Internet
A Google DeepMind anunciou nesta terça-feira o lançamento de um novo modelo de linguagem chamado Gemini Robotics On-Device, capaz de executar tarefas em robôs localmente, sem a necessidade de conexão com a internet. O modelo é uma evolução do Gemini Robotics, lançado em março, e permite que desenvolvedores controlem e ajustem os movimentos dos robôs usando comandos de linguagem natural.
Desempenho e Adaptabilidade
Segundo a Google, o novo modelo apresenta um desempenho próximo ao da versão baseada em nuvem e supera outros modelos locais em benchmarks gerais, embora a empresa não tenha especificado quais modelos foram comparados. Em demonstrações, robôs equipados com o Gemini Robotics On-Device realizaram tarefas como deszipar bolsas e dobrar roupas com precisão.
O modelo foi originalmente treinado para robôs ALOHA, mas foi adaptado para funcionar em outras plataformas, como o robô bípede Franka FR3 e o humanóide Apollo, da Apptronik. A Google destacou que o Franka FR3 conseguiu lidar com cenários e objetos nunca vistos antes, como a montagem em uma esteira industrial.
Ferramentas para Desenvolvedores
Além do modelo, a Google DeepMind está lançando um SDK (Kit de Desenvolvimento de Software) para o Gemini Robotics. Com ele, desenvolvedores podem treinar robôs para novas tarefas exibindo de 50 a 100 demonstrações, utilizando o simulador físico MuJoCo.
O Cenário Competitivo
A corrida por modelos de IA para robótica está aquecida. Empresas como a Nvidia estão desenvolvendo plataformas para criar modelos fundamentais para humanóides, enquanto outras, como a Hugging Face, trabalham em modelos abertos e conjuntos de dados para robótica. Startups como a RLWRLD, apoiada pela Mirae Asset, também estão investindo na criação de modelos base para robôs.
Com o lançamento do Gemini Robotics On-Device, a Google DeepMind reforça sua posição como líder em inovação para robótica e IA, oferecendo soluções que combinam desempenho e autonomia.