SmolVLA: Hugging Face Lança Modelo de IA Aberto para Revolucionar a Robótica Doméstica e de Pesquisa

Share

Construir projetos de robótica sofisticados em casa está se tornando uma realidade mais acessível. A plataforma de desenvolvimento de IA Hugging Face anunciou recentemente o lançamento de um modelo de IA aberto para robótica chamado SmolVLA, prometendo um avanço significativo na área.

Treinado com conjuntos de dados compartilhados pela comunidade e “licenciados de forma compatível”, o SmolVLA, segundo a Hugging Face, supera modelos de robótica muito maiores tanto em ambientes virtuais quanto no mundo real. Este lançamento representa um passo importante para tornar a robótica avançada mais democrática.

Democratizando o Acesso e Acelerando a Pesquisa

Em uma postagem em seu blog, a Hugging Face declarou: “O SmolVLA visa democratizar o acesso a modelos de visão-linguagem-ação (VLA) e acelerar a pesquisa em direção a agentes robóticos generalistas”. A empresa destaca que o “SmolVLA não é apenas um modelo leve e capaz, mas também um método para treinar e avaliar tecnologias de robótica generalistas.”

Este novo modelo faz parte de um esforço crescente da Hugging Face para estabelecer um ecossistema de hardware e software de robótica de baixo custo. No ano passado, a empresa lançou o LeRobot, uma coleção de modelos, conjuntos de dados e ferramentas focados em robótica. Mais recentemente, a Hugging Face adquiriu a Pollen Robotics, uma startup de robótica sediada na França, e revelou diversos sistemas robóticos acessíveis, incluindo humanoides, para compra.

Leve, Poderoso e Eficiente

O SmolVLA, com seus 450 milhões de parâmetros (componentes internos que guiam o comportamento do modelo), foi treinado com dados dos LeRobot Community Datasets, conjuntos de dados específicos para robótica compartilhados na plataforma da Hugging Face.

Uma das grandes vantagens do SmolVLA é seu tamanho reduzido, permitindo que ele seja executado em uma única GPU de consumidor ou até mesmo em um MacBook. Isso facilita o teste e a implantação em hardware acessível, incluindo os próprios sistemas de robótica da Hugging Face.

De forma inovadora, o SmolVLA também suporta uma “pilha de inferência assíncrona”. Conforme explicado pela empresa, isso permite que o modelo separe o processamento das ações de um robô do processamento do que ele vê e ouve. “Devido a essa separação, os robôs podem responder mais rapidamente em ambientes em rápida mudança”, afirma a Hugging Face.

Impacto na Comunidade e Primeiras Aplicações

O SmolVLA já está disponível para download na plataforma da Hugging Face e a comunidade não demorou a testá-lo. Um usuário no X (anteriormente Twitter) afirmou ter usado o modelo para controlar um braço robótico de terceiros:

🚀 SmolVLA — parece um momento BERT para a robótica 🤖
Eu testei no Braço Koch:
Inferência em RTX 2050 (4GB), ajustado com apenas 31 demonstrações, e iguala/supera as linhas de base de tarefa única 🔥

Muito obrigado a @RemiCadene @danaubakirova @mustash97 @francesco__capu 🙌 pic.twitter.com/TiBkAZGwkM

— Xingdong Zuo (@XingdongZ) 4 de junho de 2025

Um Cenário Competitivo em Expansão

É importante notar que a Hugging Face está longe de ser a única empresa na nascente corrida da robótica aberta. A Nvidia possui uma coleção de ferramentas para robótica aberta, e a startup K-Scale Labs está construindo componentes para o que chama de “humanoides de código aberto”. Outras empresas de destaque no segmento incluem Dyna Robotics, Physical Intelligence (apoiada por Jeff Bezos) e RLWRLD.

Com o SmolVLA, a Hugging Face reforça seu compromisso em tornar a IA e a robótica mais acessíveis, abrindo novas possibilidades para desenvolvedores, pesquisadores e entusiastas em todo o mundo.

Para mais informações, acesse a página do SmolVLA e o blog da Hugging Face.

Read more

Local News