Google I/O 2025: Família Gemma Cresce com IA On-Device, Médica e para Língua de Sinais
Durante o Google I/O 2025, realizado nesta terça-feira, o Google anunciou uma expansão significativa para sua família de modelos de Inteligência Artificial “abertos”, Gemma. As novidades incluem o Gemma 3n, projetado para rodar eficientemente em dispositivos móveis e desktops, além de modelos especializados como o MedGemma para a área da saúde e o SignGemma para tradução de língua de sinais.
Gemma 3n: IA Poderosa e Eficiente Diretamente no Seu Dispositivo
O Gemma 3n, já disponível em versão preliminar, promete operar “suavemente” em smartphones, laptops e tablets. Segundo o Google, este modelo é capaz de processar áudio, texto, imagens e vídeos diretamente no aparelho, uma capacidade cada vez mais valorizada na comunidade de IA. Modelos que funcionam offline, sem depender da nuvem, não só são mais baratos de usar, mas também reforçam a privacidade do usuário ao evitar a transferência de dados para datacenters remotos.
Gus Martins, Gerente de Produto do Gemma, destacou durante a apresentação no I/O que o Gemma 3n pode operar em dispositivos com menos de 2GB de RAM.
“O Gemma 3n compartilha a mesma arquitetura do Gemini Nano e é projetado para um desempenho incrível”, afirmou Martins.
MedGemma: Avanços na Análise de Saúde com IA Multimodal
Outra novidade importante é o MedGemma, lançado através do programa Health AI Developer Foundations do Google. A empresa o descreve como seu modelo aberto mais capaz para analisar textos e imagens relacionados à saúde.
“MedGemma é nossa coleção mais capaz de modelos abertos para a compreensão multimodal de texto e imagem na área da saúde”, explicou Martins. “O MedGemma funciona muito bem em uma variedade de aplicações de imagem e texto, para que os desenvolvedores […] possam adaptar o modelo para seus próprios aplicativos de saúde.”
SignGemma: IA para Tradução de Língua de Sinais e Maior Acessibilidade
Com foco em acessibilidade, o Google também apresentou o SignGemma, um modelo aberto destinado a traduzir língua de sinais para texto em linguagem falada. A expectativa é que o SignGemma permita aos desenvolvedores criar novas aplicações e integrações para usuários surdos ou com deficiência auditiva.
“SignGemma é uma nova família de modelos treinados para traduzir língua de sinais para texto em linguagem falada, mas é melhor em Língua de Sinais Americana e Inglês”, disse Martins. “É o modelo de compreensão de língua de sinais mais capaz já feito, e mal podemos esperar para que vocês — desenvolvedores e comunidades de surdos e com deficiência auditiva — peguem esta base e construam com ela.”
Adoção e Considerações sobre os Modelos Gemma
Apesar do entusiasmo em torno das novas ferramentas, é importante notar que a família Gemma tem sido alvo de críticas devido aos seus termos de licenciamento personalizados e não padronizados. Alguns desenvolvedores apontam que essas condições podem tornar o uso comercial dos modelos uma proposta arriscada. No entanto, isso não impediu que os modelos Gemma fossem baixados dezenas de milhões de vezes coletivamente, demonstrando um forte interesse da comunidade de desenvolvedores.
