Mistral AI Lança Voxtral: Modelo de Voz Aberto e Acessível para Empresas

Share

Mistral AI Lança Voxtral: Modelo de Voz Aberto e Acessível para Empresas

A comunicação por voz está se tornando a forma padrão de interação com máquinas, e a startup francesa de IA, Mistral, acaba de entrar nessa corrida com um novo modelo aberto. Chamado de Voxtral, este é o primeiro sistema de inteligência de voz da empresa, projetado para desafiar os sistemas corporativos fechados com alternativas abertas e acessíveis.

O Que é o Voxtral?

O Voxtral é apresentado como o primeiro modelo aberto capaz de oferecer “inteligência de voz verdadeiramente utilizável em produção”. Isso significa que desenvolvedores e empresas não precisam mais escolher entre sistemas abertos baratos, mas ineficientes, ou soluções caras e fechadas que limitam o controle sobre a implementação.

Segundo a Mistral, o Voxtral oferece uma alternativa acessível, custando “menos da metade do preço” de soluções comparáveis. Além disso, o modelo é baseado no LLM Mistral Small 3.1, permitindo transcrições de até 30 minutos de áudio e compreensão de até 40 minutos. Com isso, os usuários podem fazer perguntas sobre o conteúdo do áudio, gerar resumos ou até mesmo transformar comandos de voz em ações em tempo real, como chamadas de API.

Multilíngue e Versátil

O Voxtral é capaz de transcrever e entender múltiplos idiomas, incluindo inglês, espanhol, francês, português, hindi, alemão, holandês e italiano. A empresa está lançando duas variantes do modelo:

  • Voxtral Small: Com 24 bilhões de parâmetros, é ideal para implantações em escala de produção e compete diretamente com modelos como ElevenLabs Scribe e Gemini 2.5 Flash.
  • Voxtral Mini: Uma versão mais leve, com 3 bilhões de parâmetros, projetada para implantações locais e em dispositivos de borda. Há também uma versão ainda mais econômica, o Voxtral Mini Transcribe, otimizado apenas para transcrições.

Como Experimentar

Os usuários podem testar o Voxtral gratuitamente baixando a API no Hugging Face ou usando os modelos no chatbot Le Chat, da Mistral. A integração da API em aplicativos começa a US$ 0,001 por minuto, tornando-a uma opção atraente para empresas de todos os tamanhos.

Contexto e Futuro

O lançamento do Voxtral ocorre um mês após a Mistral anunciar o Magistral, sua primeira família de modelos de raciocínio passo a passo. A empresa, uma das principais defensoras do código aberto na IA, está em negociações para levantar até US$ 1 bilhão em investimentos, incluindo fundos como o MGX de Abu Dhabi.

Com o Voxtral, a Mistral reforça seu compromisso com a inovação aberta e acessível, oferecendo uma solução que promete revolucionar a forma como interagimos com a tecnologia por voz.

Read more

Local News