Microsoft Lança 3 Modelos de IA Multimodal: Transcrição, Voz e Imagem

Microsoft Lança 3 Modelos de IA Multimodal: Transcrição, Voz e Imagem

Microsoft Lança 3 Modelos de IA Multimodal: Transcrição, Voz e Imagem

O Que São os Novos Modelos MAI da Microsoft?

A Microsoft AI, o laboratório de pesquisa da gigante de tecnologia, anunciou nesta quinta-feira o lançamento de três modelos fundamentais de IA que podem gerar texto, voz e imagens. Esta liberação sinaliza a contínua investida da Microsoft para construir sua própria pilha de modelos de IA multimodal - e competir com laboratórios rivais de IA - mesmo permanecendo vinculada à OpenAI.

MAI-Transcribe-1: Transcrição Ultrarrápida

O MAI-Transcribe-1 transcreve fala em 25 idiomas diferentes para texto e é 2,5 vezes mais rápido que a oferta Azure Fast da Microsoft, de acordo com um comunicado de imprensa da empresa.

  • Suporte para 25 idiomas
  • 2,5x mais rápido que soluções anteriores
  • Preço inicial: $0,36 por hora

MAI-Voice-1: Geração de Áudio em Tempo Real

Este modelo de geração de áudio permite que os usuários gerem 60 segundos de áudio em um segundo e criem uma voz personalizada.

  • Geração de 60 segundos de áudio em 1 segundo
  • Criação de voz personalizada
  • Preço inicial: $22 por 1 milhão de caracteres

MAI-Image-2: Modelo de Geração de Vídeo

Originalmente lançado no MAI Playground em 19 de março, este modelo agora está disponível no Microsoft Foundry junto com os outros dois modelos.

  • Geração de conteúdo visual
  • Preço: $5 por 1 milhão de tokens para entrada de texto
  • Preço: $33 por 1 milhão de tokens para saída de imagem

Vantagem Competitiva: Preços Mais Baixos

Em um mercado de LLM cada vez mais lotado, a MAI espera que um ponto de venda para esses modelos seja que eles são mais baratos do que os do Google e OpenAI. Mustafa Suleyman, CEO da Microsoft AI, escreveu em um post no blog:

"Na Microsoft AI, estamos construindo IA Humanista. Temos uma visão distinta ao criar nossos modelos de IA - colocando os humanos no centro, otimizando para como as pessoas realmente se comunicam, treinando para uso prático."

Parceria com OpenAI Continua

Apesar de lançar seus próprios modelos, Suleyman reafirmou o compromisso da Microsoft com sua parceria com a OpenAI. Uma renegociação recente dessa parceria permitiu que a Microsoft realmente buscasse essa pesquisa de superinteligência.

Investimentos e Estratégia

  • Microsoft investiu mais de $13 bilhões no laboratório de pesquisa de IA
  • Modelos hospedados em vários produtos através de parceria plurianual
  • Mesma estratégia com chips: produz próprios e compra de players externos

O Futuro da IA da Microsoft

Suleyman prometeu mais modelos em breve no Foundry e diretamente em produtos e experiências da Microsoft. A empresa está posicionando-se estrategicamente para competir em todas as frentes da revolução da IA, mantendo simultaneamente parcerias estratégicas que impulsionam o ecossistema geral.

Compartilhe este artigo