Midjourney Lança Novo Modelo de IA V7: Uma Revolução na Geração de Imagens
A Midjourney, uma das primeiras plataformas de geração de imagens por IA na web, anunciou o lançamento do seu mais novo modelo de IA, o V7, após quase um ano sem novidades. O modelo V7, que começou a ser distribuído em fase alpha à meia-noite de sexta-feira, horário do leste, chega uma semana após a OpenAI ter apresentado um novo gerador de imagens no ChatGPT, que rapidamente se tornou viral por sua capacidade de criar fotos no estilo Ghibli.
Embora o V7 da Midjourney não seja otimizado para o estilo Ghibli oficialmente, ele gera trabalhos esteticamente agradáveis. Para utilizar o V7, os usuários precisam primeiro avaliar cerca de 200 imagens para construir um perfil de "personalização" na Midjourney, que ajusta o modelo às preferências visuais individuais. O V7 é o primeiro modelo da Midjourney a ter a personalização ativada por padrão.
Após completar essa tarefa, os usuários podem acessar o V7 no site da Midjourney ou no servidor Discord da empresa. No aplicativo web, o modelo pode ser selecionado rapidamente no menu suspenso ao lado do rótulo "versão".
O CEO da Midjourney, David Holz, descreveu o V7 como uma "arquitetura totalmente diferente" em uma postagem no X. Ele destacou que o V7 é muito mais inteligente com prompts de texto, e que os prompts de imagem parecem fantásticos, com qualidade de imagem notavelmente mais alta, texturas bonitas e uma coência significativamente melhor em detalhes de corpos, mãos e objetos.
O V7 está disponível em dois modos, Turbo e Relax, sendo o primeiro mais caro para operar. Ele também alimenta uma nova ferramenta chamada Modo Rascunho, que renderiza imagens 10 vezes mais rápido e com metade do custo do modo padrão. As imagens em modo rascunho são de menor qualidade, mas podem ser aprimoradas e re-renderizadas com um clique do mouse.
De acordo com Holz, algumas capacidades da Midjourney ainda não estão disponíveis para o V7, incluindo o aumento de imagem e a retexturização. Essas funcionalidades devem chegar em breve, possivelmente dentro de dois meses. Holz enfatizou que o V7 é um modelo totalmente novo com forças únicas e provavelmente algumas fraquezas, e que a empresa quer aprender com os usuários o que ele faz bem e mal.
Em testes breves, o V7 aderiu razoavelmente bem aos prompts fornecidos. A Midjourney, fundada em 2022 por Holz, que co-fundou a empresa de periféricos para PC Leap Motion, não recebeu nenhum financiamento externo. No final de 2023, a empresa esperava gerar cerca de US$ 200 milhões em receita. Recentemente, a empresa com sede em San Francisco anunciou a formação de uma equipe de hardware para trabalhar em projetos não divulgados e continua a treinar modelos previamente anunciados para geração de vídeo e objetos 3D.
Várias ações judiciais acusam a Midjourney de violar os direitos de milhões de artistas ao treinar ferramentas de IA com imagens obtidas da web sem o consentimento dos criadores das imagens.