O problema de gerar SVG com IA
Qualquer um que já tentou gerar uma imagem vetorial com IA sabe: o resultado quase sempre é um rastro de nós soltos, objetos sobrepostos e código que não renderiza. Diferente de imagens raster, SVG exige lógica estrutural e coordenadas precisas. Modelos de linguagem até conseguem produzir XML, mas sem garantia de que o desenho faça sentido visualmente. Isso muda com o Qwen3.6-27B?
O fato: loop fechado com visão
Um desenvolvedor chamado dondiegorivera montou um harness que conecta o Qwen3.6-27B (versão quantizada Q5_K_XL) a um sistema de dois estágios. O modelo gera um SVG a partir de um prompt textual. O SVG é renderizado em PNG e alimentado de volta para o modelo via visão (Qwen Vision). Um agente de julgamento avalia se a saída atende aos requisitos. Se não, o loop se repete com um novo prompt corrigido. O código está disponível no GitHub.
Como funciona na prática
O sistema usa o framework Agno para especificações e o Pi como agente de codificação. O Qwen gera o SVG, depois o pipeline renderiza com um visualizador headless, captura a tela como PNG e envia ao modelo para crítica. A latência depende do número de iterações: cada ciclo leva alguns segundos em hardware local com quantização. O custo é praticamente zero para quem já roda o modelo localmente. O autor recomenda contexto longo (a partir de 8k tokens) para evitar truncamento nas descrições.
O que muda na prática
Designers e desenvolvedores que precisam de ícones, ilustrações ou diagramas vetoriais podem agora gerar SVGs prontos para uso sem depender de editores manuais. A qualidade é consistente com exemplos como um pelicano de bicicleta, uma capivara de quimono e uma flor que se transforma em borboletas. A correção iterativa resolve o maior gargalo: SVGs quebrados visualmente. Para equipes de produto, isso reduz o tempo de prototipagem de horas para minutos. Quem usa modelos fechados como DALL-E perde em vetorização nativa.
Tensão: escala e custo da iteração
O loop fechado soa elegante, mas a pergunta é: quantas iterações até um SVG aceitável? O autor relata que prompts simples resolvem em uma ou duas voltas, mas cenas complexas podem exigir quatro ou cinco. Cada iteração consome tokens e tempo. Em produção, o custo de GPU e a latência podem inviabilizar o uso em tempo real. Além disso, o segundo estágio de julgamento depende do próprio modelo, o que pode introduzir viés: ele pode aprovar SVGs incompletos ou rejeitar resultados corretos. Isso escala? Para uso esporádico em design, sim. Para geração em massa, talvez não.
Conclusão
Qwen3.6-27B com loop fechado entrega SVGs funcionais com qualidade surpreendente. O maior ganho é a eliminação do retrabalho manual, mas o custo iterativo ainda limita a adoção em larga escala. Vale a pena testar o harness e ver até onde ele vai. O código está em github.com/dondiegorivera/theloop.
Nenhum comentário ainda. Seja o primeiro a comentar!
Deixe seu comentário