O preprint que não foi revisado pode te custar um ano de banimento
Você já submeteu um paper no arXiv com seções geradas por ChatGPT e não revisou as referências? Pois saiba que, a partir de agora, um erro flagrante de LLM — como uma referência alucinada ou um meta-comentário deixado no texto — pode render um banimento de 12 meses na plataforma. A decisão foi anunciada pelo moderador Thomas Dietterich e já está gerando discussão entre pesquisadores que usam IA generativa para acelerar a escrita acadêmica.
O fato: arXiv endurece regras contra erros não verificados de LLM
O arXiv, repositório central de preprints em ciência da computação e áreas afins, atualizou seu código de conduta para deixar explícito: o autor é o único responsável pelo conteúdo, independentemente de como foi gerado. Se um paper contiver evidências incontestáveis de que os autores não verificaram os resultados de um LLM — como referências inventadas, dados fictícios ou comentários do tipo 'aqui está um resumo de 200 palavras; você gostaria que eu fizesse alterações?' — a penalidade é um banimento de um ano. Após o período, o autor só pode submeter novamente se o trabalho for aceito em um veículo com revisão por pares respeitável.
Como funciona na prática: o que é "evidência incontestável"?
A definição é importante. Não se trata de erros sutis ou de achismos. A regra mira casos em que fica óbvio que o texto passou por um LLM sem revisão humana: referências que não existem, tabelas com placeholders como 'insira aqui os números reais', ou seções inteiras que parecem saídas de prompt sem edição. O arXiv não está proibindo o uso de LLMs — o próprio comunicado de Dietterich diz que os autores assumem total responsabilidade. O problema é a negligência. Do ponto de vista técnico, a medida força quem usa ferramentas como GPT-4, Claude ou Gemini a implementar um pipeline de verificação: checar cada referência, validar dados, remover marcas de geração. Custo de tempo, mas também de processo.
O que isso muda na prática para quem publica
Para pesquisadores que já revisam manualmente cada output de LLM, a mudança é pequena. Mas para quem confia cegamente na geração, o risco aumentou. Um banimento de um ano no arXiv não é trivial: dependendo da área, o arXiv é o principal canal de disseminação rápida de resultados. Perder esse acesso por um ano pode atrasar citações, colaborações e até a progressão na carreira. Uma ação prática imediata: antes de submeter, use um script para detectar frases típicas de LLM (como 'I cannot fulfill this request' ou 'As an AI language model') e valide todas as referências em bases como CrossRef ou Semantic Scholar.
Tensão e reflexão: vale a pena usar LLM sem revisão?
A pergunta que fica é: essa política resolve o problema da qualidade ou apenas transfere o ônus? Por um lado, a responsabilização do autor é justa — ninguém deveria publicar lixo gerado por máquina sem ler. Por outro, a fiscalização é baseada em "evidência incontestável", o que pode ser difícil de aplicar uniformemente. E se o erro for sutil? E se o autor revisou mas não percebeu uma referência alucinada? A linha entre erro honesto e negligência é tênue. Além disso, a medida não aborda papers que usam LLM para reescrever parágrafos de forma convincente, sem erros óbvios, mas com viés ou imprecisões. O gargalo pode se deslocar: em vez de referências falsas, teremos textos fluentes mas vazios.
Conclusão
A política do arXiv é um sinal claro: a responsabilidade pela qualidade do conteúdo é do autor, não da ferramenta. Para quem publica, o recado é simples: revisar cada linha gerada por IA não é opcional, é requisito mínimo. A pergunta que fica: quanto tempo até outras plataformas adotarem medidas semelhantes? E, mais importante, até que ponto a comunidade científica está disposta a confiar em textos que podem ter sido gerados sem supervisão?
Nenhum comentário ainda. Seja o primeiro a comentar!
Deixe seu comentário