Adicionar datas de publicação falsas ao conteúdo online pode aumentar drasticamente sua visibilidade nos principais modelos de IA, descobriu uma equipe da Universidade Waseda. Isto parece confirmar que ferramentas como o ChatGPT favorecem sistematicamente conteúdos mais recentes em detrimento de materiais mais antigos e igualmente relevantes.
Por que nos importamos. Os modelos de IA parecem recompensar mais os carimbos de data e hora do que a qualidade. Isso significa que seu conteúdo antigo de alta qualidade pode desaparecer dos resultados de pesquisa de IA, a menos que seja atualizado regularmente – aparentemente, independentemente de essas atualizações serem substanciais ou artificiais.
Como eles fizeram isso. Os pesquisadores adicionaram datas de publicação falsas a passagens de coleções de testes padronizados, sem outras alterações. Em seguida, eles pediram a sete modelos principais de IA – incluindo GPT-4o, GPT-3.5, LLaMA-3 e Qwen-2.5 – para classificar os resultados.
Cada modelo preferiu o texto mais recente.
- Os 10 principais resultados mudaram em média de 1 a 5 anos mais recentemente.
- As passagens individuais saltaram para 95 posições no ranking.
- 1 em cada 4 decisões de relevância foram alteradas com base apenas na data.
O “efeito gangorra”. Em todos os modelos, o conteúdo mais bem classificado ficou mais jovem, enquanto o material mais antigo caiu sistematicamente:
- Classificações 1–10: 0,8–4,8 anos mais fresco.
- Classificações 61–100: até 2 anos mais velho.
Mesmo fontes mais antigas e altamente confiáveis – artigos acadêmicos, pesquisas médicas ou guias detalhados – perderam visibilidade para conteúdos mais recentes, muitas vezes menos confiáveis
Viés. Aqui estão os modelos que caíram nessa (e aqueles que não caíram):
- Mais tendencioso: Metas LLaMA-3-8Bque mostrou taxas de reversão de 25% e mudanças de quase 5 anos.
- Menos tendencioso: do Alibaba Qwen-2.5-72Bcom reversões de apenas 8% e mudanças anuais mínimas.
- OpenAI’s GPT-4o e GPT-4 caiu no meio, mostrando viés de atualidade mensurável, mas menor.
A história de fundo. No início deste ano, o pesquisador independente Metehan Yesilyurt descobriu o cenário “use_freshness_scoring_profile: verdadeiro” nos arquivos de configuração do ChatGPT – evidência de que o sistema de reclassificação do OpenAI favorece explicitamente o conteúdo recente.
O que vem a seguir. Yesilyurt alertou sobre uma iminente “corrida armamentista temporal”:
- Os editores podem aumentar as classificações falsificando os rótulos “Atualizado para 2025”.
- Os sistemas de IA responderão detectando edições superficiais.
- Em última análise, o preconceito poderia recompensar a experiência recente em detrimento da qualidade.
O que eles estão dizendo. Em resposta ao relatório, Chris Long, cofundador da Nectiv., escreveu no LinkedIn:
- “O que direi é que as atualizações atualizadas são provavelmente uma das melhorias mais escalonáveis na página que você pode fazer. Há anos sabemos que isso ajuda na pesquisa tradicional. Agora podemos ver que a atualização do conteúdo provavelmente também afeta a visibilidade da IA.”
Rich Tatum, arquiteto de soluções fracionárias de SEO e IA da Edgy Labs, disse no LinkedIn:
- “A atualidade e a atualidade fazem sentido como um sinal de relevância para os modelos LLM, e um arquivo de fontes com alta confiança (artigos acadêmicos) faria logicamente que os LLMs “ingênuos” tratassem esses sinais de novidade como altamente salientes e confiáveis.
- Infelizmente, a nossa profissão irá naturalmente abusar desses sinais até que os futuros LLMs tenham essa ingenuidade treinada a partir deles. E esses sinais padrão de frescor se tornarão mero ruído.”
O que estimulou esta resposta interessante de Rand Fishkin, cofundador da SparkToro:
- “Não acho que seja necessariamente triste abusar dos sinais que os lms usam. Eu costumava ser muito anti-spam contra o Google e então vi como o Google abusou de coisas políticas manipuladoras e malignas neste mundo para ganhar e manter o poder do monopólio. Os grandes fornecedores de ferramentas de IA de modelo de linguagem não se sentem diferentes e não vejo razão para adotarmos um conjunto de ética arbitrária simplesmente para aquiescer aos seus caprichos.
- O que fizeram as grandes empresas de tecnologia e os fornecedores de ferramentas de IA que os tornam merecedores de respeito pelos seus sistemas? Não consigo nomear nada.
Resultado final. Na pesquisa de IA, as novidades superam os fatos – pelo menos por enquanto. Se o seu conteúdo não for novo, já está invisível.
O relatório. Encontrei no código, a ciência provou no laboratório: o viés de atualidade que está remodelando a pesquisa de IA por Metehan Yesilyurt
Search Engine Land é propriedade de Semrush. Continuamos comprometidos em fornecer cobertura de alta qualidade de tópicos de marketing. Salvo indicação em contrário, o conteúdo desta página foi escrito por um funcionário ou contratado remunerado da Semrush Inc.