Edit Content
Click on the Edit Content button to edit/add the content.

Growth Strategies for Digital Businesses

Perguntas de Mueller do Google sobre a necessidade de páginas Markdown somente LLM

Home / Nosso Blog

Transforme seu negócio com a Atualizex

Leve seu marketing digital para o próximo nível com estratégias baseadas em dados e soluções inovadoras. Vamos criar algo incrível juntos!

Siga nosso Canal

Acompanhe semanalmente nosso canal no youtube com vídeos de marketing e performance e se inscreva-se

Google’s Mueller Questions Need For LLM-Only Markdown Pages

Perguntas de Mueller do Google sobre a necessidade de páginas Markdown somente LLM

O defensor da pesquisa do Google, John Mueller, rejeitou a ideia de construir páginas Markdown ou JSON separadas apenas para grandes modelos de linguagem (LLMs), dizendo que não vê por que os LLMs precisariam de páginas que ninguém mais vê.

A discussão começou quando Lily Ray perguntou no Bluesky sobre “criar páginas markdown/JSON separadas para LLMs e servir esses URLs para bots” e se o Google poderia compartilhar sua perspectiva.

Ray perguntou:

Não tenho certeza se você pode responder, mas estou começando a ouvir muito sobre a criação de páginas markdown/JSON separadas para LLMs e o fornecimento desses URLs para bots. Você pode compartilhar a perspectiva do Google sobre isso?

A questão chama a atenção para uma tendência em desenvolvimento em que os editores criam cópias “sombra” de importantes em formatos que são mais fáceis de serem compreendidos pelos sistemas de IA.

Há uma discussão mais ativa sobre este tópico acontecendo no X.

O que Mueller disse sobre páginas somente LLM

Muller respondeu que ele não tem conhecimento de nada por parte do Google que exija esse tipo de configuração.

Ele observa que os LLMs trabalharam com páginas da web regulares desde o início:

Não tenho conhecimento de nada nesse sentido. No meu ponto de vista, os LLMs treinaram – leram e analisaram – páginas normais da web desde o início, parece certo que eles não têm problemas em lidar com HTML. Por que eles iriam querer ver uma página que nenhum usuário vê? E, se verificam a equivalência, por que não usar HTML?

Quando Ray questionou se um formato separado poderia ajudar a “agilizar a transmissão rápida de pontos-chave para os LLMs”, Mueller argumentou que, se os formatos de arquivo fizessem uma diferença significativa, você provavelmente ouviria isso diretamente das empresas que executam esses sistemas.

Mueller adicionou:

Se aqueles que criam e administram esses sistemas soubessem que poderiam criar melhores respostas a partir de sites com formatos de arquivo específicos, espero que falassem muito sobre isso. As empresas de IA não são conhecidas por serem tímidas.

Ele disse algumas páginas ainda podem funcionar melhor para sistemas de IA do que outras, mas ele não acha que isso se resume a HTML versus Markdown:

Dito isto, posso imaginar algumas páginas funcionando melhor para os usuários e outras melhor para os sistemas de IA, mas duvido que isso se deva ao formato do arquivo, e definitivamente não é generalizável para tudo. (Excluindo JS, que ainda parece difícil para muitos desses sistemas).”

Tomados em conjunto, os comentários de Mueller sugerem que, do ponto de vista do Google, você não precisa criar clones Markdown ou JSON somente para bot de páginas existentes apenas para serem compreendidos pelos LLMs.

Como os dados estruturados se encaixam

Outros indivíduos no tópico traçaram uma linha entre formatos especulativos de “sombra” e casos em que as plataformas de IA têm requisitos de feed claramente definidos.

Uma resposta de Matt Wright apontou para o OpenAI Feeds de produtos de comércio eletrônico como um exemplo onde os esquemas JSON são importantes.

Nesse contexto, uma especificação definida rege como o ChatGPT ingere e exibe os dados do produto. Wright explica:

Curiosamente, os feeds de produtos de comércio eletrônico OpenAI estão ativos: os esquemas JSON parecem já ter um papel fundamental na pesquisa de IA.

Esse exemplo apoia a ideia de que feeds e esquemas estruturados são mais importantes quando uma plataforma publica uma especificação e solicita que você a use.

Além disso, Wright aponta para um tópico no LinkedIn onde Chris Long observou que “sites editoriais que usam esquemas de produtos tendem a ser incluídos nas citações do ChatGPT”.

Por que isso é importante

Se você está questionando se deve criar versões Markdown ou JSON “otimizadas para LLM” de seu conteúdo, essa troca pode ajudar a orientá-lo de volta ao básico.

Os comentários de Mueller reforçam que os LLMs há muito tempo são capazes de ler e analisar HTML padrão.

Para a maioria dos sites, é mais produtivo continuar melhorando a velocidade, a legibilidade e a estrutura do conteúdo nas páginas que você já possui e implementar o esquema onde há uma orientação clara da plataforma.

Ao mesmo tempo, o tópico Bluesky mostra que formatos específicos de IA estão começando a surgir em áreas restritas, como feeds de produtos. Vale a pena rastreá-los, mas estão vinculados a integrações explícitas, e não a uma regra geral de que a redução é melhor para LLMs.

Olhando para o futuro

A conversa destaca a rapidez com que as mudanças de pesquisa orientadas por IA estão se transformando em solicitações técnicas para equipes de SEO e de desenvolvimento, muitas vezes antes que haja documentação para apoiá-las.

Até que os provedores de LLM publiquem diretrizes mais concretas, este tópico aponta de volta ao trabalho que você pode justificar hoje: mantenha seu HTML limpo, reduza JavaScript desnecessário onde dificulta a análise do conteúdo e use dados estruturados onde as plataformas tenham esquemas claramente documentados.


Imagem em destaque: Roman Samborskyi/Shutterstock

”Negócio desatualizado ele não está apenas perdendo dinheiro, mas está perdendo a chance de fazer a diferença ao mundo”

Atualizex Marketing e Performance

Produtor