Edit Content
Click on the Edit Content button to edit/add the content.

Growth Strategies for Digital Businesses

Medindo quando assistentes de IA e mecanismos de pesquisa discordam

Home / Nosso Blog

Transforme seu negócio com a Atualizex

Leve seu marketing digital para o próximo nível com estratégias baseadas em dados e soluções inovadoras. Vamos criar algo incrível juntos!

Siga nosso Canal

Acompanhe semanalmente nosso canal no youtube com vídeos de marketing e performance e se inscreva-se

Measuring When AI Assistants And Search Engines Disagree

Medindo quando assistentes de IA e mecanismos de pesquisa discordam

Antes de começar, é importante prestar atenção a este aviso: Há matemática pela frente! Se fazer matemática e aprender equações faz sua cabeça girar ou dá vontade de sentar e comer um bolo inteiro, prepare-se (ou pegue um bolo). Mas se você gosta de matemática, se gosta de equações e realmente acredita que k = N (sádico!), ah, este artigo vai emocioná-lo à medida que exploramos a pesquisa híbrida com um pouco mais de profundidade.

(Crédito da imagem: Duane Forrester)

Durante anos (décadas), o SEO viveu dentro de um único ciclo de feedback. Nós otimizamos, classificamos e rastreamos. Tudo fez sentido porque o Google nos deu o placar. (Estou simplificando demais, mas você entendeu.)

Agora, os assistentes de IA ficam acima dessa camada. Eles resumem, citam e respondem a perguntas antes que um clique aconteça. Seu conteúdo pode ser divulgado, parafraseado ou ignorado, e nada disso aparece nas análises.

Isso não torna o SEO obsoleto. Isso significa que um novo tipo de visibilidade agora corre paralelamente a ele. Este artigo mostra ideias de como medir essa visibilidade sem código, acesso especial ou desenvolvedor, e como se manter fundamentado no que realmente sabemos.

Por que isso é importante

Os mecanismos de pesquisa ainda geram quase todo o tráfego mensurável. Google sozinho alças quase 4 bilhões de pesquisas por dia. Em comparação, o Perplexity relatou volume total anual de consultas é cerca de 10 bilhões.

Então, sim, os assistentes ainda são pequenos em comparação. Mas eles estão moldando a forma como as informações são interpretadas. Você já pode ver isso quando ChatGPT Search ou Perplexity responde a uma pergunta e vincula suas fontes. Essas citações revelam em quais blocos de conteúdo (pedaços) e domínios os modelos confiam atualmente.

O desafio é que os profissionais de marketing não têm um painel nativo para mostrar com que frequência isso acontece. O Google adicionou recentemente dados de desempenho do modo AI ao Search Console. De acordo com o Google documentaçãoImpressões, cliques e posições do Modo AI agora estão incluídos no tipo geral de pesquisa “Web”.

Essa inclusão é importante, mas está integrada. Atualmente não há como isolar o tráfego do Modo AI. Os dados estão lá, apenas dobrados no balde maior. Sem divisão percentual. Nenhuma linha de tendência. Ainda não.

Até que essa visibilidade melhore, sugiro que possamos usar um teste de proxy para entender onde os assistentes e a pesquisa concordam e onde divergem.

Dois sistemas de recuperação, duas maneiras de serem encontradas

Os mecanismos de pesquisa tradicionais usam recuperação lexical, onde correspondem palavras e frases diretamente. O algoritmo dominante, BM25, alimenta soluções como Elasticsearch e sistemas semelhantes há anos. Também está em uso nos mecanismos de pesquisa comuns de hoje.

Os assistentes de IA contam com recuperação semântica. Em vez de palavras exatas, eles mapeiam o significado por meio de incorporaçõesas impressões digitais matemáticas do texto. Isso permite que eles encontrem passagens conceitualmente relacionadas, mesmo quando as palavras exatas são diferentes.

Cada sistema comete erros diferentes. A recuperação lexical perde sinônimos. A recuperação semântica pode conectar ideias não relacionadas. Mas quando combinados, produzem melhores resultados.

Na maioria dos sistemas de recuperação híbridos, os dois métodos são fundidos usando uma regra chamada Fusão de classificação recíproca (RRF). Você não precisa ser capaz de executá-lo, mas compreender o conceito ajuda a interpretar o que medirá mais tarde.

RRF em inglês simples

A recuperação híbrida mescla várias listas classificadas em uma lista balanceada. A matemática por trás dessa fusão é RRF.

A fórmula é simples: a pontuação é igual a um dividido por k mais a classificação. Isso é escrito como 1 ÷ (k + classificação). Se um item aparecer em várias listas, você soma essas pontuações.

Aqui, “classificação” significa a posição do item nessa lista, começando com 1 no topo. “k” é uma constante que suaviza a diferença entre os itens de classificação superior e intermediária. A maioria dos sistemas normalmente usa algo próximo a 60, mas cada um pode ajustá-lo de maneira diferente.

Vale lembrar que um modelo vetorial não classifica os resultados contando as correspondências de palavras. Ele mede o quão próximo cada documento está incorporação é a incorporação da consulta no espaço multidimensional. O sistema então classifica essas pontuações de similaridade da maior para a menor, criando efetivamente uma lista classificada. Parece uma classificação de mecanismo de pesquisa, mas é impulsionada por matemática à distâncianão frequência do termo.

(Crédito da imagem: Duane Forrester)

Vamos tornar isso tangível com números pequenos e duas listas classificadas. Um do BM25 (relevância de palavras-chave) e outro de modelo vetorial (relevância semântica). Usaremos k = 10 para maior clareza.

Documento A é classificado como número 1 no BM25 e número 3 na lista de vetores.
Do BM25: 1 ÷ (10 + 1) = 1 ÷ 11 = 0,0909.
Da lista de vetores: 1 ÷ (10 + 3) = 1 ÷ 13 = 0,0769.
Some-os: 0,0909 + 0,0769 = 0,1678.

Documento B é classificado como número 2 no BM25 e número 1 na lista de vetores.
Do BM25: 1 ÷ (10 + 2) = 1 ÷ 12 = 0,0833.
Da lista de vetores: 1 ÷ (10 + 1) = 1 ÷ 11 = 0,0909.
Adicione-os: 0,0833 + 0,0909 = 0,1742.

Documento C é classificado como número 3 no BM25 e número 2 na lista de vetores.
Do BM25: 1 ÷ (10 + 3) = 1 ÷ 13 = 0,0769.
Da lista de vetores: 1 ÷ (10 + 2) = 1 ÷ 12 = 0,0833.
Adicione-os: 0,0769 + 0,0833 = 0,1602.

Documento B vence aqui, pois tem uma classificação elevada em ambas as listas. Se você aumentar k para 60, as diferenças diminuirão, produzindo uma mistura mais suave e menos pesada.

Este exemplo é meramente ilustrativo. Cada plataforma ajusta os parâmetros de maneira diferente e nenhuma documentação pública confirma quais valores k qualquer mecanismo usa. Pense nisso como uma analogia de como vários sinais são calculados em média.

Onde essa matemática realmente mora

Você nunca precisará codificá-lo, pois o RRF já faz parte das pilhas de pesquisa modernas. Aqui estão exemplos desse tipo de sistema de seus fornecedores básicos. Se você ler tudo isso, terá uma compreensão mais profunda de como plataformas como o Perplexity fazem o que fazem:

Todos eles seguem o mesmo processo básico: recuperar com BM25, recuperar com vetores, pontuar com RRF e mesclar. A matemática acima explica o conceito, não a fórmula literal dentro de cada produto.

Observando a recuperação híbrida na natureza

Os profissionais de marketing não conseguem ver essas listas internas, mas podemos observar como os sistemas se comportam na superfície. O truque é comparar o que o Google classifica com o que um assistente cita e, em seguida, medir a sobreposição, a novidade e a consistência. Esta matemática externa é uma heurística, um proxy para visibilidade. Não é a mesma matemática que as plataformas calculam internamente.

Etapa 1. Reúna os dados

Escolha 10 consultas importantes para sua empresa.

Para cada consulta:

  1. Execute-o na Pesquisa Google e copie os 10 principais URLs orgânicos.
  2. Execute-o em um assistente que mostre citações, como Perplexity ou ChatGPT Search, e copie cada URL ou domínio citado.

Agora você tem duas listas por consulta: Google Top 10 e Assistant Citations.

(Esteja ciente de que nem todo assistente mostra citações completas e nem toda consulta as aciona. Alguns assistentes podem resumir sem listar as fontes. Quando isso acontecer, ignore essa consulta, pois ela simplesmente não pode ser medida dessa forma.)

Etapa 2. Conte três coisas

  1. Intersecção (I): quantos URLs ou domínios aparecem em ambas as listas.
  2. Novidade (N): quantas citações de assistentes não aparecem no top 10 do Google.
    Se o assistente tiver seis citações e três sobreposições, N = 6 − 3 = 3.
  3. Frequência (F): com que frequência cada domínio aparece em todas as 10 consultas.

Etapa 3. Transforme contagens em métricas rápidas

Para cada conjunto de consultas:

Taxa de visibilidade compartilhada (SVR) = I ÷ 10.
Isso mede quanto do top 10 do Google também aparece nas citações do assistente.

Taxa de visibilidade do assistente exclusivo (UAVR) = N ÷ total de citações do assistente para essa consulta.
Isso mostra quanto material novo o assistente apresenta.

Contagem de citações repetidas (RCC) = (soma de F para cada domínio) ÷ número de consultas.
Isso reflete a consistência com que um domínio é citado em diferentes respostas.

Exemplo:

10 principais do Google = 10 URLs. Citações assistentes = 6. Três sobreposições.
I = 3, N = 3, F (por exemplo.com) = 4 (aparece em quatro respostas do assistente).
RVS = 3 ÷ 10 = 0,30.
UAVR = 3 ÷ 6 = 0,50.
RCC = 4 ÷ 10 = 0,40.

Agora você tem um instantâneo numérico de quão próximo os assistentes se espelham ou divergem da pesquisa.

Passo 4. Interpretar

Essas pontuações não são de forma alguma benchmarks do setor, simplesmente pontos de partida sugeridos para você. Sinta-se à vontade para ajustar conforme achar necessário:

  • SVR alto (> 0,6) significa que seu conteúdo está alinhado com ambos os sistemas. A relevância lexical e semântica estão sincronizadas.
  • SVR moderado (0,3 – 0,6) com alto RCC sugere que suas páginas são semanticamente confiáveis, mas precisam de marcação mais clara ou links mais fortes.
  • SVR baixo (<0,3) com UAVR alto mostra que os assistentes confiam em outras fontes. Isso geralmente sinaliza problemas de estrutura ou clareza.
  • Um RCC alto para concorrentes indica que o modelo cita repetidamente seus domínios, portanto, vale a pena estudar dicas de esquema ou design de conteúdo.

Etapa 5. Agir

Se o SVR estiver baixo, melhore os títulos, a clareza e a rastreabilidade. Se o RCC for baixo para sua marca, padronize os campos de autor, esquema e carimbos de data/hora. Se o UAVR for alto, rastreie esses novos domínios, pois eles já podem ter confiança semântica em seu nicho.

(Essa abordagem nem sempre funciona exatamente como descrito. Alguns assistentes limitam o número de citações ou variam regionalmente. Os resultados podem diferir de acordo com a geografia e o tipo de consulta. Trate-o como um exercício de observação, não como uma estrutura rígida.)

Por que esta matemática é importante

Essa matemática oferece aos profissionais de marketing uma maneira de quantificar a concordância e a discordância entre dois sistemas de recuperação. É matemática de diagnóstico, não de classificação. Não explica por que o assistente escolheu uma fonte; diz a você o que aconteceu e com que consistência.

Esse padrão é a borda visível da lógica híbrida invisível que opera nos bastidores. Pense nisso como observar o tempo observando o movimento das árvores. Você não está simulando a atmosfera, apenas lendo seus efeitos.

Trabalho na página que ajuda na recuperação híbrida

Depois de ver como a sobreposição e a novidade funcionam, o próximo passo é reforçar a estrutura e a clareza.

  • Escreva em blocos curtos de afirmações e evidências de 200 a 300 palavras.
  • Use títulos claros, marcadores e âncoras estáveis ​​para que o BM25 possa encontrar os termos exatos.
  • Adicione dados estruturados (FAQ, HowTo, Product, TechArticle) para que vetores e assistentes entendam o contexto.
  • Mantenha os URLs canônicos estáveis ​​e as atualizações de conteúdo com carimbo de data/hora.
  • Publique versões canônicas em PDF para tópicos de alta confiança; os assistentes costumam citar primeiro os formatos fixos e verificáveis.

Essas etapas suportam rastreadores e LLMs, pois compartilham a linguagem de estrutura.

Relatórios e enquadramento executivo

Os executivos não se preocupam com o BM25 ou incorporações tanto quanto se preocupam com visibilidade e confiança.

Suas novas métricas (SVR, UAVR e RCC) podem ajudar a traduzir o resumo em algo mensurável: quanto de sua presença SEO existente é transportada para a descoberta de IA e onde os concorrentes são citados.

Combine essas descobertas com os totais de desempenho do modo AI do Search Console, mas lembre-se: atualmente, você não pode separar os dados do modo AI dos cliques regulares na web, portanto, trate qualquer estimativa específica de IA como direcional, não definitiva. Também vale a pena notar que ainda pode haver limites regionais na disponibilidade de dados.

Esses limites, entretanto, não tornam a matemática menos útil. Eles ajudam a manter as expectativas realistas, ao mesmo tempo que oferecem uma maneira concreta de falar sobre a visibilidade impulsionada pela IA com a liderança.

Resumindo

A lacuna entre a pesquisa e os assistentes não é uma parede. É mais uma diferença de sinal. Os mecanismos de pesquisa classificam as páginas depois que a resposta é conhecida. Os assistentes recuperam pedaços antes que a resposta exista.

A matemática neste artigo é uma ideia de como observar essa transição sem ferramentas de desenvolvedor. Não é a matemática da plataforma; é um proxy do profissional de marketing que ajuda a tornar visível o invisível.

No final, os fundamentos permanecem os mesmos. Você ainda otimiza para clareza, estrutura e autoridade.

Agora você pode medir como essa autoridade transita entre os sistemas de classificação e os sistemas de recuperação, e fazer isso com expectativas realistas.

Essa visibilidade, contabilizada e contextualizada, é como o SEO moderno permanece ancorado na realidade.

Mais recursos:


Esta postagem foi publicada originalmente em Decodificações Duane Forrester.


Imagem em destaque: Roman Samborskyi/Shutterstock

”Negócio desatualizado ele não está apenas perdendo dinheiro, mas está perdendo a chance de fazer a diferença ao mundo”

Atualizex Marketing e Performance

Produtor