Home / Nosso Blog
Leve seu marketing digital para o próximo nível com estratégias baseadas em dados e soluções inovadoras. Vamos criar algo incrível juntos!
Acompanhe semanalmente nosso canal no youtube com vídeos de marketing e performance e se inscreva-se

Antes de começar, é importante prestar atenção a este aviso: Há matemática pela frente! Se fazer matemática e aprender equações faz sua cabeça girar ou dá vontade de sentar e comer um bolo inteiro, prepare-se (ou pegue um bolo). Mas se você gosta de matemática, se gosta de equações e realmente acredita que k = N (sádico!), ah, este artigo vai emocioná-lo à medida que exploramos a pesquisa híbrida com um pouco mais de profundidade.
(Crédito da imagem: Duane Forrester)Durante anos (décadas), o SEO viveu dentro de um único ciclo de feedback. Nós otimizamos, classificamos e rastreamos. Tudo fez sentido porque o Google nos deu o placar. (Estou simplificando demais, mas você entendeu.)
Agora, os assistentes de IA ficam acima dessa camada. Eles resumem, citam e respondem a perguntas antes que um clique aconteça. Seu conteúdo pode ser divulgado, parafraseado ou ignorado, e nada disso aparece nas análises.
Isso não torna o SEO obsoleto. Isso significa que um novo tipo de visibilidade agora corre paralelamente a ele. Este artigo mostra ideias de como medir essa visibilidade sem código, acesso especial ou desenvolvedor, e como se manter fundamentado no que realmente sabemos.
Os mecanismos de pesquisa ainda geram quase todo o tráfego mensurável. Google sozinho alças quase 4 bilhões de pesquisas por dia. Em comparação, o Perplexity relatou volume total anual de consultas é cerca de 10 bilhões.
Então, sim, os assistentes ainda são pequenos em comparação. Mas eles estão moldando a forma como as informações são interpretadas. Você já pode ver isso quando ChatGPT Search ou Perplexity responde a uma pergunta e vincula suas fontes. Essas citações revelam em quais blocos de conteúdo (pedaços) e domínios os modelos confiam atualmente.
O desafio é que os profissionais de marketing não têm um painel nativo para mostrar com que frequência isso acontece. O Google adicionou recentemente dados de desempenho do modo AI ao Search Console. De acordo com o Google documentaçãoImpressões, cliques e posições do Modo AI agora estão incluídos no tipo geral de pesquisa “Web”.
Essa inclusão é importante, mas está integrada. Atualmente não há como isolar o tráfego do Modo AI. Os dados estão lá, apenas dobrados no balde maior. Sem divisão percentual. Nenhuma linha de tendência. Ainda não.
Até que essa visibilidade melhore, sugiro que possamos usar um teste de proxy para entender onde os assistentes e a pesquisa concordam e onde divergem.
Os mecanismos de pesquisa tradicionais usam recuperação lexical, onde correspondem palavras e frases diretamente. O algoritmo dominante, BM25, alimenta soluções como Elasticsearch e sistemas semelhantes há anos. Também está em uso nos mecanismos de pesquisa comuns de hoje.
Os assistentes de IA contam com recuperação semântica. Em vez de palavras exatas, eles mapeiam o significado por meio de incorporaçõesas impressões digitais matemáticas do texto. Isso permite que eles encontrem passagens conceitualmente relacionadas, mesmo quando as palavras exatas são diferentes.
Cada sistema comete erros diferentes. A recuperação lexical perde sinônimos. A recuperação semântica pode conectar ideias não relacionadas. Mas quando combinados, produzem melhores resultados.
Na maioria dos sistemas de recuperação híbridos, os dois métodos são fundidos usando uma regra chamada Fusão de classificação recíproca (RRF). Você não precisa ser capaz de executá-lo, mas compreender o conceito ajuda a interpretar o que medirá mais tarde.
A recuperação híbrida mescla várias listas classificadas em uma lista balanceada. A matemática por trás dessa fusão é RRF.
A fórmula é simples: a pontuação é igual a um dividido por k mais a classificação. Isso é escrito como 1 ÷ (k + classificação). Se um item aparecer em várias listas, você soma essas pontuações.
Aqui, “classificação” significa a posição do item nessa lista, começando com 1 no topo. “k” é uma constante que suaviza a diferença entre os itens de classificação superior e intermediária. A maioria dos sistemas normalmente usa algo próximo a 60, mas cada um pode ajustá-lo de maneira diferente.
Vale lembrar que um modelo vetorial não classifica os resultados contando as correspondências de palavras. Ele mede o quão próximo cada documento está incorporação é a incorporação da consulta no espaço multidimensional. O sistema então classifica essas pontuações de similaridade da maior para a menor, criando efetivamente uma lista classificada. Parece uma classificação de mecanismo de pesquisa, mas é impulsionada por matemática à distâncianão frequência do termo.
(Crédito da imagem: Duane Forrester)Vamos tornar isso tangível com números pequenos e duas listas classificadas. Um do BM25 (relevância de palavras-chave) e outro de modelo vetorial (relevância semântica). Usaremos k = 10 para maior clareza.
Documento A é classificado como número 1 no BM25 e número 3 na lista de vetores.
Do BM25: 1 ÷ (10 + 1) = 1 ÷ 11 = 0,0909.
Da lista de vetores: 1 ÷ (10 + 3) = 1 ÷ 13 = 0,0769.
Some-os: 0,0909 + 0,0769 = 0,1678.
Documento B é classificado como número 2 no BM25 e número 1 na lista de vetores.
Do BM25: 1 ÷ (10 + 2) = 1 ÷ 12 = 0,0833.
Da lista de vetores: 1 ÷ (10 + 1) = 1 ÷ 11 = 0,0909.
Adicione-os: 0,0833 + 0,0909 = 0,1742.
Documento C é classificado como número 3 no BM25 e número 2 na lista de vetores.
Do BM25: 1 ÷ (10 + 3) = 1 ÷ 13 = 0,0769.
Da lista de vetores: 1 ÷ (10 + 2) = 1 ÷ 12 = 0,0833.
Adicione-os: 0,0769 + 0,0833 = 0,1602.
Documento B vence aqui, pois tem uma classificação elevada em ambas as listas. Se você aumentar k para 60, as diferenças diminuirão, produzindo uma mistura mais suave e menos pesada.
Este exemplo é meramente ilustrativo. Cada plataforma ajusta os parâmetros de maneira diferente e nenhuma documentação pública confirma quais valores k qualquer mecanismo usa. Pense nisso como uma analogia de como vários sinais são calculados em média.
Você nunca precisará codificá-lo, pois o RRF já faz parte das pilhas de pesquisa modernas. Aqui estão exemplos desse tipo de sistema de seus fornecedores básicos. Se você ler tudo isso, terá uma compreensão mais profunda de como plataformas como o Perplexity fazem o que fazem:
Todos eles seguem o mesmo processo básico: recuperar com BM25, recuperar com vetores, pontuar com RRF e mesclar. A matemática acima explica o conceito, não a fórmula literal dentro de cada produto.
Os profissionais de marketing não conseguem ver essas listas internas, mas podemos observar como os sistemas se comportam na superfície. O truque é comparar o que o Google classifica com o que um assistente cita e, em seguida, medir a sobreposição, a novidade e a consistência. Esta matemática externa é uma heurística, um proxy para visibilidade. Não é a mesma matemática que as plataformas calculam internamente.
Escolha 10 consultas importantes para sua empresa.
Para cada consulta:
Agora você tem duas listas por consulta: Google Top 10 e Assistant Citations.
(Esteja ciente de que nem todo assistente mostra citações completas e nem toda consulta as aciona. Alguns assistentes podem resumir sem listar as fontes. Quando isso acontecer, ignore essa consulta, pois ela simplesmente não pode ser medida dessa forma.)
Para cada conjunto de consultas:
Taxa de visibilidade compartilhada (SVR) = I ÷ 10.
Isso mede quanto do top 10 do Google também aparece nas citações do assistente.
Taxa de visibilidade do assistente exclusivo (UAVR) = N ÷ total de citações do assistente para essa consulta.
Isso mostra quanto material novo o assistente apresenta.
Contagem de citações repetidas (RCC) = (soma de F para cada domínio) ÷ número de consultas.
Isso reflete a consistência com que um domínio é citado em diferentes respostas.
Exemplo:
10 principais do Google = 10 URLs. Citações assistentes = 6. Três sobreposições.
I = 3, N = 3, F (por exemplo.com) = 4 (aparece em quatro respostas do assistente).
RVS = 3 ÷ 10 = 0,30.
UAVR = 3 ÷ 6 = 0,50.
RCC = 4 ÷ 10 = 0,40.
Agora você tem um instantâneo numérico de quão próximo os assistentes se espelham ou divergem da pesquisa.
Essas pontuações não são de forma alguma benchmarks do setor, simplesmente pontos de partida sugeridos para você. Sinta-se à vontade para ajustar conforme achar necessário:
Se o SVR estiver baixo, melhore os títulos, a clareza e a rastreabilidade. Se o RCC for baixo para sua marca, padronize os campos de autor, esquema e carimbos de data/hora. Se o UAVR for alto, rastreie esses novos domínios, pois eles já podem ter confiança semântica em seu nicho.
(Essa abordagem nem sempre funciona exatamente como descrito. Alguns assistentes limitam o número de citações ou variam regionalmente. Os resultados podem diferir de acordo com a geografia e o tipo de consulta. Trate-o como um exercício de observação, não como uma estrutura rígida.)
Essa matemática oferece aos profissionais de marketing uma maneira de quantificar a concordância e a discordância entre dois sistemas de recuperação. É matemática de diagnóstico, não de classificação. Não explica por que o assistente escolheu uma fonte; diz a você o que aconteceu e com que consistência.
Esse padrão é a borda visível da lógica híbrida invisível que opera nos bastidores. Pense nisso como observar o tempo observando o movimento das árvores. Você não está simulando a atmosfera, apenas lendo seus efeitos.
Depois de ver como a sobreposição e a novidade funcionam, o próximo passo é reforçar a estrutura e a clareza.
Essas etapas suportam rastreadores e LLMs, pois compartilham a linguagem de estrutura.
Os executivos não se preocupam com o BM25 ou incorporações tanto quanto se preocupam com visibilidade e confiança.
Suas novas métricas (SVR, UAVR e RCC) podem ajudar a traduzir o resumo em algo mensurável: quanto de sua presença SEO existente é transportada para a descoberta de IA e onde os concorrentes são citados.
Combine essas descobertas com os totais de desempenho do modo AI do Search Console, mas lembre-se: atualmente, você não pode separar os dados do modo AI dos cliques regulares na web, portanto, trate qualquer estimativa específica de IA como direcional, não definitiva. Também vale a pena notar que ainda pode haver limites regionais na disponibilidade de dados.
Esses limites, entretanto, não tornam a matemática menos útil. Eles ajudam a manter as expectativas realistas, ao mesmo tempo que oferecem uma maneira concreta de falar sobre a visibilidade impulsionada pela IA com a liderança.
A lacuna entre a pesquisa e os assistentes não é uma parede. É mais uma diferença de sinal. Os mecanismos de pesquisa classificam as páginas depois que a resposta é conhecida. Os assistentes recuperam pedaços antes que a resposta exista.
A matemática neste artigo é uma ideia de como observar essa transição sem ferramentas de desenvolvedor. Não é a matemática da plataforma; é um proxy do profissional de marketing que ajuda a tornar visível o invisível.
No final, os fundamentos permanecem os mesmos. Você ainda otimiza para clareza, estrutura e autoridade.
Agora você pode medir como essa autoridade transita entre os sistemas de classificação e os sistemas de recuperação, e fazer isso com expectativas realistas.
Essa visibilidade, contabilizada e contextualizada, é como o SEO moderno permanece ancorado na realidade.
Mais recursos:
Esta postagem foi publicada originalmente em Decodificações Duane Forrester.
Imagem em destaque: Roman Samborskyi/Shutterstock
”Negócio desatualizado ele não está apenas perdendo dinheiro, mas está perdendo a chance de fazer a diferença ao mundo”
Produtor