Home / Nosso Blog
Leve seu marketing digital para o próximo nível com estratégias baseadas em dados e soluções inovadoras. Vamos criar algo incrível juntos!
Acompanhe semanalmente nosso canal no youtube com vídeos de marketing e performance e se inscreva-se

O Google publicou um artigo de pesquisa sobre a criação de um conjunto de dados desafiador para treinar agentes de IA para pesquisas profundas. O artigo oferece insights sobre como funciona a pesquisa profunda de IA de agência, o que implica insights para otimizar o conteúdo.
A sigla SAGE significa Steerable Agentic Data Generation for Deep Search com Execution Feedback.
Os pesquisadores observaram que os conjuntos de dados de treinamento de IA de última geração (como Musique e HotpotQA) não exigiam mais do que quatro etapas de raciocínio para responder às perguntas. Quanto ao número de pesquisas necessárias para responder a uma pergunta, o Musique tem uma média de 2,7 pesquisas por pergunta e o HotpotQA tem uma média de 2,1 pesquisas. Outro conjunto de dados comumente usado chamado Natural Questions (NQ) exigiu apenas uma média de 1,3 pesquisas por pergunta.
Esses conjuntos de dados usados para treinar agentes de IA criaram uma lacuna de treinamento para tarefas de pesquisa profunda que exigiam mais etapas de raciocínio e um maior número de pesquisas. Como você pode treinar um agente de IA para tarefas complexas de pesquisa profunda no mundo real se os agentes de IA não foram treinados para lidar com questões realmente difíceis.
Os pesquisadores criaram um sistema chamado SAGE que gera automaticamente pares de perguntas e respostas complexas e de alta qualidade para treinar agentes de pesquisa de IA. SAGE é um sistema de “agente duplo” onde uma IA escreve uma pergunta e uma segunda IA de “agente de pesquisa” tenta resolvê-la, fornecendo feedback sobre a complexidade da questão.
A chave para o SAGE é que se a segunda IA resolver a questão com muita facilidade ou errar, as etapas e documentos específicos encontrados (o rastreamento de execução) serão retornados à primeira IA. Esse feedback permite que a primeira IA identifique um dos quatro atalhos que permitem à segunda IA resolver a questão em menos etapas.
São esses atalhos que fornecem insights sobre como obter uma melhor classificação para tarefas de pesquisa profunda.
O objetivo do artigo era criar um conjunto de pares de perguntas e respostas que fossem tão difíceis que o agente de IA precisasse de várias etapas para resolvê-los. O feedback mostrou quatro maneiras que tornaram menos necessário que o agente de IA fizesse pesquisas adicionais para encontrar uma resposta.
Os pesquisadores descobriram que algumas questões parecem difíceis, mas na verdade são relativamente fáceis porque as informações estão “co-localizadas” em um documento. Se um agente puder responder a uma pergunta de 4 saltos em 1 salto porque um site foi abrangente o suficiente para ter todas as respostas, esse ponto de dados é considerado uma falha no treinamento do agente para o raciocínio, mas ainda é algo que pode acontecer na vida real e o agente aproveitará a vantagem de encontrar todas as informações em uma página.
É possível obter alguns insights sobre quais tipos de conteúdo satisfazem a pesquisa profunda. Embora essas não sejam necessariamente táticas para uma melhor classificação na pesquisa profunda de IA de agente, esses insights mostram que tipos de cenários fizeram com que os agentes de IA encontrassem todas ou a maioria das respostas em uma página da web.
“Co-localização de informações” pode ser uma vitória de SEO
Os pesquisadores descobriram que quando várias informações necessárias para responder a uma pergunta ocorrem no mesmo documento, o número de etapas de pesquisa necessárias é reduzido. Para um editor, isso significa consolidar fatos “dispersos” em uma página, evitando que um agente de IA tenha que “saltar” até o site de um concorrente para encontrar o resto da resposta.
Acionando “Colapso de múltiplas consultas”
Os autores identificaram um fenômeno onde informações de diferentes documentos podem ser recuperadas usando uma única consulta. Ao estruturar o conteúdo para responder a várias subperguntas de uma vez, você permite que o agente encontre a solução completa em sua página com mais rapidez, efetivamente “curto-circuitando” a longa cadeia de raciocínio que o agente estava preparado para empreender.
Eliminando “atalhos” (a lacuna de raciocínio)
O artigo de pesquisa observa que o gerador de dados falha quando cria acidentalmente um “atalho” para a resposta. Como SEO, seu objetivo é ser esse atalho – fornecendo pontos de dados específicos, como cálculos, datas ou nomes, que permitem ao agente chegar à resposta final sem maior exploração.
Para um SEO e um editor, esses atalhos enfatizam o valor da criação de um documento abrangente porque eliminarão a necessidade de um agente de IA ser acionado para ir para outro lugar. Isso não significa que será útil adicionar todas as informações em uma página. Se fizer sentido para um usuário, pode ser útil vincular uma página a outra para obter informações relacionadas.
Digo isso porque o agente de IA está conduzindo uma pesquisa clássica em busca de respostas, então o objetivo continua sendo otimizar uma página da web para a pesquisa clássica. Além disso, nesta pesquisa, o agente de IA extrai das três páginas da web mais bem classificadas para cada consulta que está executando. Não sei se é assim que a pesquisa de IA de agente funciona em um ambiente ativo, mas isso é algo a considerar.
Na verdade, um dos testes que os pesquisadores fizeram foi realizado usando a API Serper para extrair resultados de pesquisa do Google.
Portanto, quando se trata de classificação na pesquisa de IA de agente, considere estas conclusões:
Pode ser que a pesquisa de IA de agente considere extrair mais do que os três primeiros na pesquisa clássica. Mas pode ser útil definir a meta de classificação entre os três primeiros na pesquisa clássica e focar na classificação de outras páginas que possam fazer parte da pesquisa profunda multi-hop.
O artigo de pesquisa foi publicado pelo Google em 26 de janeiro de 2026. Está disponível em formato PDF: SAGE: geração de dados de agente orientáveis para pesquisa profunda com feedback de execução.
Imagem em destaque da Shutterstock/Shutterstock AI Generator
”Negócio desatualizado ele não está apenas perdendo dinheiro, mas está perdendo a chance de fazer a diferença ao mundo”
Produtor
Fale agora com um especialista da Atualizex e receba uma análise estratégica personalizada para o seu negócio.
Falar com Especialista no WhatsApp