Edit Content
Click on the Edit Content button to edit/add the content.

Growth Strategies for Digital Businesses

Lista completa de rastreadores para agentes de usuários de IA (dezembro de 2025)

Home / Nosso Blog

Transforme seu negócio com a Atualizex

Leve seu marketing digital para o próximo nível com estratégias baseadas em dados e soluções inovadoras. Vamos criar algo incrível juntos!

Siga nosso Canal

Acompanhe semanalmente nosso canal no youtube com vídeos de marketing e performance e se inscreva-se

Complete Crawler List For AI User-Agents [Dec 2025]

Lista completa de rastreadores para agentes de usuários de IA (dezembro de 2025)

A visibilidade da IA ​​desempenha um papel crucial para os SEOs, e isso começa com o controle dos rastreadores de IA. Se os rastreadores de IA não conseguirem acessar suas páginas, você ficará invisível para os mecanismos de descoberta de IA.

Por outro lado, os rastreadores de IA não monitorados podem sobrecarregar os servidores com solicitações excessivas, causando travamentos e contas de hospedagem inesperadas.

As strings do agente do usuário são essenciais para controlar quais rastreadores de IA podem acessar seu site, mas a documentação oficial geralmente está desatualizada, incompleta ou totalmente ausente. Portanto, selecionamos uma lista verificada de rastreadores de IA a partir de nossos logs reais do servidor como uma referência útil.

Cada agente de usuário é validado em listas oficiais de IP quando disponíveis, garantindo precisão. Manteremos e atualizaremos esta lista para capturar novos rastreadores e alterações nos existentes.

A lista completa de rastreadores de IA verificados (dezembro de 2025)

NomePropósitoTaxa de rastreamento de SEJ (páginas/hora)Lista de IP verificadosRobots.txt não permitidoAgente de usuário completo
GPTBotColeta de dados de treinamento de IA para modelos GPT (ChatGPT, GPT-4o)100Lista oficial de IPAgente de usuário: GPTBot
Permitir: /
Não permitir: /pasta privada
Mozilla/5.0 AppleWebKit/537.36 (KHTML, como Gecko; compatível; GPTBot/1.3; +
Usuário ChatGPTAgente de IA para navegação na web em tempo real quando os usuários interagem com ChatGPT2400Lista oficial de IPAgente do usuário: ChatGPT-User
Permitir: /
Não permitir: /pasta privada
Mozilla/5.0 AppleWebKit/537.36 (KHTML, como Gecko); compatível; ChatGPT-User/1.0; +
OAI-SearchBotIndexação de pesquisa AI para recursos de pesquisa ChatGPT (não para treinamento)150Lista oficial de IPAgente do usuário: OAI-SearchBot
Permitir: /
Não permitir: /pasta privada
Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, como Gecko) Chrome/131.0.0.0 Safari/537.36; compatível; OAI-SearchBot/1.3; +
ClaudeBotColeta de dados de treinamento de IA para modelos Claude500Lista oficial de IPAgente do usuário: ClaudeBot
Permitir: /
Não permitir: /pasta privada
Mozilla/5.0 AppleWebKit/537.36 (KHTML, como Gecko; compatível; ClaudeBot/1.0; +claudebot@anthropic.com)
Claude-UsuárioAgente de IA para acesso à web em tempo real quando os usuários do Claude navegam<10Não disponívelAgente do usuário: Claude-User
Não permitir: /pasta de amostra
Mozilla/5.0 AppleWebKit/537.36 (KHTML, como Gecko; compatível; Claude-User/1.0; +Claude-User@anthropic.com)
Claude-SearchBotIndexação de pesquisa AI para recursos de pesquisa Claude<10Não disponívelAgente de usuário: Claude-SearchBot
Permitir: /
Não permitir: /pasta privada
Mozilla/5.0 AppleWebKit/537.36 (KHTML, como Gecko; compatível; Claude-SearchBot/1.0; +
Google-CloudVertexBotAgente de IA para Vertex AI Agent Builder (somente solicitação dos proprietários do site)<10Lista oficial de IPAgente de usuário: Google-CloudVertexBot
Permitir: /
Não permitir: /pasta privada
Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, como Gecko) Chrome/141.0.7390.122 Mobile Safari/537.36 (compatível; Google-CloudVertexBot; +
Estendido pelo GoogleToken que controla o uso de treinamento de IA de conteúdo rastreado pelo Googlebot.Agente do usuário: Google-Extended
Permitir: /
Não permitir: /pasta privada
Pesquisa Profunda de GêmeosAgente de pesquisa de IA para o recurso Deep Research do Google Gemini<10Lista oficial de IPAgente do usuário: Gemini-Deep-Research
Permitir: /
Não permitir: /pasta privada
Mozilla/5.0 AppleWebKit/537.36 (KHTML, como Gecko; compatível; Gemini-Deep-Research; + Chrome/135.0.0.0 Safari/537.36
Google Bate-papo do Gemini quando um usuário pede para abrir uma página da web<10Google
BingbotCapacita as respostas de IA do Bing Search e do Bing Chat (Copilot)1300Lista oficial de IPAgente de usuário: BingBot
Permitir: /
Não permitir: /pasta privada
Mozilla/5.0 AppleWebKit/537.36 (KHTML, como Gecko; compatível; bingbot/2.0; + Chrome/116.0.1938.76 Safari/537.36
Applebot estendidoNão rasteja mas controla como a Apple usa os dados do Applebot.<10Lista oficial de IPAgente do usuário: Applebot-Extended
Permitir: /
Não permitir: /pasta privada
Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, como Gecko) Versão/17.4 Safari/605.1.15 (Applebot/0.1; +
PerplexidadeBotIndexação de pesquisa de IA para o mecanismo de resposta do Perplexity150Lista oficial de IPAgente do usuário: PerplexityBot
Permitir: /
Não permitir: /pasta privada
Mozilla/5.0 AppleWebKit/537.36 (KHTML, como Gecko; compatível; PerplexityBot/1.0; +
Usuário de perplexidadeAgente de IA para navegação em tempo real quando usuários do Perplexity solicitam informações<10Lista oficial de IPAgente do usuário: usuário perplexidade
Permitir: /
Não permitir: /pasta privada
Mozilla/5.0 AppleWebKit/537.36 (KHTML, como Gecko; compatível; Perplexity-User/1.0; +
Meta-Agente ExternoColeta de dados de treinamento de IA para LLMs da Meta (Llama, etc.)1100Não disponívelAgente do usuário: meta-agente externo
Permitir: /
Não permitir: /pasta privada
meta-agente externo/1.1 (+
Meta-WebIndexerCostumava ser melhorar a pesquisa Meta AI.<10Não disponívelAgente do usuário: Meta-WebIndexer
Permitir: /
Não permitir: /pasta privada
meta-webindexer/1.1 (+
BytespiderDados de treinamento de IA para LLMs da ByteDance para produtos como TikTok<10Não disponívelAgente do usuário: Bytespider
Permitir: /
Não permitir: /pasta privada
Mozilla/5.0 (Linux; Android 5.0) AppleWebKit/537.36 (KHTML, como Gecko) Mobile Safari/537.36 (compatível; Bytespider;
AmazonbotTreinamento de IA para Alexa e outros serviços de IA da Amazon1050Não disponívelAgente de usuário: Amazonbot
Permitir: /
Não permitir: /pasta privada
Mozilla/5.0 AppleWebKit/537.36 (KHTML, como Gecko; compatível; Amazonbot/0.1; + Chrome/119.0.6045.214 Safari/537.36
DuckAssistBotIndexação de pesquisa AI para mecanismo de pesquisa DuckDuckGo20Lista oficial de IPAgente do usuário: DuckAssistBot
Permitir: /
Não permitir: /pasta privada
DuckAssistBot/1.2; (+
Usuário MistralAIBuscador de citações em tempo real da Mistral para o assistente “Le Chat”<10Não disponívelAgente do usuário: MistralAI-User
Permitir: /
Não permitir: /pasta privada
Mozilla/5.0 AppleWebKit/537.36 (KHTML, como Gecko; compatível; MistralAI-User/1.0; +
Webz.ioExtração de dados e web scraping usados ​​por outras empresas de treinamento em IA. Anteriormente conhecido como Omgili.<10Não disponívelAgente do usuário: webzio
Permitir: /
Não permitir: /pasta privada
webzio (+
DiffbotExtração de dados e web scraping utilizados por empresas em todo o mundo.<10Não disponívelAgente do usuário: Diffbot
Permitir: /
Não permitir: /pasta privada
Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.1.2) Gecko/20090729 Firefox/3.5.2 (.NET CLR 3.5.30729; Diffbot/0.1; +
Rastreador ICCColeta de dados de IA e aprendizado de máquina<10Não disponívelAgente do usuário: ICC-Crawler
Permitir: /
Não permitir: /pasta privada
ICC-Crawler/3.0 (compatível com Mozilla; ;
CCBotArquivo web de código aberto usado como dados de treinamento por várias empresas de IA<10Lista oficial de IPAgente de usuário: CCBot
Permitir: /
Não permitir: /pasta privada
CCBot/2.0 (

As strings do agente do usuário acima foram todas verificadas nos logs do servidor do Search Engine Journal.

Rastreadores populares de agentes de IA com agente de usuário não identificável

Descobrimos que os seguintes não se identificaram:

  • você.com.
  • Operador agente do ChatGPT.
  • Bate-papo do Copiloto do Bing.
  • Grok.
  • DeepSeek.

Não há nenhuma maneira de rastrear o acesso deste rastreador a páginas da web, a não ser identificando o IP explícito.

Montamos uma página armadilha (e.g., /specific-page-for-you-com/) e usamos o bate-papo na página para solicitar que you.com o visitasse, o que nos permitiu localizar o registro de visita correspondente e o endereço IP em nossos registros de servidor. Abaixo está a captura de tela:

Captura de tela do autor, dezembro de 2025

E quanto aos navegadores Agentic AI?

Infelizmente, navegadores de IA como Comet ou Atlas do ChatGPT não se diferenciam na string do agente do usuário e você não pode identificá-los nos logs do servidor e misturá-los com as visitas normais dos usuários.

String agetn do usuário do navegador Atlas do Chatgpt dos registros de log do servidor
String do agente do usuário do navegador Atlas do ChatGPT dos registros de log do servidor (captura de tela do autor, dezembro de 2025)

Isso é decepcionante para os SEOs porque rastrear as visitas do navegador do agente a um site é importante para relatar o ponto de vista.

Como verificar o que está rastreando seu servidor

Algumas empresas de hospedagem oferecem uma interface de usuário (UI) que facilita o acesso e a visualização dos logs do servidor, dependendo do serviço de hospedagem que você está usando.

Se sua hospedagem não oferecer isso, você poderá obter arquivos de log do servidor (geralmente localizados /var/log/apache2/access.log em servidores baseados em Linux) via FTP ou solicite ao suporte do servidor que o envie para você.

Depois de ter o arquivo de registro, você pode visualizá-lo e analisá-lo no Planilhas Google (se o arquivo estiver no formato CSV), no analisador de log do Screaming Frog ou, se o seu arquivo de registro for menos de 100 MBvocê pode tentar analisá-lo com Gemini AI.

Como verificar legítimos vs. Bots falsos

Rastreadores falsos podem falsificar agentes de usuários legítimos para contornar restrições e coletar conteúdo de forma agressiva. Por exemplo, qualquer pessoa pode se passar por ClaudeBot em seu laptop e iniciar uma solicitação de rastreamento no terminal. No log do seu servidor, você verá enquanto Claudebot o rastreia:

curl -A 'Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ClaudeBot/1.0; +claudebot@anthropic.com)' 

A verificação pode ajudar a economizar largura de banda do servidor e evitar a coleta ilegal de conteúdo. O método de verificação mais confiável que você pode aplicar é verificar o IP da solicitação.

Verifique todos os IPs e verifique se é um dos IPs declarados oficialmente listados acima. Se sim, você pode permitir a solicitação; caso contrário, bloqueie.

Vários tipos de firewalls pode ajudar você com isso, por meio de IPs verificados na lista de permissões (que permite a passagem de solicitações de bot legítimas), e todas as outras solicitações que representam rastreadores de IA em suas strings de agente de usuário são bloqueadas.

Por exemplo, no WordPress, você pode usar Plug-in gratuito do Wordfence para permitir IPs legítimos das listas oficiais (como acima) e adicionar regras personalizadas de bloqueio conforme abaixo:

A regra da lista de permissões é superior e permitirá que rastreadores legítimos passem e bloqueiem qualquer solicitação de representação proveniente de IPs diferentes.

No entanto, note que é possível falsificar um endereço IPe, nesse caso, quando o agente do usuário do bot e os IPs forem falsificados, você não poderá bloqueá-los.

Conclusão: mantenha o controle dos rastreadores de IA para obter visibilidade confiável da IA

Os rastreadores de IA agora fazem parte do nosso ecossistema web, e os bots listados aqui representam as principais plataformas de IA atualmente indexando a web, embora esta lista provavelmente cresça.

Verifique os logs do servidor regularmente para ver o que realmente está atingindo seu site e certifique-se de não bloquear inadvertidamente os rastreadores de IA se a visibilidade nos mecanismos de pesquisa de IA for importante para o seu negócio. Se você não deseja que os rastreadores de IA acessem seu conteúdo, bloqueie-os via robots.txt usando o nome do agente do usuário.

Manteremos esta lista atualizada à medida que novos rastreadores surgirem e atualizarmos os existentes, por isso recomendamos que você marque este URL ou revise este artigo regularmente para manter sua lista de rastreadores de IA atualizada.

Mais recursos:


Imagem em destaque: BestForBest/Shutterstock

”Negócio desatualizado ele não está apenas perdendo dinheiro, mas está perdendo a chance de fazer a diferença ao mundo”

Atualizex Marketing e Performance

Produtor

Quer aumentar seu faturamento através da internet ?

Nossa solução traz para você um plano 100% personalizado de acordo com o seu projeto e com isso fazemos essa apresentação online em uma reunião de 20 a 40 minutos quer receber esse diagnóstico para sua empresa entre em contato via whatsapp !