A IA Progress barracas para tarefas de SEO, apesar da onda de novos modelos

Cleiton

4 semanas atrás

O modelo de IA recente lançamentos na segunda metade de 2025 não melhorou na execução de tarefas relacionadas ao SEO.

Tl; dr: o que você precisa saber sobre o benchmark LLM

O Claude Opus 4.1 continua sendo o melhor modelo de idioma para executar tarefas relacionadas a SEO, como SEO técnico, localização, estratégia de SEO e otimização na página.
O ChatGPT-5 melhorou em nossa referência, apesar da reação negativa do público ao seu lançamento inicial.
A Copilot, que aproveita o GPT-5, é tão performante quanto o modelo do Openai. Esta é uma grande atualização, pois anteriormente tem desempenho inferior.
Gemini 2.5 Pro é uma terceira opção forte. Ele tem o impacto mais potencial para SEOs e profissionais de marketing devido à integração básica do produto (Gmail, folhas, slides, documentos) e modalidades focadas na IA que impulsionam ainda mais sua utilidade (Opal, notebooklm).

A referência da AI SEO

Em abril, o premisível lançou o Ai Seo Benchmarkum esforço estruturado para avaliar a eficácia dos modelos de linguagem (LLMS) e efetivamente executar tarefas de SEO no mundo real. Este estudo foi focado em responder a duas perguntas principais:

A IA pode executar de maneira confiável tarefas de SEO em um nível de especialista?
À medida que esses modelos melhoram, sua utilidade mudará como os profissionais de marketing devem recursos para tarefas de SEO e Geo?

Para responder a isso, selecionamos um conjunto abrangente de perguntas em várias disciplinas de SEO, estratégia de conteúdo, otimização na página, construção de links e SEO técnico. Essas perguntas foram desenvolvidas por uma equipe de profissionais experientes de SEO com mais de 10 anos de experiência em suas respectivas especialidades.

Em seguida, executamos os LLMs líderes por essa bateria de perguntas, marcando suas respostas em 100. Essa abordagem de benchmarking reflete como o desempenho da IA é testado em campos como desenvolvimento de software, raciocínio matemático e tarefas baseadas em lógica.

Descobertas iniciais

Nossa primeira referência em abril entregou resultados impressionantes, embora não surpreendentes:

O LLMS teve um bom desempenho em tarefas de SEO focadas em conteúdo, como estratégia de palavras-chave e criação de metadados.
No entanto, o LLMS lutou com o SEO técnico, onde precisão e pensamento previsível são críticos.

Uma nova onda de modelos

Desde então, a paisagem mudou drasticamente. Quase todos os principais provedores de IA lançaram um novo modelo (com a notável exceção da llama da Meta). Com esse influxo de recursos atualizados, executamos novamente a referência e atualizamos a tabela de classificação.

Então, como os modelos mais recentes se comparam? E o que isso significa para como as equipes de SEO alocam tempo, ferramentas e talentos?

Na próxima parcela, compartilharemos pontuações atualizadas, quebras de desempenho por disciplina de SEO e implicações para os profissionais de marketing.

Muita coisa mudou desde abril, então vamos dar uma olhada na tabela de classificação agora que quase todas as principais empresas de IA lançaram novos modelos (exceto a llama).

A IA Progress barracas para tarefas de SEO, apesar da onda de novos modelos 3

LLM LIFERTBOLA DE LIGADO 10 de setembro de 2025 escalado — A IA Progress barracas para tarefas de SEO, apesar da onda de novos modelos 3

Ai Seo Benchmark

A referência viu algum movimento, mas não quebrou o teto do que era possível em abril.

Se você não é um SEO treinado, eu ficaria extremamente cauteloso ao confiar no LLMS para executar tarefas de SEO.

Ao pesquisar este post, procuramos a comunidade de SEO para exemplos de IA Run Aomográfica.

Aqui estão alguns exemplos:

Quando comecei a usar a IA para SEO, ele encontrou 404 erros para URLs que não existiam, o que a IA alegou ter backlinks. Apresentei essas descobertas à equipe de desenvolvimento e gerenciamento como uma espécie de grande “vitória”.
Eu precisava realizar uma análise de queda de classificação para um site grande com um curto tempo de resposta. Eu executei a análise através do ChatGPT e fiquei impressionado com a categorização e as idéias. A equipe estava empolgada e queria um mergulho profundo, uma análise adicional e uma apresentação das descobertas. Quando eu cavei um pouco mais profundo, toda a “análise” subjacente acabou sendo significativamente fora da base, e eu tive que começar de novo e parecia tolo.
Os LLMs não estão em conformidade com o WordCounts; Eles nem os entendem, então sou levado a acreditar. Então, eu executei um script que automatizava algumas milhares de páginas de edições HTML e o resultado foram parágrafos completos de conteúdo e ensaios em tags de título (caracteres máximos usuais 160!) Isso também custa muito mais do que eu queria pagar!

Essas são experiências anedóticas, mas elas vêm de SEOs profissionais. Se você é um executivo que se importa com a pesquisa, ainda precisa de SEOs treinados que possam utilizar o LLMS corretamente.

O progresso da IA diminuiu a velocidade?

Para aqueles que não são “agiados”, você provavelmente notou o ritmo moderado de mudança este ano. Há interrupção, mas está impactando principalmente o Hype Bubblecom o ChatGPT-5 notavelmente abaixo do desempenho após sua estréia.

Isso não é surpreendente com base no que Ilya Sutskiver disse à Reuters No ano passado, sobre a “ampliação de pré-treinamento-a fase do treinamento de um modelo de IA que usa uma grande quantidade de dados não marcados para entender os padrões e estruturas de linguagem-tem platô”.

AI continuará a progredir. Este benchmark se concentra nos negócios atuais de serviços públicos.

Se essas ferramentas não estão fornecendo valor ou eficiência em nossos fluxos de trabalho atuais, de que é o bem? O Google tem obtido ganhos nessa área.

Google é o azarão

Há um ano, eu havia escrito os primeiros modelos de gêmeos do Google. Como usuário inicial, a experiência foi assombrosa e, francamente, inutilizável. No entanto, minha perspectiva mudou completamente com o lançamento do Gemini 2.5 Pro.

O Gemini 2.5 não apenas tem um desempenho impressionante em nossa referência, mas também é profundamente integrado no ecossistema do Google. É aí que está sua verdadeira vantagem.

Agora posso redigir um email que entenda automaticamente o contexto de documentos que criei no Google Drive, reuniões de referência do calendário ou puxar informações do Google Docs and Sheets, tudo dentro de uma única interface. Essa é uma utilidade real e perfeita que nenhum outro LLM oferece atualmente em escala.

Enquanto muitos LLMs lutam para construir um fosso sustentável, o Google já tem um: integração onipresente de dados. A capacidade de recuperar e agir sobre informações relevantes em todos os produtos do Google é uma vantagem estratégica difícil de replicar.

É perfeito? Ainda não. No entanto, se o ritmo da melhoria do produto continuar, o Google poderá se tornar silenciosamente o jogador mais dominante da IA aplicada.

Aplicando o benchmark: onde a IA está hoje

Construímos esse benchmark para ser uma ferramenta viva, algo que continuaremos atualizando à medida que novos modelos são lançados e os recursos evoluem. Então, onde estão as coisas em setembro de 2025?

A IA pode executar de maneira confiável tarefas de SEO em um nível de especialista?

Não. Apesar dos grandes avanços no LLMS, a maioria ainda não possui execução em nível de especialista, especialmente em áreas que exigem estratégia diferenciada, precisão técnica ou pensamento de sistemas.

As melhorias no modelo mudarão como os profissionais de marketing de SEO e funções geográficas?

Não significativamente. Estamos vendo ganhos incrementais em velocidade e suporte para determinadas tarefas, mas não o suficiente para justificar uma mudança completa na estrutura da equipe ou na estratégia de investimento. A utilidade está nos ganhos de eficiência, não na automação em escala.

Em suma, não espere que o ChatGPT ou a Gêmeos substituam sua equipe de SEO. Espere que eles o aprimorem quando usados com sabedoria.

A IA ainda decepciona em tarefas complexas. Mas a lacuna está fechando.

Fique atento à referência. Mais importante, comece a aproveitar essas ferramentas antes que seus concorrentes o façam. A adoção antecipada não é apenas um impulso de produtividade – é uma vantagem estratégica.

Os autores contribuintes são convidados a criar conteúdo para a terra dos mecanismos de pesquisa e são escolhidos por sua experiência e contribuição para a comunidade de pesquisa. Nossos colaboradores trabalham sob a supervisão da equipe editorial e as contribuições são verificadas quanto à qualidade e relevância para nossos leitores. A terra do mecanismo de pesquisa é de propriedade de Semrush. Não foi solicitado o colaborador a fazer menções diretas ou indiretas a Semrush. As opiniões que eles expressam são suas.