Ontem encontrei este estudo sobre como pode ser possível otimizar em mecanismos de pesquisa baseados em LLM (pense em Google Bard, Google SGE, Bing, ChatGPT, etc), AI Search ou Motores Gerativos como o estudo os chama.

Eles cunharam esta nova abordagem: Generative Engine Optimization (GEO).

A pesquisa, conduzida por equipes da Universidade de Princeton, Georgia Tech, Allen Institute for AI e IIT Delhi, avalia quais estratégias são eficazes para melhorar a visibilidade nesses tipos de mecanismos de busca.

E isto é interessante, pois os métodos tradicionais de SEO podem não produzir os mesmos resultados com estes motores generativos da nova era, que fornecem respostas diretas e abrangentes e podem potencialmente diminuir o tráfego orgânico para websites.

Portanto, os profissionais de SEO devem compreender e se adaptar a este novo paradigma, pois veremos cada vez mais este tipo de IA no mecanismo de busca Google em 2024 e além.

Ao aproveitar os métodos Generative Engine Optimization (GEO), como incluir citações, citações de fontes relevantes e estatísticas, os SEOs podem aumentar significativamente a visibilidade de um site nos resultados de pesquisa de IA, de acordo com o estudo.

Já discuti um pouco sobre isso quando o Google Bard foi lançado, explicando como sua otimização poderia se assemelhar a estratégias usadas para aprimorar trechos em destaque.

As principais conclusões do estudo foram:

  1. Concentre-se nas métricas de impressões: As métricas tradicionais usadas na otimização de mecanismos de pesquisa (SEO) não são mais suficientes para mecanismos generativos. Em vez disso, o GEO propõe um conjunto de métricas de impressão que medem a visibilidade das citações e sua relevância para a consulta do usuário.
  2. Incluir incluindo citações e citações: O estudo avalia vários métodos GEO e sua eficácia na melhoria da visibilidade da fonte. Notavelmente, métodos como a inclusão de citações, citações de fontes relevantes e estatísticas aumentam significativamente a visibilidade da fonte em até 40% nas respostas generativas do mecanismo.
  3. Otimização Específica de Domínio: O estudo demonstra a importância das estratégias de otimização específicas de domínio. Diferentes métodos GEO apresentam melhor desempenho em determinados domínios, destacando a necessidade de ajustes direcionados para aumentar a visibilidade. Assim como a linguagem oficial funcionou melhor para melhorar o conteúdo histórico, a otimização de citações beneficia as consultas factuais e as estatísticas aprimoram os tópicos jurídicos e governamentais.

Se você quiser detalhes mais substanciais, tentei descrevê-los a seguir.

O que é AI Search ou mecanismos generativos e por que isso é importante?

AI Search ou Large Language Models (LLMs) representam a próxima geração de tecnologia de mecanismo de pesquisa.

Estes sistemas avançados, como o BingChat, o SGE do Google, o Perplexity ou, até certo ponto, o ChatGPT, fundem as capacidades dos motores de busca tradicionais com a adaptabilidade dos modelos generativos.

Esses novos tipos de mecanismos de busca, conhecidos como motores generativos (GE), vão além da simples busca de informações.

Eles geram respostas multimodais sintetizando informações de múltiplas fontes.

Os mecanismos generativos funcionam recuperando documentos relevantes de um banco de dados, como a Internet, e usando grandes modelos neurais para gerar uma resposta.

Essa resposta é fundamentada nas fontes, garantindo a atribuição e proporcionando uma forma de o usuário verificar as informações.

Embora esses mecanismos ofereçam vantagens significativas para desenvolvedores e usuários, eles também representam desafios para criadores de sites e de conteúdo.

Ao contrário dos motores de busca tradicionais, os motores generativos podem fornecer respostas diretas e abrangentes, o que pode levar a uma diminuição do tráfego orgânico para websites e impactar a sua visibilidade.

Como o estudo compara motores de busca clássicos com motores generativos (AI Search)

Mas, novamente, o Google já faz isso há algum tempo com seu snippet em destaque cada vez mais frequente.

Mas é claro que a GE ou a SGE levam isto a um nível totalmente novo.

E à medida que estes motores continuam a evoluir, irão sem dúvida desempenhar um papel fundamental na definição do futuro da tecnologia de pesquisa.

O estudo: “GEO: Otimização de Motor Generativo”

No estudo denominado simplesmente “GEO: Generative Engine Optimization”, os pesquisadores realizaram experimentos para avaliar a eficácia de diferentes métodos de Generative Engine Optimization (GEO).

Eles usaram um benchmark chamado GEO-BENCH, que consistia em 10.000 consultas diversas de diferentes fontes e domínios.

Conjunto de dados Descrição
Macro MS Contém consultas reais de usuários anonimizados dos mecanismos de pesquisa do Bing e do Google.
ORCAS-1 Contém consultas reais de usuários anonimizados dos mecanismos de pesquisa do Bing e do Google.
Perguntas naturais Contém consultas reais de usuários anonimizados dos mecanismos de pesquisa do Bing e do Google.
Todas as almas Contém questões dissertativas do “All Souls College, Oxford University”. Requer que os motores generativos executem o raciocínio apropriado para agregar informações de múltiplas fontes.
LIMA Contém questões desafiadoras que exigem que os motores generativos não apenas agreguem informações, mas também executem um raciocínio adequado para responder à pergunta (por exemplo, escrever um pequeno poema, código python).
Davinci-Dívida Contém questões de debate geradas para testar motores generativos.
Perplexidade.ai Descubra As consultas são provenientes da seção Discover do Perplexity.ai, que é uma lista atualizada de consultas de tendência na plataforma.
ELI-5 Contém perguntas do subreddit ELI5, onde os usuários fazem perguntas complexas e esperam respostas em termos simples e leigos.
Consultas geradas pelo GPT-4 Para complementar a diversidade na distribuição de consultas, o GPT-4 é solicitado a gerar consultas que variam de vários domínios (por exemplo, ciência, história) e com base na intenção da consulta (por exemplo, navegação, transacional) e com base na dificuldade e no escopo da resposta gerada (por exemplo, aberto, baseado em fatos).

Para cada consulta no benchmark, os pesquisadores selecionaram aleatoriamente um site de origem e aplicaram um dos métodos GEO separadamente para otimizar o conteúdo dessa fonte. Eles geraram múltiplas respostas por consulta para garantir confiabilidade estatística.

O desempenho dos métodos GEO foi avaliado por meio de duas métricas: contagem de palavras ajustada à posição e impressão subjetiva.

O Métrica de contagem de palavras ajustada à posição considerou a contagem de palavras e a posição da citação na resposta do mecanismo generativo.

O Métrica de impressão subjetiva incorporou vários fatores subjetivos para calcular uma pontuação de impressão geral.

A melhoria relativa na impressão para cada fonte foi calculada comparando as pontuações de impressão da resposta otimizada com a resposta da linha de base sem qualquer otimização.

Além disso, os pesquisadores analisaram o desempenho dos métodos GEO em diferentes categorias e domínios.

Identificaram as categorias de melhor desempenho para cada método, indicando os contextos específicos em que cada método foi mais eficaz.

O estudo usou o mecanismo de busca Perplexity.ai e um mecanismo de busca de IA modelado no Bing Chat. Os pesquisadores descobriram que os resultados foram semelhantes nas duas plataformas.

As métricas de avaliação do estudo

Eles avaliaram os métodos GEO em um subconjunto de 200 amostras do conjunto de testes para avaliar seu desempenho em um cenário de motor generativo do mundo real.

As nove diferentes técnicas de otimização avaliadas

Os pesquisadores avaliaram nove métodos GEO diferentes para otimizar o conteúdo do site para mecanismos generativos.

Para mim, parece que esses métodos são uma mistura de técnicas clássicas de SEO (pense no uso de palavras-chave, EEAT, riqueza semântica, links externos, etc.)

Esses 9 métodos foram:

  1. Autoritário: modifica o estilo do texto do conteúdo de origem para ser mais persuasivo e confiável, fazendo afirmações com confiança.
  2. Recheio de palavras-chave: modifica o conteúdo para incluir mais palavras-chave da consulta do usuário, semelhante às estratégias tradicionais de otimização de SEO.
  3. Adição de estatísticas: modifica o conteúdo para incluir estatísticas quantitativas em vez de discussões qualitativas sempre que possível, adicionando evidências baseadas em dados.
  4. Citar fontes: adiciona citações relevantes de fontes confiáveis ​​para apoiar afirmações e fornecer atribuição em todo o conteúdo do site.
  5. Adição de cotação: incorpora citações de fontes relevantes para aumentar a autenticidade e profundidade do conteúdo do site.
  6. Fácil de entender: simplifica a linguagem e a estrutura do conteúdo do site, tornando-o mais acessível e atraente para o mecanismo generativo e os usuários.
  7. Otimização de Fluência: Melhora a fluência e a legibilidade do texto do site, garantindo uma experiência de leitura suave e coerente.
  8. Palavras únicas: Adiciona vocabulário único e intrigante ao conteúdo do site, destacando-o e aumentando seu apelo.
  9. Termos técnicos: incorpora termos técnicos e jargões relevantes ao domínio ou setor, demonstrando experiência e atendendo públicos específicos.
Exemplo de como as pesquisas implementaram o GEO

Os métodos GEO mais eficazes

Eles descobriram que alguns métodos foram mais eficazes em determinados domínios, enquanto três estratégias tiveram sucesso em todos os tipos de sites.

Essas três estratégias principais foram Citar Fontes, Adição de Cotações e Adição de Estatísticas. Esses métodos, que exigem alterações mínimas no conteúdo atual, melhoraram a visibilidade do site em 30-40% em comparação com as linhas de base.

Curiosamente, os investigadores descobriram que a eficácia das estratégias de otimização variava dependendo do domínio do conhecimento.

Por exemplo, a otimização “Autoritativa”, que utiliza uma linguagem mais persuasiva, funcionou melhor para conteúdos relacionados ao domínio Histórico.

Enquanto isso, a otimização de citações foi mais eficaz para consultas de pesquisa factuais, e a adição de estatísticas provou ser benéfica para questões jurídicas e governamentais.

Tabela de dados com os resultados do estudo

A pesquisa também revelou que algumas estratégias foram menos eficazes do que o previsto.

O uso de tons persuasivos e autoritários no conteúdo geralmente não melhorou as classificações nos mecanismos de pesquisa de IA.

Da mesma forma, adicionar mais palavras-chave da consulta de pesquisa ao conteúdo (o que no SEO clássico conhecemos como preenchimento de palavras-chave, se exagerado), não foi eficaz e teve um desempenho pior do que a linha de base em 10%.

Devemos confiar no estudo? Eu não tenho tanta certeza

Os pesquisadores afirmam que sites tradicionalmente com classificação inferior no SERP poderiam melhorar significativamente sua visibilidade usando métodos GEO.

Por exemplo, o método Cite Sources levou a um aumento substancial de 115,1% na visibilidade de sites classificados em quinto lugar no SERP.

Isso para mim parece uma mudança um pouco aleatória ou muito grande, o que me leva a suspeitar que seus métodos não são 100% à prova de balas.

Também eles rotulam “sites com classificação inferior”Como alguém em quinto lugar nas SERPs. E essa “muitos desses sites de classificação inferior são frequentemente criados por pequenos criadores de conteúdo ou empresas independentes”.

Para mim, isso representa um mal-entendido quando se trata de SEO. Sites com classificação inferior estão entre os 10 primeiros para a maioria das consultas, pois hoje é preciso muito apenas para chegar à primeira página. E na maioria das vezes as primeiras páginas não possuem pequenos criadores de conteúdo na primeira página.

Ainda assim, considero o seu estudo interessante e espero que vejamos mais disto à medida que avançamos para a nova era da GE ou SGE.

Embora o estudo sugira que a Otimização Generativa de Mecanismos (GEO) poderia nivelar o campo de atuação para pequenos criadores de conteúdo e empresas independentes, há um ponto de vista contrastante de que a pesquisa de IA ou mecanismos generativos podem, em vez disso, favorecer sites maiores e mais confiáveis.

Isto poderia potencialmente aumentar a distância entre estas entidades e as pequenas empresas no espaço digital.