A mesma pergunta, cinco respostas, cinco listas de marcas
Fiz um teste banal com a equipe há duas semanas. Peguei uma única pergunta comercial do nicho de um cliente e rodei nos cinco motores que importam hoje: ChatGPT com busca, Gemini dentro do AI Mode, Perplexity, Claude com navegação e o AI Overview do Google. Cinco respostas. Cinco conjuntos de fontes diferentes. A marca do cliente apareceu em três deles, ficou de fora de um, e em outro apareceu citada por uma thread de Reddit que ninguém da empresa sabia que existia.
Esse é o ponto que quase todo Head de SEO ainda não internalizou. Não existe "a IA". Existem motores com índices distintos, gatilhos de busca distintos e vieses de fonte distintos. Tratar ChatGPT, Perplexity e o AI Overview como uma coisa só é o equivalente, em 2014, a otimizar para Google e Bing com a mesma planilha e fingir que davam o mesmo resultado. A diferença é que agora o custo do erro é não aparecer na resposta, e não apenas cair três posições.
A tese deste artigo é contraintuitiva para quem vem de SEO clássico: a maior parte da otimização para IA é compartilhada (conteúdo profundo, estrutura clara, autoridade verificável), mas a margem que decide se você é citado em cada motor está nos detalhes do retrieval de cada um. Quem entende como cada engine recupera e cita ganha essa margem. Quem não entende terceiriza a decisão para o algoritmo de quem entendeu.
Vou organizar isto da forma que eu uso internamente: primeiro o mecanismo comum (RAG e query fan-out), depois motor por motor com evidência, depois uma tabela comparativa direta, e no fim um plano de ação por engine. Os números e o comportamento de cada motor vêm de research vivo que rodamos em maio de 2026, com as fontes linkadas no corpo.
RAG: o mecanismo comum que decide se você entra na resposta
Os cinco motores compartilham uma arquitetura: RAG, sigla de Retrieval-Augmented Generation, ou geração aumentada por recuperação. A ideia é simples de explicar e brutal nas consequências. O modelo de linguagem não responde só com o que "memorizou" no treino. Antes de escrever, ele dispara uma busca, recupera um punhado de documentos ou trechos relevantes, e gera a resposta condicionada a esse material recuperado. A citação que você vê na tela aponta para os documentos que entraram nessa janela de recuperação.
A consequência prática é que o jogo tem dois portões, não um. Primeiro portão: o seu conteúdo precisa existir no índice que aquele motor consulta. Se o ChatGPT busca no índice do Bing e a sua página não está bem indexada no Bing, você nem entra no sorteio. Segundo portão: dado que você foi recuperado, o seu trecho precisa ser bom o bastante para ser selecionado entre os candidatos e citado. SEO clássico cuidava razoavelmente bem do segundo portão (relevância, qualidade). O primeiro portão, o de estar no índice certo, é onde a maioria das marcas brasileiras perde sem saber.
RAG explica por que conteúdo "passável" deixou de bastar. O modelo não precisa de dez páginas medianas dizendo a mesma coisa. Ele precisa de uma passagem que responda a sub-pergunta exata, com dado verificável, fácil de extrair. É por isso que tabelas, FAQs, listas e dados marcados com schema funcionam: reduzem o custo de extração. O guia de GEO da Product Hackers, baseado em 145 consultas reais de moda e e-commerce, é explícito ao recomendar gerar dados próprios marcados como fonte primária, porque os LLMs priorizam fontes primárias estruturadas (Product Hackers, guia GEO 2026).
Query fan-out: por que a IA decompõe a sua pergunta em dez perguntas
O segundo conceito que muda tudo é o query fan-out. Quando você pergunta algo a um motor moderno, ele raramente busca a sua frase literal. Ele decompõe a consulta em várias sub-consultas derivadas, busca cada uma separadamente, e depois sintetiza. Pergunte "qual o melhor ERP para varejo de moda no Brasil" e o motor pode gerar, internamente, sub-buscas para "ERP varejo moda Brasil", "comparativo ERP varejo", "integração fiscal e-commerce moda", "reviews ERP lojistas" e assim por diante. Cada sub-busca traz candidatos diferentes.
Isso reescreve a estratégia de conteúdo. No SEO clássico você mirava uma keyword principal por página. Com fan-out, a página que vence é a que cobre o leque de sub-perguntas que o motor vai gerar a partir daquele tópico. Cobertura de subtópicos deixou de ser luxo e virou condição de recuperação. Se a sua página responde só à pergunta central e ignora as cinco sub-perguntas adjacentes, ela perde para a página que responde às seis.
O fan-out é especialmente agressivo nos modos de pesquisa profunda. O Deep Research do ChatGPT e o Pro Search do Perplexity quebram a pergunta em sub-tarefas, buscam múltiplas fontes para cada uma e montam um relatório. O Gemini, dentro do AI Mode, dispara consultas adicionais conforme o usuário itera. Na prática, você não otimiza para uma pergunta. Você otimiza para o cluster semântico inteiro que aquela pergunta abre. Eu detalho a mecânica de recuperação e a tática de chunking no artigo dedicado a como a IA decide qual marca citar, que é o complemento natural deste comparativo.
ChatGPT e SearchGPT: índice Bing, autoridade estruturada, citação discreta
O ChatGPT com navegação roda RAG multi-fonte, especialmente no Deep Research, onde quebra a pergunta em sub-tarefas e sintetiza um relatório. Para a busca web geral, o backend público é historicamente o índice do Bing, herança da integração profunda OpenAI-Microsoft, complementado por crawling próprio e APIs específicas em alguns domínios. Não há anúncio público de migração para o índice Google. Tradução para o Head de SEO: se você ignora o Bing Webmaster Tools porque "ninguém usa Bing", você está cego para o índice que alimenta um dos maiores motores de resposta do mundo.
A citação no ChatGPT é discreta. Ele nem sempre mostra fonte para tudo, tende a exibir links quando a busca é explicitamente acionada, e o formato é uma lista de "Sources" no fim, com citações inline numeradas ocasionais, bem menos agressivas que as do Perplexity. Em consultas comerciais, estudos de GEO de 2026 observam que o ChatGPT menciona algo entre 2 e 4 marcas por resposta, sem necessariamente exibir a URL de cada uma.
O viés de fonte é o que mais importa aqui: o ChatGPT favorece autoridade estruturada. Conteúdo com tabelas, FAQs, schema e respostas diretas é mais fácil de extrair e sintetizar, e ele recompensa isso. Também pesa forte para fontes primárias com dados próprios e para domínios de autoridade global. Reddit existe na base (há acordo de licenciamento desde 2024), mas a interface não destaca o domínio como o Google faz, e na prática o Reddit é menos decisivo para o ChatGPT do que para o Gemini.
Perplexity: citação obrigatória, frescor e ~94% de precisão
O Perplexity é o motor mais transparente sobre o próprio retrieval, e isso o torna o melhor laboratório de GEO que existe. Ele se define como sistema de recuperação online com LLM, processa cerca de 780 milhões de consultas por mês em 2026, e o Pro Search faz pipeline multi-etapas explícito: quebra a query em sub-consultas, busca várias fontes por sub-query e sintetiza. É query fan-out supervisionado, escancarado na interface.
O diferencial é a citação. Todas as respostas têm fonte, quase sempre numeradas inline com bloco de links embaixo. Segundo a análise da How Do I Use AI de abril de 2026, toda resposta vem com citações marcadas e ligadas abaixo do texto, e um comparativo do mesmo período aponta cerca de 94% de precisão de citação em amostragem, ou seja, alta correspondência entre o que o texto afirma e o que a fonte de fato diz (How Do I Use AI, abril de 2026). Em consultas comerciais, o Perplexity costuma exibir de 3 a 6 marcas com fontes, mais que ChatGPT e Claude.
O viés é para frescor e verificabilidade. O Perplexity valoriza conteúdo recente e recomenda explicitamente datas completas e updates visíveis na página. Favorece páginas com números, estudos e respostas diretas. E como sempre exibe o link, ele dá mais "visibilidade como fonte" ao Reddit e à Wikipedia do que ChatGPT ou Claude, simplesmente porque mostra o domínio. Decisão pessoal: quando quero saber se uma página é citável, eu testo no Perplexity primeiro. Se ele não me cita ali, onde a citação é obrigatória e visível, eu sei que o problema é meu conteúdo, não a interface.
Gemini, AI Mode e AI Overviews: índice Google e o peso do consenso social
Aqui estão dois produtos sobre o mesmo modelo. O AI Overview é a resposta resumida dentro do Google Search, e o AI Mode é o workspace conversacional lançado de forma ampla em 2026. A escala é o argumento: o blog oficial do Google confirmou no I/O 2026 que os AI Overviews já passam de 2,5 bilhões de usuários ativos mensais (blog oficial do Google, I/O 2026), e a cobertura do evento reporta o AI Mode em torno de 1 bilhão de MAU, com a consulta média no AI Mode até três vezes mais longa que a busca tradicional. Trato o número do AI Mode como plausível e bem sustentado em cobertura secundária, não como dado primário fechado.
O retrieval é o ponto crítico: ambos usam o próprio índice do Google Search como fonte primária. O ranking clássico seleciona os documentos candidatos, e só então o Gemini comprime e sintetiza. O modelo não escolhe a fonte sozinho, ele recebe candidatos da infraestrutura de busca tradicional. Por isso, estar bem rankeado no orgânico continua sendo pré-condição para aparecer no AI Overview. O AI Mode adiciona uma camada de RAG recorrente, disparando novas consultas conforme o usuário refina.
O viés de fonte é o que mais separa o Google dos demais: peso enorme para consenso social. O estudo de GEO de 2026 mostra que o AI Overview confia em verificação cruzada via threads de Reddit, reviews (Google Reviews, Trustpilot), e principalmente YouTube, por ser do próprio Google. Em queries comerciais ele destaca marcas com muitos reviews e presença multicanal forte. O formato de citação são cards clicáveis com favicon sob a resposta, tipicamente 3 a 5 links, com poucas citações inline. Vou ao detalhe de quanto isso vale por canal no artigo sobre share of voice em IA e como medir visibilidade.
Claude: conservador, técnico e faminto por profundidade real
O Claude é o motor mais conservador da lista, e isso é uma informação estratégica, não um defeito. Quando a navegação está ativa, ele segue RAG como os outros, busca via backends parceiros (historicamente Bing e outros), e sintetiza. Mas o comportamento de seleção e citação é mais cauteloso e técnico que o do ChatGPT. Em queries de marca, os estudos de GEO mostram o Claude mencionando 2 a 4 marcas, com foco em densidade informativa e cautela na recomendação. Ele não lista qualquer site recém-criado.
O viés é claro: o Claude valoriza profundidade real. Cita com frequência textos densos, técnicos e informativos, prefere conteúdo com rigor e dados verificáveis, e puxa documentação oficial, RFCs, issues do GitHub, papers e blogs de desenvolvedores. O formato de citação é uma lista de fontes no fim, com menções textuais ("segundo a documentação oficial..."), menos granular e menos numerada que o Perplexity.
A implicação para quem produz conteúdo é direta. Se você vende para um público técnico, o Claude é o motor que mais recompensa documentação séria, especificações, casos detalhados e dado primário. Conteúdo de marketing raso não passa pelo filtro dele. Eu uso isso como termômetro de honestidade: se o Claude cita a sua página, ela provavelmente tem substância, porque ele tende a ignorar o que é só vitrine.
Tabela comparativa: índice, citação, viés e como aparecer
Consolidei o que importa numa única tabela. Use-a como mapa de decisão: a coluna "Como aparecer" é onde você aloca esforço por motor. Os comportamentos vêm do research vivo de maio de 2026, com as fontes já linkadas nas seções acima.
| Motor | Índice / retrieval | Formato de citação | Viés de fonte | Como aparecer |
|---|---|---|---|---|
| ChatGPT / SearchGPT | Índice Bing + crawling próprio + conectores; RAG multi-fonte, fan-out no Deep Research | Lista de "Sources" no fim; inline numerado ocasional; 2 a 4 marcas | Autoridade estruturada (tabelas, FAQs, schema), fontes primárias, domínios de autoridade global | Indexar bem no Bing; marcar dados próprios; estruturar respostas diretas e tabeladas |
| Perplexity | Bing + meta-search + crawling próprio; RAG explícito, Pro Search com fan-out supervisionado | Citação em 100% das respostas, inline numerada + bloco de links; ~94% de precisão; 3 a 6 marcas | Frescor e verificabilidade; números e estudos; dá link visível a Reddit e Wikipedia | Datar e atualizar páginas; dado verificável por afirmação; ser citável trecho a trecho |
| Gemini / AI Mode / AI Overviews | Índice do Google Search; RAG sobre ranking clássico; consultas recorrentes no AI Mode | Cards com favicon sob a resposta, 3 a 5 links; poucas inline | Consenso social: Reddit, reviews, YouTube (do Google); marcas multicanal com reviews | Rankear no orgânico; YouTube e reviews reais; presença em UGC sem astroturfing |
| Claude | Backends parceiros (Bing e outros); RAG conservador, foco técnico | Lista de fontes no fim, menções textuais; menos numerada; 2 a 4 marcas | Profundidade real; docs oficiais, papers, GitHub, fontes expert; cauteloso com sites novos | Documentação densa; dado primário; rigor técnico; credenciais verificáveis |
| Google clássico (referência) | Índice do Google Search; ranking tradicional | Cerca de 10 links por página, usuário escolhe | E-E-A-T, autoridade temática, sinais clássicos | SEO clássico: continua sendo a base para ser elegível nos demais |
A leitura de cabeceira da tabela é esta: o índice Bing alimenta ChatGPT, Perplexity e provavelmente Claude; o índice Google alimenta os AI Overviews e o AI Mode. Negligenciar qualquer um dos dois índices é abrir mão de um lado inteiro do mapa de citação.
O Core Update de 2026 elevou o piso para todos os motores
Tem um fator que atravessa os cinco motores e que o Head de SEO precisa colocar na conta: a recalibração de qualidade do Google em 2026. O March 2026 Core Update, confirmado no Search Status Dashboard com início em 27 de março e fim em 8 de abril, re-ponderou um sinal que a comunidade chama de Information Gain, que mede quanto a página adiciona conhecimento genuinamente novo em relação ao que já ranqueia para a mesma consulta (Evertune, March 2026 Core Update). Houve ainda o update de maio, com rollout a partir de 21 de maio.
Por que isso importa para citação em IA? Porque o índice do Google alimenta diretamente os AI Overviews e o AI Mode, e os sinais de qualidade que sobem você no orgânico são os mesmos que te tornam candidato no bloco generativo. Conteúdo que apenas reorganiza o que já existe perde nos dois. Conteúdo com dado próprio, experiência de campo e ângulo inédito ganha nos dois. O recado é único: originalidade verificável virou piso, não diferencial.
Plano de ação por motor: onde alocar esforço esta semana
Comparativo sem plano é entretenimento. Aqui está o que eu faria, na ordem, se assumisse hoje o GEO de uma marca com recurso limitado. Não é para fazer tudo de uma vez. É para priorizar por motor.
- Base comum (faça primeiro, vale para os cinco): dado primário próprio em cada página relevante, marcado como fonte primária; estrutura extraível (FAQs, tabelas, listas, respostas diretas); cobertura do leque de sub-perguntas para vencer o fan-out; autoria identificável com credenciais. Isso é o que o Information Gain do Core Update exige e o que todo motor recompensa.
- Para ChatGPT: trate o Bing como cidadão de primeira classe. Verifique indexação no Bing Webmaster Tools. Priorize autoridade estruturada e respostas diretas que reduzem o custo de extração.
- Para Perplexity: date e atualize cada página com data visível; coloque um dado verificável por afirmação importante; teste suas páginas-alvo no Pro Search e veja se você é citado trecho a trecho. É o seu termômetro mais honesto.
- Para Gemini e AI Overviews: não basta o site. Trabalhe consenso social: vídeo no YouTube cobrindo o tópico, reviews reais (Google Reviews, Trustpilot), presença legítima em UGC. Astroturfing aqui é risco, não atalho; trate UGC como reputação ganha, não comprada.
- Para Claude: se o seu público é técnico, invista em documentação densa, especificações, casos detalhados e presença em GitHub. Claude ignora vitrine e cita substância.
Uma advertência honesta sobre medição: não existem números públicos, globais e auditáveis de "share of model" ou "AI traffic share" por domínio em 2025-2026. Qualquer fornecedor que vende isso como fato está vendendo estimativa proprietária. O que funciona é montar o seu próprio painel: rodar um conjunto de queries do nicho nos cinco motores, registrar se você é citado, calcular mention rate e share of voice internos. Eu sistematizo essa medição no playbook do CMO B2B SaaS para citação em LLM e respondo as dúvidas recorrentes no FAQ sobre como as IAs citam marcas em 2026.
O próximo passo é trivial e ninguém faz: pegue as suas dez queries de compra mais importantes, rode hoje nos cinco motores, e anote onde você aparece e onde aparece o concorrente. Em uma hora você terá um diagnóstico mais útil que qualquer relatório de agência. A partir dele, este plano de ação deixa de ser teoria.