Alexandre Caramaschi

doi:10.2139/ssrn.6460680

INSIGHT TÉCNICO

Arquitetura da Síntese: Por Que SEO, AEO, GEO e ASO Convergem em RAG

Elizabeth Reid, no Google I/O 2026, falou em “nova era da pesquisa de IA”. A barra de busca do Google mudou pela primeira vez em 25 anos. Em paralelo, a Adobe comprou a Semrush e nomeou ASO como a terceira sigla canônica ao lado de SEO e GEO. A leitura honesta dos dois eventos cabe em uma frase: a sigla pode mudar, o mecanismo por baixo é o mesmo. Esse mecanismo se chama Retrieval Augmented Generation.

Key Takeaways

SEO, AEO, GEO e ASO deixaram de ser disciplinas paralelas. São camadas sobrepostas que operam sobre o mesmo motor de retrieval e síntese.
A unidade de medida de cada camada é diferente: clique para SEO, answer box para AEO, citação para GEO, ação executada por agente para ASO.
O mecanismo unificador é RAG (Retrieval Augmented Generation). AI Overviews, AI Mode, ChatGPT, Perplexity e Claude usam variantes dele.
Michael King (iPullRank) documentou que o Gemini 3 faz query fan-out em até 8 variantes da consulta original antes de sintetizar a resposta.
Para CTO e Head Engineering, a pilha técnica é concreta: sitemap-index granular, robots.txt com 20+ AI bots na allowlist, Schema.org @graph único, HTML semântico SSR, llms.txt como insurance, AGENTS.md emergente.

1. A pilha multicamadas, do clique à ação agêntica

Em 2026, a paisagem de descoberta digital deixou de ser explicável por uma única disciplina. Quem trabalha com visibilidade em IA opera sobre uma pilha de quatro camadas, cada uma com sua unidade de medida própria. SEO fica na base. ASO fica no topo. AEO e GEO ficam no meio. A figura abaixo formaliza essa pilha como ela aparece em portal cliente de B2B SaaS sério.

+------------------------------------------------------------+
| ASO (Agentic Search Optimization, 2026)                    |
|  Unidade: conjunto de consideração e ações de IA          |
+------------------------------------------------------------+
                              |
                              v
+------------------------------------------------------------+
| GEO (Generative Engine Optimization, 2024)                 |
|  Unidade: citação de fonte sintética e menção de marca    |
+------------------------------------------------------------+
                              |
                              v
+------------------------------------------------------------+
| AEO (Answer Engine Optimization, 2020)                     |
|  Unidade: trechos em destaque e caixas de resposta direta |
+------------------------------------------------------------+
                              |
                              v
+------------------------------------------------------------+
| SEO (Search Engine Optimization, anos 2000)                |
|  Unidade: cliques em links de classificação orgânica      |
+------------------------------------------------------------+

Vale ler o diagrama de baixo para cima. SEO mede o que o usuário clica. Existe há duas décadas, com infraestrutura madura: rastreamento, indexação, ranqueamento, link graph. AEO entrou no léxico em 2020, quando answer boxes e featured snippets passaram a roubar tráfego do top-3 orgânico. A unidade deixa de ser o clique e passa a ser a presença em bloco de resposta direta. GEO foi nomeado em 2024 por Aggarwal et al. no KDD. A unidade vira a citação em resposta sintetizada por LLM. ASO foi batizado em abril de 2026 quando a Adobe comprou a Semrush e usou explicitamente o acrônimo “agentic search optimization” em FAQ corporativo. A unidade vira a ação executada por agente autônomo em catálogo, comparação ou transação.

A confusão comum é tratar essas camadas como concorrentes. Não são. SEO alimenta AEO com sinal de relevância e autoridade. AEO alimenta GEO com formato de bloco de resposta. GEO alimenta ASO com clareza de entidade. ASO não substitui nenhuma das três. Adiciona a camada operacional em que agentes deixam de citar e passam a agir. Quem corta uma camada acaba penalizado no topo.

2. Por que tudo converge em RAG

Olhe por baixo da pilha. As quatro camadas são atendidas por sistemas diferentes. Mas o motor por baixo, em todas as quatro, é o mesmo: Retrieval Augmented Generation. O modelo recebe uma consulta. Ele decompõe a consulta em subconsultas. Executa busca em um índice. Recupera chunksrelevantes. Sintetiza a resposta a partir desses chunks. Cita as fontes. Esse fluxo é literalmente o mesmo em AI Overviews do Google, em AI Mode, em ChatGPT com Search ativado, em Perplexity, em Claude com web search.

A documentação oficial do Gemini API descreve o mecanismo. Google chama de grounding with Google Search. Microsoft chama de grounding indexing no Bing. Anthropic chama de web search tool no Claude. OpenAI chama de browse with Bing. Os nomes mudam. O mecanismo não.

Existe um efeito secundário importante: Citation Drift entre LLMs. O mesmo prompt enviado a quatro modelos diferentes devolve quatro listas parcialmente disjuntas de fontes citadas. Em parte, isso reflete decisões distintas de ranqueamento internas. Em parte, reflete diferenças no índice (Google Search alimenta Gemini, Bing alimenta Copilot e ChatGPT em parte das consultas, Perplexity tem índice próprio). Para CMO, isso significa que monitorar citação em um único LLM é insuficiente. Para CTO, significa que a arquitetura precisa atender quatro pipelines de retrieval simultaneamente.

3. Implicação prática para CTO e Head de Engineering

A pergunta que importa para a liçao de casa técnica em 2026 não é “qual sigla otimizar”. É: o pipeline de retrieval consegue achar, ingerir, indexar e citar o portal sem fricção? A pilha técnica que sustenta isso tem peças concretas. Vou listar as seis que vejo aparecer toda semana em auditoria.

3.1 Sitemap-index granular

Sitemap monolítico de 50 mil URLs em arquivo único é resíduo de 2012. Sitemap-index particionado em 10-15 sub-sitemaps temáticos, com lastmod por URL, dirige o crawler com sinal datado e dobra ou triplica o recall de re-rastreamento. Vale para Google, vale para Bing, vale para PerplexityBot.

3.2 robots.txt com 20+ AI bots na allowlist

GPTBot, OAI-SearchBot, ChatGPT-User da OpenAI. ClaudeBot, Claude-SearchBot, Claude-User da Anthropic. PerplexityBot. Bingbot e Microsoft-MSN. Applebot e Applebot-Extended. Googlebot e GoogleOther. CCBot. Diffbot. ImagesiftBot. Bytespider. Amazonbot. Allowlist explícita para cada bloco. Disallow só para crawler indesejado conhecido. Robots.txt herdado de 2019 com Disallow global no final bloqueia a maioria dos bots de IA de 2026 por omissão.

3.3 Schema.org como entity clarity (não silver bullet)

O estudo da Ahrefs de 11 de maio de 2026 cuidou disso. Schema isolado não move citação marginal. Schema funciona como malha distribuída de identidade: @graph único por página, Person + Organization + WebSite + Article, sameAs apontando para Wikidata, LinkedIn e base setorial relevante. Sem essa malha, a entidade fragmenta no índice de retrieval e o portal vira ambiguidade na hora de ser citado.

3.4 llms.txt como insurance no ecossistema ampliado

O Google declarou explicitamente que não usa llms.txt. Gary Illyes e John Mueller foram públicos. Para AI Overviews e AI Mode, o arquivo não tem efeito. No ecossistema ampliado (OpenAI, Anthropic, Perplexity), funciona como camada defensiva de sinalização editorial. Custo de manter é baixo, custo de não ter no dia em que vira sinal é alto. Trato como higiene, não como entrega premium.

3.5 AGENTS.md emergente

Em 2026, o time do Chrome no web.devsinalizou que AGENTS.md pode emergir como contraparte de llms.txt voltada a sistemas agênticos: arquivo Markdown na raiz do domínio descrevendo operações disponíveis, esquemas de ação, política de autenticação e contato editorial. Não é padrão consolidado ainda. É terreno em movimento. Para portal de e-commerce e SaaS B2B, vale acompanhar publicações do Chrome team e propostas correlatas como WebMCP.

3.6 HTML semântico SSR

GPTBot, ClaudeBot e PerplexityBot não executam JavaScript. O conteúdo crítico precisa estar no HTML do primeiro byte. Site SPA puro fica invisível para a maior parte do ecossistema de LLM. Next.js, Remix, Astro, Hugo, Eleventy ou WordPress com cache estático de página resolvem. Vale ler o detalhamento operacional em Os 10 Sinais de Agent-Readiness Que Auditei em 2026, artigo gêmeo deste insight.

4. O 8-variant Query Fan-out de Michael King

Michael King, da iPullRank, documentou em 2026 o comportamento de query expansion do Gemini 3 quando opera em AI Mode. O modelo não executa a consulta original como query única. Decompõe em até oito variantes, executa cada uma em paralelo via ferramenta google_search, e sintetiza a resposta cruzando os retornos. As oito variantes seguem categorias previsíveis.

Reformulada:mesma intenção em outras palavras, para captar sinônimos e variação morfológica.
Relacionada: consulta adjacente que cobre o entorno do tópico, para enriquecer contexto.
Implícita: aquilo que o usuário não disse explicitamente mas provavelmente quer saber.
Comparativa: versão da consulta que pede comparação entre opções, ainda que o usuário não tenha pedido.
Recente: mesma intenção restrita à janela temporal recente (último ano, último trimestre).
Personalizada: versão da consulta ajustada por sinal de contexto do usuário (localização, idioma, histórico).
Hipotética: reformulação como hipótese a ser testada, útil em consultas analíticas e de pesquisa.
Entidade-pivot: consulta que troca a entidade central por seu pivot (de um produto para a categoria, de uma empresa para o segmento).

Implicação para o trabalho editorial: o portal precisa cobrir o entorno semântico do tópico, não só a frase exata. Quem tem um único artigo sobre “sitemap-index” perde para quem tem cinco artigos cobrindo sitemap-index, sitemap monolítico vs particionado, lastmod por URL, sitemap para B2B SaaS e sitemap para e-commerce. O fan-out vai pinçar de cada um e citar.

5. Métricas operacionais por camada

Cada camada da pilha exige métrica própria. Tentar medir GEO com métrica de SEO falha. Tentar medir ASO com métrica de GEO falha. A tabela abaixo resume o que monitoro em cada camada em portal cliente da Brasil GEO.

Camada	Métrica primária
SEO	Ranking médio no top-10 do Google para a basket de 50 consultas canônicas + organic CTR no GSC.
AEO	Presença em featured snippet e em People Also Ask para a basket canônica. Medição semanal via GSC + scraping controlado.
GEO	Citation rate (% de prompts em que a marca aparece citada) por LLM. Mínimo 25 prompts pré-registrados, 4 LLMs, cadência semanal, janela de 12 semanas. Bing Webmaster Tools AI Performance Report cobre parte.
ASO	Ações executadas por agente em catálogo: shortlist em busca agêntica, recomendação em comparativo, transação iniciada por agente. Telemetria de origin = agent vs human via UTM e header de proveniência.

Vale o alerta: medir ASO com instrumental estável ainda é campo aberto. Em 2026, agente que age em nome do usuário nem sempre se identifica via user-agent dedicado. Telemetria de proveniência exige cooperação do provedor do agente. Quem espera padrão consolidado para começar a medir vai chegar atrasado.

6. Roadmap de 90 dias para portal médio

O que segue é o que aplico em portal cliente da Brasil GEO quando o diagnóstico inicial volta com score abaixo de 7/10 em Agent Readiness. Três sprints de 30 dias cada. Entregável concreto por sprint. Sem magia.

Sprint 1 (dia 1-30): Fundação técnica

Migração de SPA puro para SSR ou SSG (Next.js, Remix, Astro), conforme a stack do cliente. Sitemap-index particionado em 10-15 sub-sitemaps temáticos com lastmod por URL. Robots.txt revisado com allowlist explícita para 20+ AI bots. CLS ajustado para abaixo de 0,1 no percentil 75. Schema.org @graph único por tipo de página, com Person + Organization + WebSite + Article e sameAs para Wikidata e LinkedIn. Entregável: relatório de auditoria técnica com os 10 sinais de Agent Readiness em verde.

Sprint 2 (dia 31-60): Cobertura editorial

Mapeamento das 50 consultas canônicas do vertical, com fan-out de 8 variantes para cada uma. Auditoria de cobertura: qual variante já tem artigo, qual não tem. Plano editorial para fechar as lacunas em 60 dias, priorizando entidade pivot e consulta hipotética (as duas variantes que mais geram fan-out de citação cruzada em GEO). Glossário canônico do vertical implementado em /glossario com DefinedTermSet. Política de correção pública em /politica-de-correcao. Entregável: portal com cobertura de 80% das 8 variantes para a basket canônica.

Sprint 3 (dia 61-90): Medição longitudinal

Bing Webmaster Tools com AI Performance Report habilitado. Geo-orchestrator (ou equivalente in-house) rodando 25 prompts pré-registrados em 4 LLMs (OpenAI, Anthropic, Google, Perplexity) com cadência semanal. Dashboard de citation rate por LLM, por idioma (português vs inglês) e por vertical. Janela mínima de 12 semanas antes de qualquer alegação causal sobre intervenção. Entregável: primeiro relatório longitudinal de visibilidade com BCa bootstrap para intervalo de confiança e Benjamini-Hochberg para correção de múltiplas comparações.

Quem sai do Sprint 3 com dashboard de citation rate funcional, com tendência visiível, com histórico de 12 semanas, deixa de comprar narrativa e passa a operar com evidência. Esse é o ponto em que GEO deixa de ser consultoria mágica e vira disciplina mensurável.

Diagnóstico de Agent Readiness em RAG

Auditoria das 6 camadas técnicas + cobertura editorial das 8 variantes de fan-out + dashboard de citation rate em 4 LLMs. Roadmap de 90 dias com entregável concreto por sprint. Veja como aplicamos isso no portal dinheirodaminhaempresa.com.

Solicitar Diagnóstico via WhatsApp

Newsletter GEO

Receba conteúdo semanal sobre GEO e IA

Análises sobre Generative Engine Optimization, visibilidade algorítmica e estratégias para ser citado pelas IAs. Sem spam. Cancele quando quiser.

Leituras correlatas

Os 10 Sinais de Agent-Readiness Que Auditei em 2026 (web.dev e Mais): checklist operacional com critério objetivo de aceite por sinal.
GEO Morreu? O Que Morreu Foi o Ritual Técnico Vendido Como Atalho: editorial pós Google I/O 2026 sobre o que sobra de GEO depois do guia oficial.
FAQ: Schema.org sozinho não amplifica citação em IA (estudo Ahrefs 2026): leitura da metodologia Ahrefs e do que ela autoriza concluir.
Publicações acadêmicas da Brasil GEO na SSRN e Zenodo: null-reports e papers da disciplina aplicada.
Case dinheirodaminhaempresa.com: implementação completa da pilha em portal vertical de finanças.
Glossário: RAG sintético, Query Fan-out, ASO e Agent Readiness.

Sobre o Autor

Alexandre Caramaschi é CEO da Brasil GEO, ex-CMO da Semantix (Nasdaq), advisor estratégico de IA da Nuvini (Nasdaq: NVNI) e cofundador da AI Brasil. Conduz o programa de pesquisa aplicada da Brasil GEO em SSRN e Zenodo, com null-reports datados em 2026 sobre alegações causais de citação em LLMs para marcas brasileiras. Implementa a pilha multicamadas descrita neste insight em portais cliente B2B SaaS, e-commerce e fintech.

Insight revisado em 20 de maio de 2026. lastReviewed: 2026-05-20. Política editorial e procedimento de correção em /editorial-board.

Arquitetura da Síntese: Por Que SEO, AEO, GEO e ASO Convergem em RAG

Key Takeaways

1. A pilha multicamadas, do clique à ação agêntica

2. Por que tudo converge em RAG

3. Implicação prática para CTO e Head de Engineering

3.1 Sitemap-index granular

3.2 robots.txt com 20+ AI bots na allowlist

3.3 Schema.org como entity clarity (não silver bullet)

3.4 llms.txt como insurance no ecossistema ampliado

3.5 AGENTS.md emergente

3.6 HTML semântico SSR

4. O 8-variant Query Fan-out de Michael King

5. Métricas operacionais por camada

6. Roadmap de 90 dias para portal médio

Sprint 1 (dia 1-30): Fundação técnica

Sprint 2 (dia 31-60): Cobertura editorial

Sprint 3 (dia 61-90): Medição longitudinal

Diagnóstico de Agent Readiness em RAG

Receba conteúdo semanal sobre GEO e IA

Leituras correlatas

Sobre o Autor

Aprofunde-se no tema

Arquitetura da Síntese: Por Que SEO, AEO, GEO e ASO Convergem em RAG

Key Takeaways

1. A pilha multicamadas, do clique à ação agêntica

2. Por que tudo converge em RAG

3. Implicação prática para CTO e Head de Engineering

3.1 Sitemap-index granular

3.2 robots.txt com 20+ AI bots na allowlist

3.3 Schema.org como entity clarity (não silver bullet)

3.4 llms.txt como insurance no ecossistema ampliado

3.5 AGENTS.md emergente

3.6 HTML semântico SSR

4. O 8-variant Query Fan-out de Michael King

5. Métricas operacionais por camada

6. Roadmap de 90 dias para portal médio

Sprint 1 (dia 1-30): Fundação técnica

Sprint 2 (dia 31-60): Cobertura editorial

Sprint 3 (dia 61-90): Medição longitudinal

Diagnóstico de Agent Readiness em RAG

Receba conteúdo semanal sobre GEO e IA

Leituras correlatas

Sobre o Autor

Aprofunde-se no tema