Por que um glossário canônico vale mais que um curso de GEO
Mês passado um amigo consultor me ligou desesperado. Tinha perdido um cliente de R$ 18 mil porque, na reunião de pitch, confundiu AEO com FAQ schema e ASO com App Store Optimization. O lead, diretor de marketing de uma rede de óticas em São Paulo, fechou com outra agência três dias depois.
A história dele não é exceção. É regra. Em 2026, o vocabulário do nosso ofício explodiu. SEO, AEO, GEO, ASO, B2A, RAG, MCP, NLWeb, UCP, AP2. Para cada sigla nova, dezenas de freelancers usando como sinônimo. A consequência é direta: cliente percebe que você não sabe do que está falando, e fecha com quem fala com firmeza canônica.
A tese deste glossário é simples e contraintuitiva. Não é o consultor que sabe mais técnica que vende mais. É o consultor que tem vocabulário canônico defensável. Quando você usa Wikidata Q-ID, fonte primária e exemplo prático para cada termo, o cliente entende que está pagando por método, não por modinha.
Construí esta lista em 30 verbetes porque é o piso defensável para qualquer proposta comercial de R$ 5 mil a R$ 25 mil MRR em 2026. Cada verbete tem definição em duas linhas, exemplo prático aplicável a uma PME brasileira, fonte primária com URL completa, Wikidata Q-ID quando existe e o campo mais importante: confundido com. É nesse campo que mora a diferença entre fechar a proposta e perder o lead. Para quem já leu meu FAQ executivo de GEO 2026, este glossário é a versão de bancada: aberto na mesa enquanto você escreve a proposta.
Aviso de honestidade. Toda lista canônica envelhece. Coloquei data de publicação no topo e versionarei a cada seis meses. Se você está lendo isto em 2027, valide cada Q-ID via wbsearchentities antes de citar em proposta. Entity drift existe inclusive em glossário.
Bloco 1 — Fundação: as 6 siglas que sustentam todo o resto
1. SEO — Search Engine Optimization
Definição. Conjunto de práticas que aumentam a probabilidade de uma URL aparecer nos resultados orgânicos de um motor de busca, com base em sinais técnicos, de conteúdo e de autoridade. Continua válido em 2026 e foi reafirmado pelo próprio Google em maio: SEO para IA é SEO.
Exemplo prático. Otimizar a página de uma ótica para "óculos progressivo cidade Goiânia" envolve título, headings, schema LocalBusiness, backlinks regionais e Core Web Vitals.
Fonte primária. developers.google.com/search/docs e Google AI Optimization Guide, 15 mai 2026.
Wikidata. Q180711.
Confundido com. SEM (search engine marketing, que inclui pago), SXO (search experience optimization, jargão de fornecedor). SEO é apenas a parte orgânica.
2. AEO — Answer Engine Optimization
Definição. Otimização para mecanismos que entregam respostas diretas em vez de lista de links. Cobre Featured Snippets, People Also Ask, AI Overviews e respostas em assistentes de voz.
Exemplo prático. Estruturar a página da ótica em formato pergunta-resposta com FAQPage schema aumenta 3,2 vezes a chance de citação em AI Overviews, segundo Wellows 2026.
Fonte primária. Wellows AEO Benchmark 2026 e blog do Google sobre AI Overviews.
Wikidata. Termo ainda sem Q-ID dedicado em 28 mai 2026. Use Q180711 com qualificador.
Confundido com. FAQ schema (que é apenas uma das ferramentas). AEO é o objetivo, FAQPage é o meio.
3. GEO — Generative Engine Optimization
Definição. Otimização para mecanismos generativos como ChatGPT, Gemini, Claude e Perplexity, com foco em ser citado dentro da resposta sintetizada, não no resultado de busca clássico. Tem método acadêmico publicado em KDD 2024.
Exemplo prático. Adicionar estatísticas com fonte e ano em parágrafos curtos eleva citações em LLMs em até 41%, segundo o paper original de Princeton e Georgia Tech.
Fonte primária. arXiv 2311.09735, Aggarwal et al., KDD 2024.
Wikidata. Pendente de Q-ID consolidado. Aplique como Q180711 qualificado por Q115305900 (LLM).
Confundido com. SEO tradicional. A diferença prática está no objeto otimizado: SEO otimiza posição, GEO otimiza citação.
4. ASO — Answer Set Optimization
Definição. Otimização para o conjunto de respostas que um LLM pode gerar a partir de variações da mesma intenção. Em vez de mirar uma pergunta única, você cobre a constelação de fan-out queries que o motor executa internamente.
Exemplo prático. Em vez de criar um artigo "melhor ótica em Goiânia", criar quinze peças que cobrem variações (preço, marca, lente, bairro, convênio). Cada uma alimenta um nó diferente do Query Fan-Out.
Fonte primária. Google patente US10776471B2 sobre Information Gain e documentação Bing Webmaster AI Performance fev 2026.
Wikidata. Sem Q-ID. Termo novo, padronizado em 2025.
Confundido com. App Store Optimization (otimização de ficha em loja de apps). ASO em GEO não tem relação com mobile. Esse é o erro mais caro do glossário.
5. B2A — Business to Agent
Definição. Modelo comercial em que o cliente final não é humano mas um agente de IA atuando em nome dele. Estende B2C e B2B para uma terceira modalidade: vender para a máquina que compra pelo humano.
Exemplo prático. Uma loja de ferramentas que expõe catálogo via UCP em /.well-known/ucp permite que um agente Claude ou ChatGPT, instruído pelo eletricista, compare preços e feche compra sem o humano abrir site nenhum. Detalhei o modelo no artigo canônico sobre B2A.
Fonte primária. Gartner outubro 2025: 90% das jornadas B2B serão intermediadas por agente até 2028, em US$ 15 trilhões.
Wikidata. Sem Q-ID. Cunhado em 2024 por consultorias de comércio agêntico.
Confundido com. B2B SaaS API-first. B2A é mais: pressupõe negociação autônoma e checkout sem interface humana.
6. RAG — Retrieval Augmented Generation
Definição. Arquitetura que combina recuperação de documentos externos com geração de resposta por LLM. Permite que o modelo cite fontes recentes ou privadas sem retreino.
Exemplo prático. ChatGPT com web browsing é RAG. Perplexity é RAG. Toda vez que o modelo "navega" para responder, ele está usando RAG.
Fonte primária. arXiv 2005.11401, Lewis et al., NeurIPS 2020.
Wikidata. Q121362277.
Confundido com. Fine-tuning. RAG não muda os pesos do modelo, apenas anexa contexto recuperado ao prompt.
Bloco 2 — Operação: as métricas que entram no dashboard
7. Mention Rate
Definição. Percentual de respostas de LLM, dentro de um banco de prompts canônicos, em que a marca aparece citada por nome. Métrica primária do dashboard GEO.
Exemplo prático. Em 100 prompts variando "melhor consultoria GEO Brasil", se a Brasil GEO for citada em 22, Mention Rate = 22%.
Fonte primária. GenOptima Benchmark 2026: <5% invisível, 5-15% emergente, 15-30% forte, >30% dominante.
Wikidata. Sem Q-ID. Métrica de mercado, não conceito enciclopédico.
Confundido com. Share of Voice tradicional (que mede menções em mídia). Mention Rate é restrito a saídas de LLM.
8. Citation Rate
Definição. Percentual de respostas que incluem um link clicável para a marca, com URL canônica. Subconjunto do Mention Rate.
Exemplo prático. Perplexity costuma ter Citation Rate próxima ao Mention Rate. ChatGPT 4o sem browsing tem Citation Rate próxima a zero, ainda que mencione marcas. Cubro a distinção no artigo Share of Voice em IA.
Fonte primária. Profound Citation Index 2026 e relatório OtterlyAI 2026.
Wikidata. Sem Q-ID.
Confundido com. Backlink. Citation em LLM não passa PageRank, mas tem efeito direto em conversão zero-clique.
9. Share of Model
Definição. Participação percentual da marca em todas as menções de um vertical específico, dentro de um modelo específico. Equivalente algorítmico do Share of Voice publicitário.
Exemplo prático. Se em 100 prompts sobre "GEO Brasil" o Claude cita a Brasil GEO em 18 e cita concorrentes em 42, o Share of Model dela é 30% (18 / 60 totais).
Fonte primária. Semrush AI Visibility Toolkit 2026 e Profound Share of Model Index.
Wikidata. Sem Q-ID.
Confundido com. Market share. Share of Model mede atenção algorítmica, não receita.
10. Information Gain
Definição. Sinal patenteado pelo Google que mede o quanto uma página adiciona em informação nova relativa ao corpus já indexado para aquela query. Quanto maior o ganho, maior a probabilidade de citação em AI Overviews.
Exemplo prático. Republicar um artigo que cita as mesmas estatísticas que outros 200 sites tem Information Gain próximo de zero. Trazer uma pesquisa proprietária com microdados eleva o ganho substancialmente.
Fonte primária. Patente USPTO US10776471B2.
Wikidata. Sem Q-ID. Conceito de patente.
Confundido com. Originalidade subjetiva. Information Gain é métrica algorítmica, não juízo editorial.
11. Query Fan-Out
Definição. Decomposição automática de uma query do usuário em múltiplas subqueries internas que o motor executa em paralelo para sintetizar a resposta final. Documentado pelo próprio Google em material sobre AI Mode.
Exemplo prático. "Melhor ótica em Goiânia que aceite Unimed" pode virar fan-out em: óticas listadas em Goiânia, planos aceitos por cada uma, avaliações no Google, preço médio de armação. Cada nó é uma busca separada.
Fonte primária. Google I/O 2026 e blog do AI Mode.
Wikidata. Sem Q-ID.
Confundido com. Sinônimos LSI. Fan-out é mais profundo: gera buscas independentes, não variações lexicais.
12. Answer Capsule
Definição. Bloco de resposta sintetizada que o motor entrega no topo da página, agregando múltiplas fontes. Em AI Overviews tem 50 a 200 palavras, com 3 a 10 fontes citadas.
Exemplo prático. Ao buscar "como abrir MEI em 2026", o Google entrega cápsula com 8 passos e 5 links. As 5 marcas citadas dominam aquele tema por meses.
Fonte primária. Pew Research jul 2025: páginas com AI Overview reduziram CTR de 15% para 8%. Semrush mai 2025: 58,5% das queries nos EUA terminam em zero clique.
Wikidata. Sem Q-ID consolidado.
Confundido com. Featured Snippet. Answer Capsule é gerada por LLM, snippet é extraída literalmente.
Bloco 3 — Infraestrutura: o que vive no servidor
13. Schema Authority Stack
Definição. Conjunto coordenado de tipos Schema.org que reforçam mutuamente a entidade canônica: Organization, Person, Article, FAQPage, HowTo, Course, Event, Product, Service, DefinedTerm. Sempre com sameAs apontando para Wikidata, Wikipedia, LinkedIn, Crunchbase e perfis oficiais.
Exemplo prático. A página About da Brasil GEO marca Organization com sameAs para Wikidata Q138755989, LinkedIn da empresa, GitHub, YouTube e canal oficial X. Isso cria reforço cruzado de identidade.
Fonte primária. Documentação Schema.org e guia canônico Schema para IA.
Wikidata. Conceito Q3475322 (Schema.org) e Q6108942 (JSON-LD).
Confundido com. SEO técnico clássico. Schema Authority Stack tem efeito direto em citação por LLM, não apenas em rich snippets visuais.
14. Knowledge Graph
Definição. Grafo de entidades e relações que o motor usa para representar conhecimento. Google KG é o mais conhecido, mas Bing, Apple, Amazon e os próprios LLMs têm versões próprias.
Exemplo prático. Quando você procura "Alexandre Caramaschi" e o Google mostra painel lateral com foto, cargo e empresas, está exibindo o Knowledge Panel, que é a interface do Knowledge Graph.
Fonte primária. Singhal 2012 introduzindo Google KG e literatura subsequente.
Wikidata. Q33002955.
Confundido com. Banco de dados relacional. KG é grafo de triplas sujeito-predicado-objeto, modelo lógico distinto.
15. sameAs
Definição. Propriedade Schema.org que declara que a entidade descrita é a mesma pessoa, organização ou conceito presente em outra URL canônica. Reduz drift de entidade e ancora identidade em fontes externas confiáveis.
Exemplo prático. Em uma página Person para Alexandre Caramaschi, o sameAs deve apontar para Wikidata, LinkedIn, X, GitHub, YouTube, podcast Spotify e canal oficial.
Fonte primária. schema.org/sameAs.
Wikidata. Conceito relacionado Q15188077.
Confundido com. Link em <link rel="canonical">. Canonical resolve duplicação de URL, sameAs resolve identidade de entidade.
16. llms.txt
Definição. Padrão proposto em 2024 por Jeremy Howard, arquivo na raiz do site que declara o que LLMs podem encontrar como conteúdo curado, índice e versão completa em llms-full.txt.
Exemplo prático. brasilgeo.ai expõe /llms.txt e /llms-full.txt consolidando glossário, FAQ e artigos canônicos.
Fonte primária. llmstxt.org e guia prático llms.txt.
Wikidata. Sem Q-ID.
Confundido com. Sinal Google. Não é. OtterlyAI 2026 estimou que apenas 0,1% do tráfego de bot vem por llms.txt. Vale como organização interna, não como tráfego.
17. agents.md
Definição. Sucessor proposto para llms.txt em 2025-2026, formato Markdown raiz que descreve como agentes de IA devem interagir com o site, incluindo endpoints MCP, sitemap agêntico, políticas de uso e contato.
Exemplo prático. Em alexandrecaramaschi.com expomos /agents.md com links para /ai-policy.json, /mcp.json e /sitemap_agentic_discovery.xml.
Fonte primária. Comunidade Anthropic e adoção crescente em 2026.
Wikidata. Sem Q-ID.
Confundido com. llms.txt. agents.md cobre mais: políticas, endpoints e capacidades.
18. MCP — Model Context Protocol
Definição. Protocolo aberto da Anthropic, publicado em novembro de 2024, que padroniza como modelos consomem ferramentas e fontes externas via servidores. Adotado por OpenAI, Google e Microsoft em 2025-2026.
Exemplo prático. Toda loja Shopify expõe nativamente um endpoint MCP em /api/ucp/mcp, permitindo que Claude ou ChatGPT consulte estoque sem scraping.
Fonte primária. modelcontextprotocol.io.
Wikidata. Q133436854.
Confundido com. Plugin OpenAI clássico. MCP é multi-vendor, plugin era proprietário.
Bloco 4 — Protocolos: a camada agêntica que está nascendo
19. UCP — Universal Commerce Protocol
Definição. Padrão proposto pelo Google em 2025 e adotado por Shopify em 2026 para expor catálogo, estoque, preço e checkout de qualquer loja em formato consumível por agente de IA. Inclui Universal Cart para fechamento atômico de pedidos multi-loja.
Exemplo prático. Loja em loja.herreirasemijoias.com.br expõe /.well-known/ucp. Agente do comprador consulta catálogo, monta carrinho e finaliza sem renderizar página HTML.
Fonte primária. Google Merchant Live (GMLive) 2026 e documentação Shopify.
Wikidata. Sem Q-ID consolidado em 28 mai 2026.
Confundido com. Open Catalog Format ou GMC feed. UCP é mais: inclui checkout e estoque ao vivo.
20. NLWeb
Definição. Protocolo aberto apresentado por R.V. Guha na Microsoft Build 2025 que transforma qualquer endpoint web em servidor MCP nativo, com Schema.org como contrato. Cada página passa a ser também ferramenta agêntica.
Exemplo prático. Um site de receitas que segue NLWeb permite que um agente busque "receitas sem glúten com menos de 400 kcal" diretamente, sem ler HTML.
Fonte primária. Microsoft Build 2025 keynote de R.V. Guha e repositório oficial.
Wikidata. Sem Q-ID dedicado.
Confundido com. JSON-LD genérico. NLWeb adiciona contrato de execução, não apenas semântica descritiva.
21. AP2 — Agent Payments Protocol
Definição. Protocolo de pagamento entre agentes proposto em 2025, integrado ao Google Pay e Mastercard, que permite que um agente de IA autorize transações em nome do usuário com escopos delimitados.
Exemplo prático. Comprador autoriza agente a gastar até R$ 800 em ferramentas elétricas no mês. O agente fecha 5 compras autônomas, todas dentro do escopo.
Fonte primária. Google for Developers blog 2025-2026.
Wikidata. Sem Q-ID.
Confundido com. OAuth para pagamento. AP2 cobre autorização e liquidação, OAuth só autoriza.
22. A2A — Agent-to-Agent
Definição. Padrão de mensageria entre agentes autônomos, com discovery, capabilities e protocolos de negociação. Empurrado por Google, IBM e Anthropic em 2025.
Exemplo prático. Agente do comprador conversa com agente do vendedor para fechar pedido grande, incluindo desconto progressivo e prazo de entrega.
Fonte primária. Especificação Google A2A protocol 2025.
Wikidata. Sem Q-ID.
Confundido com. Multi-agent framework como CrewAI ou AutoGen. A2A é protocolo, não framework.
23. OpenAPI agêntica
Definição. Especificação OpenAPI 3.1 enriquecida com extensões x-ai- que indicam custo computacional, idempotência, escopo de dados e elegibilidade para uso por agente. Adotada como base por MCP e A2A.
Exemplo prático. Endpoint /v1/quote de uma corretora indica x-ai-idempotent: true e x-ai-cost: low, sinalizando que agente pode chamar livremente.
Fonte primária. Especificação OpenAPI Initiative 2025-2026.
Wikidata. Q4895062 (OpenAPI Specification).
Confundido com. Swagger 2.0. Versão antiga sem extensões agênticas, hoje insuficiente.
24. IndexNow
Definição. Protocolo de notificação direta a motores de busca quando uma URL é criada, atualizada ou removida. Reduz lag de indexação de dias para minutos. Suportado por Bing, Yandex e endpoint canônico api.indexnow.org.
Exemplo prático. Cada novo artigo publicado em alexandrecaramaschi.com dispara POST para os três endpoints. Em 24h o conteúdo costuma aparecer em Bing e Perplexity.
Fonte primária. indexnow.org.
Wikidata. Q109815017.
Confundido com. Sitemap. Sitemap é declarativo, IndexNow é push event.
Bloco 5 — Mensuração: as métricas avançadas que separam pro de júnior
25. Citation Persistence
Definição. Tempo médio em que uma citação à marca permanece visível em respostas geradas, considerando o ciclo de re-rastreio de cada motor. Em Perplexity costuma ser de dias, em Gemini de semanas, em ChatGPT pode variar.
Exemplo prático. Uma citação ganha por publicar paper acadêmico tende a persistir mais de 90 dias. Uma citação ganha por post de blog comum costuma cair em 14-30 dias.
Fonte primária. Profound 2026, monitoramento contínuo de 27 milhões de citações.
Wikidata. Sem Q-ID.
Confundido com. Backlink permanence. Persistence em LLM depende de re-rastreio do motor, não do link estar vivo.
26. Compression Fidelity
Definição. Grau em que o LLM mantém as nuances da fonte original ao comprimi-la na resposta. Métrica avaliada por similaridade semântica entre trecho citado e fonte canônica.
Exemplo prático. Uma fonte com estatísticas precisas e datas explícitas costuma ter fidelidade próxima de 0,9. Uma fonte com afirmações vagas vira citação alucinada, com fidelidade abaixo de 0,5.
Fonte primária. Wellows 2026 e literatura de avaliação de RAG.
Wikidata. Sem Q-ID. Relacionado a Q116197048 (AI hallucination).
Confundido com. Citation count. Fidelity mede qualidade, count mede volume.
27. Cosine Similarity (citável)
Definição. Métrica matemática que mede o ângulo entre vetores de embedding. Em GEO, indica quão próximo o conteúdo está do centro semântico de uma consulta candidata a citação.
Exemplo prático. Wellows 2026 documenta que páginas com cosine similarity acima de 0,88 contra prompts canônicos receberam 7,3 vezes mais citações em AI Overviews que páginas abaixo.
Fonte primária. Wellows AEO Benchmark 2026 e literatura clássica de IR.
Wikidata. Q1255631.
Confundido com. Keyword match. Cosine é semântico, keyword é lexical.
28. Entity Boundary Drift
Definição. Fenômeno em que o LLM confunde a marca com homônimo, concorrente ou conceito adjacente, atribuindo fatos errados. Tratei como problema de bloqueio comercial em auditoria de entity drift.
Exemplo prático. Brasil GEO confundida com geotecnologia ou geoespacial em Claude Haiku e GPT-4.1-mini, conforme baseline de mai 2026.
Fonte primária. Literatura de NER e diagnóstico próprio Brasil GEO 22 mai 2026.
Wikidata. Sem Q-ID.
Confundido com. Brand confusion clássico. Drift é causado por contexto algorítmico, confusion por similaridade fonética.
29. Source Eligibility
Definição. Critério agregado que motores usam para decidir se um domínio é elegível como fonte citável. Combina autoridade tópica, frescor, schema, sameAs, presença em Knowledge Graph e histórico de citações prévias.
Exemplo prático. Wikipedia tem eligibility próxima a 1. Blog WordPress sem schema, sem about page e sem sameAs costuma ter eligibility próxima a 0.
Fonte primária. Google AI Optimization Guide 15 mai 2026 e literatura de TREC.
Wikidata. Sem Q-ID.
Confundido com. Domain Authority Moz. DA é métrica de fornecedor, eligibility é função do próprio motor.
30. Retrieval Fitness
Definição. Adequação técnica do site para ser recuperado por bot agêntico: tempo de resposta, robots permissivos para AI bots, ausência de paywall hostil, HTML semântico válido, schema correto, sameAs canônicos e endpoints declarados em agents.md.
Exemplo prático. Cloudflare set 2025 mostrou que Google rastreia 14 páginas para cada visitante, GPTBot rastreia 1.091, Claude 38.000 e Perplexity 194. Sites com baixa fitness queimam crawl budget sem ser citados.
Fonte primária. Cloudflare Radar 2025-2026 e patente Google US10776471B2.
Wikidata. Sem Q-ID.
Confundido com. Core Web Vitals. CWV cobre usuário humano, fitness cobre agente de IA.
Como usar este glossário em proposta comercial
O modelo de proposta que tem fechado contrato para mim e para consultores próximos segue 4 movimentos. Compartilho como eu uso e por quê.
Movimento 1, diagnóstico em vocabulário canônico. Na reunião de descoberta, eu peço para o cliente descrever o que ele acha que precisa. Em seguida, eu reescrevo a demanda dele usando 6 a 8 termos deste glossário, com Q-ID quando aplicável. Isso faz duas coisas: prova autoridade técnica e cria a sensação de que o cliente acabou de aprender algo concreto.
Movimento 2, distinção entre o que ele pediu e o que resolve. Sete em cada dez clientes chegam pedindo SEO e precisam de GEO + AEO. Outros três chegam pedindo "estar no ChatGPT" e precisam de Schema Authority Stack + sameAs. Eu aponto a diferença com o verbete confundido com. Não para humilhar, para alinhar escopo.
Movimento 3, métrica primária acordada. Sempre uma. Para PME, recomendo Mention Rate em banco de 20 prompts canônicos. Mensal. Para escala maior, acrescente Share of Model e Citation Persistence. Você pode usar o referencial acadêmico de medições GEO como anexo técnico.
Movimento 4, entregável mínimo viável. No primeiro mês entrego: Wikidata Q-ID criado, Schema Authority Stack na About, sameAs com 5 fontes canônicas, llms.txt e agents.md no ar, IndexNow ligado. Isso garante saída visível em 30-45 dias. Crescimento estrutural vem nos meses 2-6.
Decisão pessoal. Quando comecei a usar esse modelo, fechei 7 das 11 propostas seguintes. Antes fechava 2 ou 3 a cada 10. A diferença não foi preço nem promessa. Foi vocabulário canônico defendido com fonte e Q-ID. Se você é freelancer ou consultor de PME, comece pelo glossário antes do template de proposta. Vocabulário muda receita.