GEO e Knowledge Graph: Arquitetura de Entidades para Search e IA
Como transformar sua marca em entidade canônica para Google, AI Overviews, ChatGPT, Gemini e Perplexity. 12 módulos cobrindo Search Fundamentals, Knowledge Graph, JSON-LD, ontologia de conteúdo, RAG corporativo, E-E-A-T e roadmap de 90 dias.
O que você vai aprender
Ao final deste curso, você dominará a arquitetura de entidades para search e IA generativa: do funcionamento de Search e Knowledge Graph do Google ao desenho de schema.org canônico, ontologia de conteúdo, entity gap analysis, conteúdo citável por LLMs, E-E-A-T como sistema reputacional e Knowledge Graph corporativo integrado a RAG. Encerra com roadmap executável de 90 dias.
Em vinte anos como executivo de marketing e tecnologia — passando por Semantix (Nasdaq), AI Brasil e agora à frente da Brasil GEO — nunca vi uma transição tão mal compreendida quanto a que separa SEO de GEO. A confusão não é semântica. É estrutural. Quando alguém me diz que está fazendo GEO porque otimizou meta tags para ChatGPT, eu sei que aquela operação vai queimar orçamento por seis a doze meses antes de descobrir que estava endereçando o problema errado.
GEO — Generative Engine Optimization — é a disciplina de garantir que sua entidade seja recuperada, citada e atribuída corretamente por mecanismos generativos como ChatGPT, Gemini, Claude, Perplexity, Copilot e AI Overviews do Google. A palavra-chave aqui é entidade. SEO clássico otimizava strings — termos, frases, slugs, densidade de palavras. GEO opera em outra camada: things, not strings, expressão que o Google usa desde o lançamento do Knowledge Graph em 2012.
A tese contraintuitiva deste curso é simples e dura de aceitar: GEO não é uma evolução incremental de SEO, é uma mudança de objeto. Quem trata GEO como SEO turbinado falha porque continua medindo posições em SERPs, fazendo keyword research, comprando backlinks e produzindo artigos em escala. Tudo isso continua valendo no contexto certo, mas não move o ponteiro do que importa em mecanismos generativos: ser uma entidade reconhecida, com fatos corroborados, recuperável em recortes específicos do conhecimento.
Antes de avançar, preciso desambiguar cinco siglas que circulam no mercado e que costumam ser usadas como sinônimos por gente que devia saber que não são:
- SEO (Search Engine Optimization): otimização para mecanismos de busca tradicionais; objetivo é rankear páginas em SERPs de dez links azuis. Métricas: posição média, CTR, sessões orgânicas.
- AEO (Answer Engine Optimization): subconjunto que mira featured snippets, People Also Ask e respostas diretas; ainda é SEO, mas com foco em zero-click. Métricas: presença em snippet, taxa de zero-click.
- SXO (Search Experience Optimization): combina SEO com UX e Core Web Vitals; mede a qualidade percebida da página depois do clique. Métricas: dwell time, bounce, conversão pós-clique.
- Entity SEO: já flerta com GEO; foca em construir a entidade da marca via schema.org, sameAs, Wikipedia e Wikidata. Métricas: presença em Knowledge Panel, knowsAbout, identifier coverage.
- GEO (Generative Engine Optimization): otimização para LLMs e mecanismos generativos; objetivo é share of answer, citation rate e atribuição correta da fonte. Métricas: LLM mention rate, brand-as-source share, sentiment de citação.
A diferença operacional fica clara quando você compara o que importa em cada disciplina. Em SEO eu pergunto: 'estou na página 1 para meu termo-cabeça?'. Em AEO eu pergunto: 'minha resposta está no box do Google?'. Em SXO eu pergunto: 'meu visitante converte depois do clique?'. Em Entity SEO eu pergunto: 'meu Knowledge Panel está completo e correto?'. Em GEO eu pergunto: 'quando alguém faz a pergunta-chave da minha categoria no ChatGPT, sou citado, com qual frequência, e o que se diz a meu respeito?'.
Essa última pergunta exige uma métrica que SEO clássico não tem: share of answer. Em SERPs tradicionais, share of SERP é o espaço visual que sua marca ocupa em uma busca — links azuis, sitelinks, imagens, vídeos. Em mecanismos generativos, a tela do usuário não é mais uma lista. É uma resposta sintética com três a sete fontes citadas. Share of answer mede quantas vezes, em N consultas representativas da sua categoria, sua marca aparece na resposta gerada e nas fontes citadas.
// Métrica canônica de share of answer
// Calculada em batch sobre um kit de prompts representativos da categoria
type PromptResult = {
prompt: string;
engine: 'chatgpt' | 'gemini' | 'perplexity' | 'claude' | 'ai_overview';
cited_sources: string[]; // domínios citados na resposta
brand_mentioned: boolean; // marca aparece no texto da resposta
brand_as_source: boolean; // marca aparece na lista de fontes
sentiment: 'positivo' | 'neutro' | 'negativo';
position_in_answer: number; // ordem em que a marca é citada (1 = primeira)
};
function shareOfAnswer(results: PromptResult[], domain: string): {
mention_rate: number;
source_rate: number;
weighted_score: number;
} {
const total = results.length;
const mentions = results.filter(r => r.brand_mentioned).length;
const sources = results.filter(r =>
r.cited_sources.some(s => s.includes(domain))
).length;
// peso adicional quando a marca é citada como fonte e em primeira posição
const weighted = results.reduce((acc, r) => {
if (!r.brand_mentioned) return acc;
const positionBoost = r.position_in_answer === 1 ? 1.5 : 1;
const sourceBoost = r.brand_as_source ? 1.3 : 1;
return acc + positionBoost * sourceBoost;
}, 0);
return {
mention_rate: mentions / total,
source_rate: sources / total,
weighted_score: weighted / total,
};
}O cálculo acima parece simples e é onde 90% das operações de GEO erram. Não é a fórmula que falha — é a base de prompts. Sem um kit de 25 a 100 perguntas representativas da categoria do cliente, qualquer share of answer é folclore. Na Brasil GEO trabalhamos com kits de 25 prompts mínimos por categoria, validados com o time comercial do cliente, rodados semanalmente em pelo menos quatro engines.
O erro mais caro do mercado em 2026 é tratar GEO como problema de produção de conteúdo. Equipes contratam dez redatores, publicam quatrocentos artigos por trimestre, otimizam para 'ChatGPT-friendly content' e descobrem seis meses depois que a marca continua invisível em respostas generativas. O motivo é mecânico: LLMs não recompensam volume, recompensam autoridade entitária. Conteúdo em escala sem trabalho de entidade é commoditização disfarçada de estratégia.
Para entender por que volume de conteúdo deixou de ser alavanca, é preciso olhar como LLMs selecionam o que citam. Simplificando o suficiente para caber em uma aula introdutória: mecanismos generativos modernos combinam três sinais — recuperação (retrieval), corroboração (consenso de fontes) e reputação entitária (quão estabelecida a entidade é em fontes estruturadas como Wikidata, Wikipedia, Crunchbase, registros oficiais). Conteúdo novo e de baixa autoridade entra na primeira camada e quase nunca atravessa as outras duas.
É por isso que em 2026 a régua mudou. Marcas com pouca produção mas com entidade impecavelmente estruturada — Wikidata Q-ID limpo, schema.org rico, sameAs consistente, fundadores e produtos modelados como nós conectados — ganham espaço em respostas generativas que antes eram dominadas por agregadores de tráfego. Voltamos, ironicamente, à era da reputação: quem você é importa mais do que quanto você publica.
Antes de produzir uma única linha de conteúdo novo, faça o exercício do prompt-pivot. Pegue as cinco perguntas que decidem compra na sua categoria, rode em ChatGPT, Gemini, Perplexity e AI Overview, anote tudo: marcas citadas, fontes na lista, sentimento, posição. Esse documento de duas páginas vale mais do que qualquer auditoria de SEO de cem páginas, porque coloca o problema na camada certa: você é entidade reconhecida ou não é? Se não é, todo o resto é cosmética.
Para fechar a fundamentação, três conceitos que vão atravessar o curso inteiro. Entidade é qualquer coisa única e identificável: pessoa, empresa, produto, lugar, evento, dataset, conceito. Recuperabilidade é a propriedade de uma entidade ser encontrada em sistemas de retrieval — depende de URLs estáveis, schema bem feito, identifiers públicos. Atribuição é o ato de um mecanismo generativo dar crédito à fonte certa quando reutiliza o conhecimento. As três métricas-chave de GEO derivam dessa trinca: presença entitária, taxa de recuperação e taxa de atribuição correta.
Você terminou o Step 01 sabendo o que separa SEO, AEO, SXO, Entity SEO e GEO; entende por que a métrica que importa mudou de share of SERP para share of answer; reconhece que conteúdo em escala virou commoditização perigosa quando desacoplado de trabalho entitário; e tem em mãos o exercício do prompt-pivot como diagnóstico inicial. Nos próximos três steps vamos olhar como Search funciona internamente, o que é um knowledge graph e como o Google estruturou o seu próprio.
Perguntas frequentes
GEO substitui SEO em 2026?
Qual a diferença entre share of SERP e share of answer?
Por que JSON-LD é o padrão recomendado pelo Google em vez de Microdata ou RDFa?
Qual propriedade schema.org liga uma marca aos seus perfis externos?
O que é entity gap analysis e por que ela substitui keyword research em GEO?
Alexandre Caramaschi
CEO da Brasil GEO, ex-CMO da Semantix (Nasdaq), cofundador da AI Brasil
GEO e Knowledge Graph viraram o substrato técnico que separa marcas que controlam sua narrativa nas respostas geradas das que viram menção de rodapé. Este curso sistematiza o que aprendi operando arquitetura de entidades em B2B brasileiro, do JSON-LD ao Knowledge Graph proprietário. Para dúvidas, entre em contato pelo WhatsApp ou LinkedIn.