Alexandre Caramaschi

doi:10.2139/ssrn.6460680

Schema.org Sozinho Não Amplifica Citação em IA: O Estudo Ahrefs Explicado em 10 Q&A

Entre agosto de 2025 e março de 2026, a Ahrefs acompanhou 1.885 páginas que adicionaram JSON-LD e comparou com quase 4.000 páginas de controle. O resultado foi declive relativo de 4,6% em AI Overviews e ganhos estatisticamente indistinguíveis de zero em AI Mode e ChatGPT. Estas 10 perguntas explicam o que o estudo realmente mostra, o que não mostra, a leitura crítica de Anthony Lee e a generalização de Pedro Dias.

O estudo confirma uma coisa e não confirma outra. Confirma que adicionar schema em páginas que já estão no pool de citações de IA não amplifica resultado no curto prazo. Não confirma que schema perdeu valor em geral. Schema continua sendo alavanca em Knowledge Graph, em desambiguação de entidade, em rich results vivos e em sinalização para crawlers fora do Google.

Leituras complementares deste site: Schema.org no glossário, Knowledge Graph, FAQ rich result desativado em mai 2026, publicações e editorial board.

O que o estudo da Ahrefs mediu e o que NÃO mediu?

O estudo acompanhou 1.885 páginas que adicionaram JSON-LD entre agosto de 2025 e março de 2026, com quase 4.000 páginas de controle pareadas pelo histórico de citação em IA. Os autores aplicaram uma abordagem de diferença em diferenças e mediram a variação de citação por página tratada versus controle em três plataformas: Google AI Overviews, Google AI Mode e ChatGPT (Ahrefs, We Tracked 1,885 Pages Adding Schema, mai 2026). O resultado, robusto sob quatro testes estatísticos, foi um declínio relativo de 4,6% em AI Overviews e ganhos estatisticamente indistinguíveis de zero em AI Mode (2,4%) e ChatGPT (2,2%). O que o estudo NÃO mediu, e isso é central, é: efeito de schema sobre páginas que ainda não estavam sendo citadas por IA, efeito de longo prazo após seis ou doze meses, efeito de schema combinado com outras intervenções editoriais, e efeito em motores fora do escopo (Perplexity, Gemini fora de AI Overviews, Bing Copilot).

As 1.885 páginas eram representativas do universo total?

Sim e não. A amostra foi grande o suficiente para estabilidade estatística, e o pareamento com controles reduz boa parte do viés de seleção. Mas representatividade tem outra camada que vale destrinchar. Compare o que a amostra cobre bem e o que a amostra cobre mal.

Dimensão Bem coberta na amostra Mal coberta na amostra
Idioma Inglês predominantemente Portugês, espanhol e idiomas menores
Vertical Tech, marketing, SaaS e e-commerce Saúde regulada, finanças reguladas, governo
Maturidade SEO Páginas já indexadas e com histórico Sites recém-lançados sem track record
Formato JSON-LD em FAQPage, Article, Product Microdata, RDFa e schemas administrativos
Condição base Páginas que já tinham alguma citação em IA Páginas sem nenhuma citação prévia

O próprio Anthony Lee, em comentário sobre o estudo, apontou que a amostra mede o efeito de schema em páginas que já estão no pool de citações. Não responde se schema ajuda uma página fora do pool a entrar. São perguntas diferentes, e generalizar uma resposta na outra é erro metodológico que Pedro Dias também criticou.

Por que o efeito em AI Overviews ficou negativo?

Pequeno e negativo são duas coisas. O declínio de 4,6% em AI Overviews é estatisticamente significativo no conjunto da amostra, mas absolutamente pequeno em termos de magnitude prática. Existem três interpretações plausíveis e nenhuma delas é definitiva. Primeira interpretação: ruído de plataforma. Entre agosto/2025 e março/2026, o Google reorganizou várias vezes a forma como AI Overviews seleciona fontes, com testes públicos documentados pela própria empresa (Google Search Liaison, várias notas em 2025-2026). Variações de 5% para mais ou para menos em janela curta são consistentes com flutuação não relacionada à intervenção. Segunda interpretação: schema mal feito. Em auditoria que rodei no meu time, cerca de 18% das páginas que adicionam schema em projetos novos têm erros sutis de tipagem que não bloqueiam o validador mas confundem o crawler. Se a amostra do estudo replica essa taxa, parte do declínio pode vir de implementações ruins. Terceira interpretação: causalidade reversa. Em alguns CMSs, a adição de schema vem junto com refatorações de template que mudam o conteúdo visível. Não dá para isolar perfeitamente.

Schema.org perdeu valor então?

Não. Schema perdeu o papel de alavanca mágica para citação em IA. Continua tendo papel sólido em várias frentes. Como sinal para Knowledge Graph e desambiguação de entidade, schema de Organization, Person, sameAs e LocalBusiness segue sendo lido pelo Google e pelo Bing para alimentar painéis e atribuições. Como elegibilidade para rich results ainda ativos (HowTo restrito, Recipe, Review com restrição, Event, Product com preço, Breadcrumb), schema continua sendo o gatilho técnico. Como facilitador semântico para LLMs de fora do Google que ainda lêem JSON-LD em algumas operações de retrieval, schema funciona como higiene barata. O recado prático que dou em consultoria na Brasil GEO é simples: schema é higiene, não alavanca. Mantém quem já tem, implementa quem precisa para rich results vivos, não inicia projeto de schema com promessa de aumentar citação em IA.

Two-Phase JSON-LD theory: o que diz?

A Two-Phase JSON-LD theory, articulada por Anthony Lee em seu preprint The SEO Floor (25 abr 2026, AI+Automation; 26 abr 2026, SSRN), propõe que o efeito de schema sobre citação em IA opera em dois momentos distintos. Fase um: indexação e elegibilidade. Aqui schema ajuda o motor a entender a página, classificar a entidade e determinar se a URL entra no pool de candidatos a fonte. Fase dois: seleção dentro do pool. Aqui o que decide são sinais como ranking orgânico (o SEO Floor), autoridade de entidade, frescor e qualidade de evidência. Schema, segundo Lee, perde força nessa segunda fase. A leitura combinada com o estudo Ahrefs faz sentido: a Ahrefs mediu apenas a fase dois, porque a amostra já estava no pool. Logo, é coerente que o efeito tenha sido próximo de zero. Não é evidência contra schema. É evidência de que o canal de efeito de schema é a fase um, não a fase dois.

Como Anthony Lee criticou metodologicamente o estudo?

Lee fez três críticas técnicas no preprint The SEO Floor e em comentários públicos posteriores. A primeira é a do recorte de amostra. O estudo mediu o efeito de schema sobre páginas que já estavam sendo citadas. Lee argumenta que esse recorte exclui exatamente o caso de uso mais relevante para times de marketing, que é tentar entrar no pool de citação, e não brigar pelo último ponto percentual quando já se está dentro. A segunda crítica é a janela temporal. Trinta dias antes e trinta dias depois da intervenção podem ser curtos demais para capturar efeitos de re-rastreamento e re-indexação em sistemas que processam mudanças com latência variável. A terceira crítica é a granularidade. O estudo Ahrefs reporta efeito médio agregado por plataforma. Não estratifica por tipo de schema (FAQPage versus Article versus Product), por qualidade de implementação, nem por classe de página (money page versus glossário). Sem essa estratificação, o efeito médio pode estar mascarando heterogeneidade relevante.

Pedro Dias generalizou demais ao dizer que GEO não funciona?

Em parte, sim. Em parte, ele tem razão. Vamos separar o que ele defende.

Pedro Dias, no post Mt Stupid Has a Pricing Page (The Inference, mai 2026), cita três fontes independentes que apontam fragilidade no playbook GEO de 2025: estudos de labs, o experimento da Ahrefs e a nova documentação oficial do Google de 15 mai 2026. Aqui ele tem razão direcionalmente. Cada fonte, por si, derruba uma promessa específica do mercado. Juntas, derrubam a narrativa de que existe um conjunto fechado de hacks que separa quem ganha de quem perde em IA.
Onde ele generaliza demais é ao concluir que GEO inteiro é fraude. A documentação oficial do Google de 15 mai 2026 não diz isso. Diz que SEO clássico é a fundação e que dados estruturados especiais para IA não são exigidos. Microsoft, em paralelo, criou métricas dedicadas de citação em Bing Webmaster Tools, OpenAI documenta OAI-SearchBot, Anthropic distingue Claude-SearchBot. Há uma camada operacional real que existe além do SEO clássico. Chame-se de GEO, AEO ou outra coisa, ela existe.
Minha posição é a mesma há um ano: GEO como pacote de hacks proprietários é venda de hype. GEO como disciplina cross-platform de retrievability, citability, freshness e entity clarity é trabalho sério. Pedro acerta no primeiro recorte, exagera no segundo.

Schema continua valendo para Knowledge Graph?

Sim, e essa é a frente onde schema continua sendo investimento sólido em 2026. O Google usa marcações como Organization, Person, sameAs, LocalBusiness, Article com author e publisher para alimentar o Knowledge Graph e os painéis de conhecimento. A documentação oficial de Search Central reforça que dados estruturados ajudam o Google a entender melhor entidades e relações, mesmo quando não geram rich result visível na SERP. Em projeto que conduzi com a Stone canônica, o trabalho de consolidar Organization schema com sameAs apontando para Wikidata, LinkedIn, Crunchbase e perfis oficiais aumentou a precisão das menções da marca em ChatGPT e Perplexity em prompts canônicos da categoria. O efeito é medível no Citation Rate, ainda que não seja medível em um teste curto de diferença em diferenças como o da Ahrefs. Schema para entidade canônica é alavanca. Schema para FAQ inflada já não era, e agora também não tem display.

O que ainda compensa em Schema.org em 2026?

Cinco frentes valem o investimento, na minha leitura. Primeira: Organization, Person e sameAs para consolidar entidade canônica da marca e dos autores. Segunda: Article com headline, author, datePublished e dateModified, porque alimenta sinal de frescor para AI Overviews e AI Mode. Terceira: Product e Offer para e-commerce, ainda gerando rich result em produto e desambiguação em buscas comerciais. Quarta: LocalBusiness com NAP completo para empresas com camada local. Quinta: Breadcrumb para hierarquia de navegação, ainda lido como sinal de estrutura. Fora desse núcleo, o ROI cai. HowTo virou restrito (Google, 2023), FAQ rich result foi desativado (Google, 7 mai 2026), e schemas raros (CourseInfo, JobPosting fora do indeed-equivalente) só fazem sentido se há ativo editorial sustentando. O resto é higiene de baixo custo: implementa se já está no template, não para tudo para refatorar.

Como a Brasil GEO aplica isso na prática?

Em três passos canônicos que rodo com cada cliente novo. Primeiro passo: auditoria de schema vivo. Levanto o que já está implementado, separo por valor (alavanca de entidade, higiene, ruído) e mato o que não serve a nenhuma das três funções. Em portal típico de SaaS B2B no Brasil, isso costuma remover entre 20% e 35% do JSON-LD existente. Segundo passo: consolidação de entidade canônica. Implemento Organization e Person com sameAs apontando para até cinco fontes externas verificáveis (Wikidata, LinkedIn, Crunchbase, perfil oficial em câmara setorial, GitHub quando aplicável). Esse passo é o que mais move o ponteiro em Citation Rate em LLMs. Terceiro passo: medição cross-platform. Monto dashboard com Citation Rate em 25 prompts canônicos por LLM, branded search lift no Google Search Console, AI Performance no Bing Webmaster Tools e referral utm_source=chatgpt.com no analytics. Esse dashboard substitui o KPI antigo de impressões de rich result, que perdeu sentido depois da desativação de 7 mai 2026.

Para aprofundar

“Schema é higiene, não alavanca. O estudo Ahrefs mata a tese de schema como atalho para IA. Não mata o papel de schema em entidade canônica, Knowledge Graph e rich results vivos.”

Quer uma auditoria de schema da sua marca?

Em 30 minutos, mapeio o schema vivo do seu domínio, separo alavanca de ruído e identifico onde consolidar entidade canônica para ganhar precisão em citação de IA. Diagnóstico gratuito para empresas B2B no Brasil.

Quero minha auditoria de schema