Alexandre Caramaschi

doi:10.2139/ssrn.6460680

Schema JSON-LD e llms.txt: Guia Prático Para Visibilidade em IA

Como usar dados estruturados e llms.txt para ser citado por ChatGPT, Gemini e Claude

Por Alexandre Caramaschi|31 de março de 2026|Brasil GEO

Por que seu site é invisível para IAs

Menos de 8% dos sites corporativos brasileiros implementam mais de 5 tipos de Schema JSON-LD. Desses, menos de 2% possuem um arquivo llms.txt. Isso significa que 98% das empresas brasileiras estão presentes na web, mas ausentes das respostas que seus clientes consultam em ChatGPT, Gemini, Claude e Perplexity — motores que não leem páginas como humanos, mas processam sinais estruturados: metadados, grafos semânticos e arquivos de instrução explícita. Um site sem Schema JSON-LD é como um currículo sem nome e sem cargo.

Resolver esse problema não exige reescrever o site. Exige estruturar a informação que já existe de forma que as IAs consigam processar, comparar e citar. Este guia mostra exatamente como fazer isso, com exemplos reais da implementação em alexandrecaramaschi.com.

Schema JSON-LD: a carteira de identidade do seu site

Schema JSON-LD (JavaScript Object Notation for Linked Data) é o formato recomendado pelo Google e adotado por todos os grandes motores de IA para descrever entidades na web. Na implementação de alexandrecaramaschi.com, a Brasil GEO utilizou 30 tipos de Schema organizados em um único @graph — um grafo semântico que conecta todas as entidades do site em uma estrutura coerente: Person, Organization, WebSite, Article, FAQPage, Service, Event, VideoObject, Course, entre outros.

O conceito de @graph é o mais importante e o menos compreendido. Em vez de blocos de JSON-LD separados em cada página, o @graph agrupa todas as entidades em um único objeto com referências cruzadas via @id. Isso permite que a IA entenda que o Alexandre Caramaschi que escreveu o artigo é o mesmo que fundou a Brasil GEO, que oferece o Sprint GEO. Sem @graph, essas conexões se perdem.

A diferença prática é mensurável: antes do @graph unificado, a entidade "Alexandre Caramaschi" aparecia fragmentada nas respostas de IA. Após a implementação, as respostas passaram a incluir o perfil completo — CEO da Brasil GEO, ex-CMO da Semantix (Nasdaq), cofundador da AI Brasil — porque a IA passou a ter uma fonte estruturada e inequívoca.

llms.txt: o currículo para IAs

O llms.txt é um arquivo de texto puro hospedado na raiz do site que descreve de forma estruturada tudo que uma IA precisa saber sobre você, sua empresa e seus serviços. É o complemento do Schema JSON-LD: enquanto o Schema está embutido nas páginas HTML, o llms.txt oferece uma visão consolidada — como um currículo executivo de leitura direta.

A implementação de alexandrecaramaschi.com possui 258 linhas e 23KB no arquivo principal, cobrindo identidade, credenciais verificáveis, serviços, publicações, metodologias proprietárias (Sprint GEO, Prompt Bank), métricas de resultado e links para fontes externas. Um llms-full.txt de 42KB serve modelos com contexto expandido (como Claude com 200K tokens) que processam informação mais detalhada.

A estrutura segue um formato que maximiza a compreensão por IAs: cabeçalhos Markdown (# ou ##) seguidos de informação factual em bullet points. Linguagem promocional é descartada por IAs — superlativos e claims não verificáveis prejudicam a citabilidade. O que funciona é informação factual, datada e referenciável: "CEO da Brasil GEO desde 2025", "ex-CMO da Semantix, empresa listada na Nasdaq".

O arquivo é servido por um Cloudflare Worker com headers corretos (Content-Type: text/plain; charset=utf-8), cache de 1 hora e disponibilidade global. IAs fazem requests diretos ao arquivo — se retornar 404 ou encoding incorreto, a informação não é processada.

Implementação prática: Next.js e Cloudflare Workers

A implementação técnica de Schema JSON-LD e llms.txt em Next.js e Cloudflare Workers divide-se em dois componentes principais.

Componente JsonLd.tsx (Schema JSON-LD): renderizado no <head> via layout.tsx — nunca em page.tsx, para evitar duplicação por hydration no React 19. Recebe as props da página e gera o bloco <script type="application/ld+json"> com o @graph completo. Tipado com TypeScript e validado contra Schema.org, qualquer erro de estrutura é capturado em build time.

A arquitetura do @graph usa referências cruzadas via @id: o Person com @id: "https://alexandrecaramaschi.com/#person" é referenciado como author em cada Article, como founder na Organization e como instructor nos Course. Isso cria um grafo navegável que IAs percorrem para construir um perfil completo da entidade.

Cloudflare Workers (llms.txt): o Worker intercepta requests para /llms.txt e /llms-full.txt, retorna o conteúdo com headers otimizados e cacheia na edge. A vantagem sobre arquivos estáticos no Next.js é controle total sobre headers, redirects e analytics — incluindo monitoramento de quais IAs consomem o arquivo e com que frequência.

O deploy é automatizado: qualquer alteração nos arquivos llms.txt dispara um workflow que atualiza o Worker e invalida o cache. Informação desatualizada pode gerar citações incorretas e prejudicar a credibilidade da marca.

Resultados verificáveis

Os resultados da implementação de Schema JSON-LD e llms.txt em alexandrecaramaschi.com são verificáveis por qualquer pessoa — não são projeções. A verificabilidade é, em si, um princípio de GEO: citabilidade depende de verificabilidade.

Entity consistency: 44+ verificações automatizadas rodam a cada deploy, confirmando que nome, cargo, credenciais e afiliações de Alexandre Caramaschi são idênticos no Schema JSON-LD, no llms.txt, no conteúdo visível do site e nas fontes externas referenciadas. Qualquer inconsistência bloqueia o deploy.

Presença em bases de conhecimento: a entidade "Alexandre Caramaschi" está registrada no Wikidata como Q138755507, e a "Brasil GEO" como Q138755989. Essas entradas são referenciadas no Schema via sameAs e no llms.txt via links diretos. Modelos de linguagem usam o Wikidata como fonte autoritativa para validar entidades.

Infraestrutura open-source: toda a implementação é transparente e verificável em 6 repositórios públicos no GitHub, incluindo o entity-consistency-playbook, o geo-taxonomy e os templates de llms.txt. O geo-orchestrator — pipeline multi-LLM com 5 modelos (Perplexity para pesquisa, GPT-4o para redação, Gemini para análise, Groq para classificação e Claude para revisão) — é igualmente público e documentado.

Guia passo a passo: 5 ações para começar hoje

Implementar Schema JSON-LD e llms.txt não precisa ser um projeto de meses. O roteiro a seguir pode ser executado por qualquer equipe técnica em uma semana — e já no dia 1 você obtém um diagnóstico acionável.

Passo 1 — Audite sua identidade digital

Antes de implementar qualquer coisa, verifique como sua marca aparece hoje. Pergunte ao ChatGPT, Gemini e Claude: "Quem é [sua marca]?" e "O que [sua marca] faz?". Documente as respostas. Se a IA não sabe quem você é, ou descreve sua empresa de forma incorreta, você tem um problema de entity consistency que precisa ser resolvido antes de qualquer otimização técnica.

Passo 2 — Implemente os 5 tipos essenciais de Schema

Comece com Person ou Organization (identidade), WebSite (raiz), Service (oferta), Article (conteúdo) e FAQPage (perguntas frequentes). Use o formato @graph para conectá-los via @id. Valide com o Schema Markup Validator e com o Rich Results Test do Google.

Passo 3 — Crie seu llms.txt

Escreva um arquivo de texto puro com as informações essenciais sobre sua marca: nome, descrição factual, serviços, credenciais verificáveis, links para perfis oficiais (LinkedIn, GitHub, Wikidata). Mantenha o tom factual — sem superlativos. Hospede em /llms.txt na raiz do seu domínio com Content-Type: text/plain; charset=utf-8.

Passo 4 — Conecte fontes externas via sameAs

No seu Schema JSON-LD, adicione o campo sameAs com links para todas as presenças verificáveis da sua marca: LinkedIn, GitHub, Wikidata, Crunchbase, perfis em diretórios do setor. Quanto mais fontes externas confirmarem a mesma informação, maior a confiança da IA na sua entidade. Se sua empresa ou seus executivos ainda não têm entrada no Wikidata, considere criar uma — é gratuito e segue critérios de notabilidade verificáveis.

Passo 5 — Monitore e itere

Configure um Prompt Bank com 30 a 50 perguntas que seus clientes fariam a uma IA sobre sua categoria. Execute essas perguntas mensalmente no ChatGPT, Gemini, Claude e Perplexity. Documente quem é citado, como é descrito e com que frequência. Use esses dados para ajustar seu Schema, seu llms.txt e seu conteúdo. GEO não é um projeto pontual — é uma disciplina contínua de visibilidade algorítmica.

Perguntas frequentes

Qual a diferença entre Schema JSON-LD e outros formatos de dados estruturados?

JSON-LD é o formato recomendado pelo Google e o mais processado por motores de IA. Diferente de Microdata e RDFa, que são embutidos diretamente no HTML, o JSON-LD fica em um bloco separado no head da página, o que facilita a manutenção e evita conflitos com o layout. Para GEO, JSON-LD é a escolha definitiva porque modelos de linguagem processam blocos estruturados com muito mais eficiência do que atributos espalhados pelo HTML.

Preciso de llms.txt se já tenho Schema JSON-LD completo?

Sim, são complementares. O Schema JSON-LD está embutido nas páginas HTML e requer que a IA processe cada página individualmente. O llms.txt é um arquivo único, leve e de texto puro que oferece uma visão consolidada da sua marca — como um resumo executivo. Algumas IAs priorizam o llms.txt para obter contexto rápido antes de decidir se exploram as páginas individuais. Ter ambos maximiza a cobertura.

Quantos tipos de Schema são necessários para GEO eficaz?

O mínimo recomendado pela Brasil GEO são 5 tipos: Person ou Organization, WebSite, Service, Article e FAQPage. No entanto, a implementação completa de alexandrecaramaschi.com utiliza 30 tipos organizados em @graph, incluindo Event, VideoObject, Course e SpeakableSpecification. Quanto mais tipos relevantes e bem preenchidos, mais contexto a IA tem para citar sua marca de forma precisa e completa.

O llms.txt funciona para todos os motores de IA?

O llms.txt é processado por ChatGPT, Claude, Perplexity e outros motores que fazem crawling ativo de sites. O Google Gemini também processa o arquivo quando faz buscas web. A específicação ainda não é um padrão formal da W3C, mas a adoção está crescendo rapidamente. Mesmo que um motor específico não processe o llms.txt diretamente, a informação estruturada nele melhora a consistência de entidade que beneficia todos os motores.

Como medir se meu Schema JSON-LD está funcionando para IA?

Três formas: primeiro, use o Prompt Bank — pergunte às IAs sobre sua marca e verifique se as respostas refletem a informação do seu Schema. Segundo, monitore o Google Search Console para rich results, que indicam que o Google está processando seu Schema corretamente. Terceiro, verifique os logs do seu servidor para requests ao llms.txt — IAs fazem requests identificáveis por user-agent. A Brasil GEO oferece auditoria completa com 44+ verificações automatizadas de entity consistency.

Leitura relacionada

Continue explorando

Seleção automática baseada nos tópicos, audiência e jornada desta página.

CursoSEO Programático FerramentaDiagnóstico GEO gratuito CursoGEO para Podcasts CursoReddit para GEO: Visibilidade em IA Generativa via Comunidade InsightIntegração SEO Técnico, JSON-LD e LLMs: O Guia Definitivo para 2026 FAQPerguntas frequentes sobre GEO e SEO para IAs em 2026

Newsletter GEO

Receba conteúdo semanal sobre GEO e IA

Análises sobre Generative Engine Optimization, visibilidade algorítmica e estratégias para ser citado pelas IAs. Sem spam. Cancele quando quiser.

Compartilhar no LinkedIn Compartilhar no X

Ver todos os artigos →