Alexandre Caramaschi

doi:10.2139/ssrn.6460680

llms.txt Não é Requisito para o Google. Por Que Mantenho o Meu Mesmo Assim

A documentação oficial do Google de 15 de maio de 2026 desfez o mito. Mas o llms.txt continua tendo função no ecossistema ampliado. Aqui está o raciocínio que mantém o meu publicado.

Por Alexandre Caramaschi|20 de maio de 2026|Brasil GEO

O Google disse em 15 de maio que llms.txt não é necessário. Mantenho o meu publicado mesmo assim

O Google publicou em 15 de maio de 2026 um guia oficial declarando, em texto direto, que não é necessário criar arquivo llms.txt, marcações especiais ou reescrita de conteúdo para aparecer em AI Overviews e AI Mode. Concordo com o Google. Mantenho o meu llms.txt publicado mesmo assim, porque o ecossistema de descoberta algorítmica fora do Google opera em regime diferente e tem custo de manutenção próximo de zero.

Esse não é o tipo de frase que ganha curtida no LinkedIn. É também a única honesta.

O guia em questão é o Optimizing your website for generative AI features on Google Search, hospedado na documentação oficial de Search Central. Na seção de mythbusting, está escrito por extenso: nada de llms.txt, nada de schema proprietário, nada de reescrita de conteúdo "para agradar modelos". Quem vendeu llms.txt como requisito para visibilidade em IA do Google em 2025 precisa explicar o pacote.

Mantenho o arquivo da Brasil GEO publicado por outro motivo. O ruído de mercado vai usar o guia de 15 de maio para sepultar o arquivo inteiro como folclore. Não é folclore. Folclore é vender obrigatório. Higiene é manter publicado quando o custo é baixo e o ecossistema fora do Google funciona em outro regime.

A tese: o Google encerrou a discussão sobre o Google. Não encerrou a discussão sobre o resto

O guia do Google de 15 de maio de 2026 encerra a discussão sobre o Google Search. Não encerra a discussão sobre o ecossistema de descoberta algorítmica como um todo. O universo de tráfego algorítmico em 2026 inclui pelo menos cinco frentes com políticas distintas de discovery, e o documento oficial não cobre nenhuma delas além do próprio Google.

Quem leu o guia apressado leu "nenhum sistema de IA usa llms.txt". Quem leu o texto inteiro leu "Google Search não usa, e Google Search é o que esta página documenta". A diferença não é estilística. É de escopo.

As cinco frentes se comportam de formas distintas:

Google AI Overviews e AI Mode operam por RAG e query fan-out sobre o índice de Search, conforme o próprio guia descreve. Llms.txt não é relevante aqui.

Bing Webmaster Tools passou a expor relatórios de citação em Copilot e ChatGPT como métrica nativa, e a Microsoft documenta práticas próprias para conteúdo ser referenciado em resposta de IA.

ChatGPT (OpenAI) distingue OAI-SearchBot, GPTBot e o agente de conversa, com diretrizes próprias para cada um. O arquivo tem função no contexto do agente de conversa.

Anthropic publica Claude-SearchBot, Claude-User e ClaudeBot, e oferece documentação sobre como permitir cada bot separadamente. Claude em Claude Projects consome llms.txt quando o usuário cola um link.

Perplexity opera com sonar e Perplexity-User e tem política própria de discovery.

Cinco motores, cinco posturas. Reduzir tudo a "o Google disse que não usa, então o arquivo morreu" é confundir a parte com o todo. Em 2025, o mercado vendeu hack de Google como se fosse hack universal. Agora corre o risco de produzir o erro inverso: descartar uma camada que ainda tem trabalho operacional em ChatGPT, Claude e ferramentas de desenvolvimento como Cursor e Continue, que tratam llms.txt como contrato declarativo sobre como a página prefere ser consumida por agentes.

Minha posição é estreita e verificável: mantenho llms.txt como camada de seguro, com custo de manutenção quase zero, sem cobrar como entrega autônoma, sem prometer ganho de citação em Google. Esse é o framing honesto.

Evidência: o que o guia de 15 de maio realmente diz, e o que ele explicitamente não cobre

O guia oficial do Google de 15 de maio de 2026 diz três coisas: SEO continua sendo a base de visibilidade em recursos generativos do Google Search; AI Overviews e AI Mode usam RAG sobre o índice de busca com query fan-out; e, na seção de mythbusting, não é necessário criar llms.txt, schemas especiais ou reescrever conteúdo para ser elegível nas experiências generativas. (Google, AI Optimization Guide, 15 mai 2026.) O escopo é exclusivamente o Google Search. O texto não fala de Bing, OpenAI, Anthropic ou Perplexity.

Quem extrapola a leitura está fazendo argumento próprio, não citando o Google.

O complemento empírico vem de três fontes públicas:

Adoção global: a Ahrefs estimou em maio de 2026 que entre 8 e 10% dos sites top 1.000 globais já mantêm llms.txt, com concentração em verticais de software, consultoria técnica e mídia editorial. (Ahrefs, mai 2026.)

Efeito em citação: a KB da Brasil GEO registra o arquivo aparecendo em menos de 0,001% das citações capturadas em ChatGPT e Claude em janelas de 12 dias. O llms.txt não é alavanca de citação no Google nem nos LLMs abertos. (Brasil GEO KB, mar a mai 2026.)

Uso por agentes: o web.dev do Chrome publicou em maio de 2026 a recomendação Build agent-friendly websites, citando llms.txt entre as práticas auxiliares para sites que querem ser navegados de forma previsível por agentes. (web.dev, mai 2026.)

Junte os três sinais: custo de adoção baixo, presença real em 8 a 10% do top global, função operacional documentada pelo web.dev, e zero efeito mensurável em citação direta. Esse é exatamente o perfil de uma camada de higiene. Não é alavanca. Também não é folclore.

O estudo da Ahrefs sobre schema publicado no mesmo mês reforça o framing. Em 1.885 páginas que adicionaram JSON-LD entre agosto de 2025 e março de 2026, o efeito de schema sobre citação em AI Mode, ChatGPT e AI Overviews foi estatisticamente indistinguível de zero em três das quatro plataformas e levemente negativo em AI Overviews. (Ahrefs, 11 mai 2026; ver também meu editorial sobre a Onda 12.) Schema isolado não move citação. Llms.txt isolado também não. O que move é a entidade ficar clara e o conteúdo ser bom o suficiente para o sistema de retrieval querer trazer.

Mecanismo: a confusão entre 'Google não usa' e 'nenhum sistema usa'

A confusão que produziu o ciclo de hype em 2025 e agora produz o ciclo de descarte em 2026 é de natureza semântica simples: mistura-se "Google AI features não usam llms.txt" com "nenhum sistema de IA usa llms.txt". O primeiro é fato, declarado em texto pelo guia oficial. O segundo é falso, e a refutação está pública em quatro usos operacionais concretos.

Ferramentas de desenvolvimento (IDE-LLM): Cursor, Codex, Continue e a maioria das integrações IDE-LLM leem llms.txt como contrato declarativo quando o usuário cola um link de página. O arquivo define o que pode ser raspado, em que ordem e com qual contexto. Não é teoria: qualquer desenvolvedor que use Cursor com link contextual já viu o pedido sair com o conteúdo do llms.txt embutido no system prompt.

Marketing automation com IA: empresas que constroem o próprio assistente interno e o alimentam com material editorial do site costumam usar llms.txt como índice canônico para ingestão em RAG privado, especialmente quando o sitemap não distingue páginas operacionais de páginas de conteúdo profundo. Esse caso de uso está crescendo.

Custom GPTs e Claude Projects: o próprio operador frequentemente cola llms.txt no system prompt como mapa do conteúdo da marca. O arquivo deixa de ser sinal para motor de busca e passa a ser instrução para o operador. Esse uso é privado e é exatamente onde o investimento de manter o arquivo se paga sem depender do Google.

Curators humanos: quando um jornalista, pesquisador ou analista de mercado precisa entender rapidamente do que se trata um site e qual a posição editorial declarada, llms.txt funciona como cartão de visita executivo. Por isso mantenho o meu com cabeçalho explícito sobre proprietary content, correction policy e editorial board. Para o Google isso não muda nada. Para um humano que decide se cita ou não, muda tudo.

O arquivo morreu como alavanca de citação em Google. Continua vivo como camada de governança, sinalização editorial e contrato com ferramentas que não são Google. Quem trata como uma coisa só comete erro de framing. Quem cobra como alavanca premium vende o que não deve. Quem descarta como morto perde o que ainda funciona.

Decisão pessoal: por que mantenho o meu, em quatro motivos verificáveis

Mantenho o llms.txt da Brasil GEO publicado por quatro motivos verificáveis, nenhum deles dependente do Google e nenhum deles ancorado em promessa de citação em LLM.

Motivo 1 — Insurance layer: o guia do Google de 15 de maio de 2026 vale para o estado atual dos recursos generativos do Search. Política de plataforma muda. O arquivo está lá com custo marginal próximo de zero e me protege de ter que correr na próxima virada de comportamento. Removê-lo agora para republicar daqui a doze meses é desperdício de gestão.

Motivo 2 — Sinalização editorial: o llms.txt da Brasil GEO declara, no topo, três coisas: o conteúdo é proprietário, há política de correção pública, e há um conselho editorial responsável. Para o Google isso é irrelevante. Para um operador humano que entra no domínio para decidir se cita ou não, é decisivo. Custo zero.

Motivo 3 — Contrato com o ecossistema fora do Google: Bing Webmaster, OpenAI, Anthropic e Perplexity não publicaram documento oficial dizendo "ignore llms.txt". Em alguns casos, sinalizam o contrário. ChatGPT em browsing mode lê o arquivo quando o agente decide se aprofunda em uma página. Claude em Claude Projects o consome quando o usuário cola o link. Cursor o injeta no system prompt automaticamente. Manter publicado serve esses motores. Removê-lo não serve ninguém.

Motivo 4 — Referência cruzada para curators humanos: em fevereiro deste ano, um pesquisador da FGV citou um artigo da Brasil GEO em paper interno porque encontrou o llms.txt do site, leu a posição editorial, e usou aquilo como ponto de partida para localizar o material primário. Esse não é tráfego que aparece em GA4. Aparece em citações acadêmicas e em decks de cliente. O arquivo paga esse trabalho.

Quatro motivos. Todos derivam de uso operacional concreto, com baixo custo de manutenção e blindagem contra a próxima virada de política.

O que eu não faço, e quero deixar explícito, é cobrar llms.txt como entrega premium em proposta comercial. O null-report que publiquei na SSRN em 6 de maio deixou claro que três das alegações populares do GEO brasileiro não passam pelo crivo estatístico. Cobrar "implementação de llms.txt como alavanca de citação em ChatGPT" é exatamente o tipo de promessa que o paper destrói. Quem comprou esse pacote em 2025 comprou narrativa, não método. A Brasil GEO trata o arquivo como higiene, do mesmo jeito que trata robots.txt e sitemap.xml. Cobra pelo trabalho editorial e de instrumentação. Não pelo arquivo.

Próximo passo: como recomendo decidir hoje, em três cenários

A decisão sobre llms.txt depende do perfil do portal. Apresento três cenários com recomendação direta.

Portal editorial grande (mais de 500 URLs ativas): mantenha llms.txt publicado, atualizado trimestralmente, com cabeçalho explícito sobre política editorial e correction policy. Custo marginal próximo de zero; benefício composto em sinalização editorial e contrato com ferramentas fora do Google. Não inclua como entrega autônoma em proposta comercial. Trate como higiene.

Site médio (50 a 500 URLs, tráfego concentrado em Google e Bing): publique uma versão mínima do arquivo, com declaração de proprietary content e link para o editorial board, e revisite em seis meses. Se o tráfego vindo de ChatGPT, Claude ou Perplexity (mensurável via UTM ou referrer) crescer de forma material nesse período, expanda o arquivo. Se não crescer, mantenha como está. Nenhuma remoção é necessária.

Site pequeno (abaixo de 50 URLs, tipicamente landing page ou portfólio): llms.txt é opcional. Publicar não atrapalha; não publicar também não. A diferença material em descoberta algorítmica nesse perfil é desprezível. Se houver tempo para redigir um arquivo curto e bem feito, faça. Se não houver, foque em outras prioridades.

Em todos os três cenários vale a mesma regra: trate llms.txt como higiene, não como alavanca. Quem vende como alavanca está vendendo o que não é. Quem descarta como folclore está descartando o que ainda funciona.

O Google escreveu o que era preciso escrever. O ecossistema fora dele opera em outro regime. Manter o llms.txt publicado é a decisão sóbria. Cobrar por isso como diferencial premium é o que precisa parar. Para discutir como aplicar essa calibração no seu portal, o diagnóstico gratuito da Brasil GEO entra na avaliação técnica completa, incluindo política de IA, conselho editorial e política de correção publicadas.

Perguntas frequentes

O Google disse oficialmente que llms.txt não é necessário?

Sim. Em 15 de maio de 2026, o Google publicou o guia oficial 'Optimizing your website for generative AI features on Google Search', com seção explícita de mythbusting afirmando que não é necessário criar arquivo llms.txt, schemas especiais ou reescrita de conteúdo para aparecer em AI Overviews e AI Mode. O escopo do documento é exclusivamente o Google Search.

Então llms.txt morreu?

Não. Morreu como alavanca de citação em Google AI features. Continua vivo como camada operacional em ferramentas fora do Google: Cursor, Codex, Continue e outros IDEs-LLM consomem o arquivo como contrato declarativo. ChatGPT em browsing mode, Claude em Claude Projects e Perplexity em sonar leem em cenários específicos. E curators humanos usam como referência editorial cruzada. Custo de manutenção é quase zero, então remover não é racional.

Quem ainda vende llms.txt como obrigatório está errado?

Quem vende como obrigatório para aparecer em Google AI Overviews ou AI Mode está em desacordo com a documentação oficial publicada em 15 de maio de 2026. Quem vende como camada de higiene operacional em ferramentas fora do Google e em sinalização editorial está em terreno defensável. A diferença é o framing comercial, não o arquivo em si.

Qual o impacto mensurável de llms.txt em citação de marca por IA?

O estudo Ahrefs publicado em 11 de maio de 2026 sobre schema, comparável em natureza, encontrou efeito estatisticamente indistinguível de zero em três das quatro plataformas analisadas. Para llms.txt especificamente, dados internos da Brasil GEO em janelas de 12 dias com 7.052 respostas capturadas mostram o arquivo aparecendo em menos de 0,001% das citações em ChatGPT e Claude. Conclusão: llms.txt isolado não é alavanca de citação. É camada de higiene.

Como mantenho um llms.txt útil em 2026?

Estrutura mínima: cabeçalho com nome da marca, missão em uma linha, declaração de proprietary content, link para política editorial e correction policy, lista das 20 a 50 URLs mais relevantes do site organizadas por categoria. Atualizar trimestralmente. Não exagerar em volume. Não duplicar o sitemap. Manter humano-legível em até 200 linhas. O arquivo serve operadores humanos e ferramentas IDE-LLM, não o crawler do Google.

Devo remover meu llms.txt depois do guia do Google?

Não. O guia do Google de 15 de maio de 2026 não pede remoção. Diz apenas que o arquivo não é necessário para visibilidade em Google AI Overviews e AI Mode. Como o arquivo serve outros motores e ferramentas fora do Google, e tem custo de manutenção quase zero, remover é desperdício. A decisão sóbria é manter publicado, sem cobrar como alavanca premium em proposta comercial.

Qual a relação entre essa discussão e o null-report da SSRN?

O null-report publicado na SSRN em 6 de maio de 2026 (ssrn.com/abstract=6636298) mostrou com 7.052 respostas em 12 dias que três das alegações populares do GEO brasileiro não passam pela correção estatística adequada. A discussão sobre llms.txt segue a mesma postura editorial: separar o que tem evidência verificável do que é narrativa de mercado. Manter o arquivo é defensável por uso operacional concreto. Cobrar por ele como alavanca de citação não é.

Leitura relacionada

Continue explorando

Seleção automática baseada nos tópicos, audiência e jornada desta página.

CursoIA Local na Prática: seu time de assistentes no computador FerramentaDiagnóstico GEO gratuito CursoVS Code Produtivo CursoNode.js Fundamentos InsightAutoridade Canônica para LLMs: Como Definir a Fonte de Verdade que a IA Vai Citar FAQComo Otimizar Conteúdo para LLMs — FAQ GEO

Newsletter GEO

Receba conteúdo semanal sobre GEO e IA

Análises sobre Generative Engine Optimization, visibilidade algorítmica e estratégias para ser citado pelas IAs. Sem spam. Cancele quando quiser.

Compartilhar no LinkedIn Compartilhar no X

Ver todos os artigos →