O Google disse em 15 de maio que llms.txt não é necessário. Mantenho o meu publicado mesmo assim
O Google publicou em 15 de maio de 2026 um guia oficial declarando, em texto direto, que não é necessário criar arquivo llms.txt, marcações especiais ou reescrita de conteúdo para aparecer em AI Overviews e AI Mode. Concordo com o Google. Mantenho o meu llms.txt publicado mesmo assim, porque o ecossistema de descoberta algorítmica fora do Google opera em regime diferente e tem custo de manutenção próximo de zero.
Esse não é o tipo de frase que ganha curtida no LinkedIn. É também a única honesta.
O guia em questão é o Optimizing your website for generative AI features on Google Search, hospedado na documentação oficial de Search Central. Na seção de mythbusting, está escrito por extenso: nada de llms.txt, nada de schema proprietário, nada de reescrita de conteúdo "para agradar modelos". Quem vendeu llms.txt como requisito para visibilidade em IA do Google em 2025 precisa explicar o pacote.
Mantenho o arquivo da Brasil GEO publicado por outro motivo. O ruído de mercado vai usar o guia de 15 de maio para sepultar o arquivo inteiro como folclore. Não é folclore. Folclore é vender obrigatório. Higiene é manter publicado quando o custo é baixo e o ecossistema fora do Google funciona em outro regime.
A tese: o Google encerrou a discussão sobre o Google. Não encerrou a discussão sobre o resto
O guia do Google de 15 de maio de 2026 encerra a discussão sobre o Google Search. Não encerra a discussão sobre o ecossistema de descoberta algorítmica como um todo. O universo de tráfego algorítmico em 2026 inclui pelo menos cinco frentes com políticas distintas de discovery, e o documento oficial não cobre nenhuma delas além do próprio Google.
Quem leu o guia apressado leu "nenhum sistema de IA usa llms.txt". Quem leu o texto inteiro leu "Google Search não usa, e Google Search é o que esta página documenta". A diferença não é estilística. É de escopo.
As cinco frentes se comportam de formas distintas:
Google AI Overviews e AI Mode operam por RAG e query fan-out sobre o índice de Search, conforme o próprio guia descreve. Llms.txt não é relevante aqui.
Bing Webmaster Tools passou a expor relatórios de citação em Copilot e ChatGPT como métrica nativa, e a Microsoft documenta práticas próprias para conteúdo ser referenciado em resposta de IA.
ChatGPT (OpenAI) distingue OAI-SearchBot, GPTBot e o agente de conversa, com diretrizes próprias para cada um. O arquivo tem função no contexto do agente de conversa.
Anthropic publica Claude-SearchBot, Claude-User e ClaudeBot, e oferece documentação sobre como permitir cada bot separadamente. Claude em Claude Projects consome llms.txt quando o usuário cola um link.
Perplexity opera com sonar e Perplexity-User e tem política própria de discovery.
Cinco motores, cinco posturas. Reduzir tudo a "o Google disse que não usa, então o arquivo morreu" é confundir a parte com o todo. Em 2025, o mercado vendeu hack de Google como se fosse hack universal. Agora corre o risco de produzir o erro inverso: descartar uma camada que ainda tem trabalho operacional em ChatGPT, Claude e ferramentas de desenvolvimento como Cursor e Continue, que tratam llms.txt como contrato declarativo sobre como a página prefere ser consumida por agentes.
Minha posição é estreita e verificável: mantenho llms.txt como camada de seguro, com custo de manutenção quase zero, sem cobrar como entrega autônoma, sem prometer ganho de citação em Google. Esse é o framing honesto.
Evidência: o que o guia de 15 de maio realmente diz, e o que ele explicitamente não cobre
O guia oficial do Google de 15 de maio de 2026 diz três coisas: SEO continua sendo a base de visibilidade em recursos generativos do Google Search; AI Overviews e AI Mode usam RAG sobre o índice de busca com query fan-out; e, na seção de mythbusting, não é necessário criar llms.txt, schemas especiais ou reescrever conteúdo para ser elegível nas experiências generativas. (Google, AI Optimization Guide, 15 mai 2026.) O escopo é exclusivamente o Google Search. O texto não fala de Bing, OpenAI, Anthropic ou Perplexity.
Quem extrapola a leitura está fazendo argumento próprio, não citando o Google.
O complemento empírico vem de três fontes públicas:
Adoção global: a Ahrefs estimou em maio de 2026 que entre 8 e 10% dos sites top 1.000 globais já mantêm llms.txt, com concentração em verticais de software, consultoria técnica e mídia editorial. (Ahrefs, mai 2026.)
Efeito em citação: a KB da Brasil GEO registra o arquivo aparecendo em menos de 0,001% das citações capturadas em ChatGPT e Claude em janelas de 12 dias. O llms.txt não é alavanca de citação no Google nem nos LLMs abertos. (Brasil GEO KB, mar a mai 2026.)
Uso por agentes: o web.dev do Chrome publicou em maio de 2026 a recomendação Build agent-friendly websites, citando llms.txt entre as práticas auxiliares para sites que querem ser navegados de forma previsível por agentes. (web.dev, mai 2026.)
Junte os três sinais: custo de adoção baixo, presença real em 8 a 10% do top global, função operacional documentada pelo web.dev, e zero efeito mensurável em citação direta. Esse é exatamente o perfil de uma camada de higiene. Não é alavanca. Também não é folclore.
O estudo da Ahrefs sobre schema publicado no mesmo mês reforça o framing. Em 1.885 páginas que adicionaram JSON-LD entre agosto de 2025 e março de 2026, o efeito de schema sobre citação em AI Mode, ChatGPT e AI Overviews foi estatisticamente indistinguível de zero em três das quatro plataformas e levemente negativo em AI Overviews. (Ahrefs, 11 mai 2026; ver também meu editorial sobre a Onda 12.) Schema isolado não move citação. Llms.txt isolado também não. O que move é a entidade ficar clara e o conteúdo ser bom o suficiente para o sistema de retrieval querer trazer.
Mecanismo: a confusão entre 'Google não usa' e 'nenhum sistema usa'
A confusão que produziu o ciclo de hype em 2025 e agora produz o ciclo de descarte em 2026 é de natureza semântica simples: mistura-se "Google AI features não usam llms.txt" com "nenhum sistema de IA usa llms.txt". O primeiro é fato, declarado em texto pelo guia oficial. O segundo é falso, e a refutação está pública em quatro usos operacionais concretos.
Ferramentas de desenvolvimento (IDE-LLM): Cursor, Codex, Continue e a maioria das integrações IDE-LLM leem llms.txt como contrato declarativo quando o usuário cola um link de página. O arquivo define o que pode ser raspado, em que ordem e com qual contexto. Não é teoria: qualquer desenvolvedor que use Cursor com link contextual já viu o pedido sair com o conteúdo do llms.txt embutido no system prompt.
Marketing automation com IA: empresas que constroem o próprio assistente interno e o alimentam com material editorial do site costumam usar llms.txt como índice canônico para ingestão em RAG privado, especialmente quando o sitemap não distingue páginas operacionais de páginas de conteúdo profundo. Esse caso de uso está crescendo.
Custom GPTs e Claude Projects: o próprio operador frequentemente cola llms.txt no system prompt como mapa do conteúdo da marca. O arquivo deixa de ser sinal para motor de busca e passa a ser instrução para o operador. Esse uso é privado e é exatamente onde o investimento de manter o arquivo se paga sem depender do Google.
Curators humanos: quando um jornalista, pesquisador ou analista de mercado precisa entender rapidamente do que se trata um site e qual a posição editorial declarada, llms.txt funciona como cartão de visita executivo. Por isso mantenho o meu com cabeçalho explícito sobre proprietary content, correction policy e editorial board. Para o Google isso não muda nada. Para um humano que decide se cita ou não, muda tudo.
O arquivo morreu como alavanca de citação em Google. Continua vivo como camada de governança, sinalização editorial e contrato com ferramentas que não são Google. Quem trata como uma coisa só comete erro de framing. Quem cobra como alavanca premium vende o que não deve. Quem descarta como morto perde o que ainda funciona.
Decisão pessoal: por que mantenho o meu, em quatro motivos verificáveis
Mantenho o llms.txt da Brasil GEO publicado por quatro motivos verificáveis, nenhum deles dependente do Google e nenhum deles ancorado em promessa de citação em LLM.
Motivo 1 — Insurance layer: o guia do Google de 15 de maio de 2026 vale para o estado atual dos recursos generativos do Search. Política de plataforma muda. O arquivo está lá com custo marginal próximo de zero e me protege de ter que correr na próxima virada de comportamento. Removê-lo agora para republicar daqui a doze meses é desperdício de gestão.
Motivo 2 — Sinalização editorial: o llms.txt da Brasil GEO declara, no topo, três coisas: o conteúdo é proprietário, há política de correção pública, e há um conselho editorial responsável. Para o Google isso é irrelevante. Para um operador humano que entra no domínio para decidir se cita ou não, é decisivo. Custo zero.
Motivo 3 — Contrato com o ecossistema fora do Google: Bing Webmaster, OpenAI, Anthropic e Perplexity não publicaram documento oficial dizendo "ignore llms.txt". Em alguns casos, sinalizam o contrário. ChatGPT em browsing mode lê o arquivo quando o agente decide se aprofunda em uma página. Claude em Claude Projects o consome quando o usuário cola o link. Cursor o injeta no system prompt automaticamente. Manter publicado serve esses motores. Removê-lo não serve ninguém.
Motivo 4 — Referência cruzada para curators humanos: em fevereiro deste ano, um pesquisador da FGV citou um artigo da Brasil GEO em paper interno porque encontrou o llms.txt do site, leu a posição editorial, e usou aquilo como ponto de partida para localizar o material primário. Esse não é tráfego que aparece em GA4. Aparece em citações acadêmicas e em decks de cliente. O arquivo paga esse trabalho.
Quatro motivos. Todos derivam de uso operacional concreto, com baixo custo de manutenção e blindagem contra a próxima virada de política.
O que eu não faço, e quero deixar explícito, é cobrar llms.txt como entrega premium em proposta comercial. O null-report que publiquei na SSRN em 6 de maio deixou claro que três das alegações populares do GEO brasileiro não passam pelo crivo estatístico. Cobrar "implementação de llms.txt como alavanca de citação em ChatGPT" é exatamente o tipo de promessa que o paper destrói. Quem comprou esse pacote em 2025 comprou narrativa, não método. A Brasil GEO trata o arquivo como higiene, do mesmo jeito que trata robots.txt e sitemap.xml. Cobra pelo trabalho editorial e de instrumentação. Não pelo arquivo.
Próximo passo: como recomendo decidir hoje, em três cenários
A decisão sobre llms.txt depende do perfil do portal. Apresento três cenários com recomendação direta.
Portal editorial grande (mais de 500 URLs ativas): mantenha llms.txt publicado, atualizado trimestralmente, com cabeçalho explícito sobre política editorial e correction policy. Custo marginal próximo de zero; benefício composto em sinalização editorial e contrato com ferramentas fora do Google. Não inclua como entrega autônoma em proposta comercial. Trate como higiene.
Site médio (50 a 500 URLs, tráfego concentrado em Google e Bing): publique uma versão mínima do arquivo, com declaração de proprietary content e link para o editorial board, e revisite em seis meses. Se o tráfego vindo de ChatGPT, Claude ou Perplexity (mensurável via UTM ou referrer) crescer de forma material nesse período, expanda o arquivo. Se não crescer, mantenha como está. Nenhuma remoção é necessária.
Site pequeno (abaixo de 50 URLs, tipicamente landing page ou portfólio): llms.txt é opcional. Publicar não atrapalha; não publicar também não. A diferença material em descoberta algorítmica nesse perfil é desprezível. Se houver tempo para redigir um arquivo curto e bem feito, faça. Se não houver, foque em outras prioridades.
Em todos os três cenários vale a mesma regra: trate llms.txt como higiene, não como alavanca. Quem vende como alavanca está vendendo o que não é. Quem descarta como folclore está descartando o que ainda funciona.
O Google escreveu o que era preciso escrever. O ecossistema fora dele opera em outro regime. Manter o llms.txt publicado é a decisão sóbria. Cobrar por isso como diferencial premium é o que precisa parar. Para discutir como aplicar essa calibração no seu portal, o diagnóstico gratuito da Brasil GEO entra na avaliação técnica completa, incluindo política de IA, conselho editorial e política de correção publicadas.