O Google disse em 15 de maio que llms.txt não é necessário. Mantenho o meu publicado mesmo assim
O Google publicou em 15 de maio de 2026 um guia oficial dizendo, em texto direto, que não é necessário criar arquivo llms.txt, marcações especiais ou reescrita de conteúdo para aparecer em AI Overviews e AI Mode. Concordo. Mantenho o meu publicado mesmo assim.
Esse não é o tipo de frase que ganha curtida no LinkedIn. É também a única honesta.
O guia é o Optimizing your website for generative AI features on Google Search, hospedado na documentação oficial de Search Central. Na seção de mythbusting, está escrito por extenso: nada de llms.txt, nada de schema proprietário, nada de reescrita de conteúdo "para agradar modelos". Quem vendeu llms.txt como requisito para visibilidade em IA do Google em 2025 precisa explicar o pacote.
Eu não vendi. Mantenho o arquivo da Brasil GEO publicado por outro motivo. E vale escrever esse motivo, porque o ruído de mercado vai usar o guia de 15 de maio para sepultar o arquivo inteiro como se fosse só folclore. Não é. Folclore é vender obrigatório. Higiene é manter publicado quando o custo é baixo e o ecossistema fora do Google opera em outro regime.
A tese: o Google encerrou a discussão sobre o Google. Não encerrou a discussão sobre o resto
O guia de 15 de maio fala sobre Google Search. Apenas. Quem leu apressado leu "nenhum sistema de IA usa llms.txt". Quem leu inteiro leu "Google Search não usa, e Google Search é o que esta página documenta". A diferença não é estilística. É de escopo.
O universo de tráfego algorítmico em 2026 inclui pelo menos cinco frentes que se comportam de forma distinta. Google AI Overviews e AI Mode operam por RAG e query fan-out sobre o índice de Search, conforme o próprio guia descreve. Bing Webmaster Tools passou a expor relatórios de citação em Copilot e ChatGPT como métrica nativa, e a Microsoft documenta práticas próprias para conteúdo ser referenciado em resposta de IA. ChatGPT (OpenAI) distingue OAI-SearchBot, GPTBot e o agente de conversa, com diretrizes próprias para cada. Anthropic publica Claude-SearchBot, Claude-User e ClaudeBot, e oferece documentação sobre como permitir cada um. Perplexity opera com sonar e Perplexity-User, e tem política própria de discovery.
Cinco motores, cinco posturas. Reduzir tudo a "o Google disse que não usa, então o arquivo morreu" é confundir a parte com o todo. Esse erro de framing custou caro em 2025, quando o mercado vendeu hack de Google como se fosse hack universal. Agora corre o risco de produzir o erro inverso: descartar uma camada que ainda faz trabalho operacional em ChatGPT, Claude e ferramentas de desenvolvimento como Cursor e Continue, que tratam llms.txt como contrato declarativo da própria página sobre como prefere ser consumida por agentes.
Minha posição é estreita e verificável: mantenho llms.txt como camada de seguro, com custo de manutenção quase zero, sem cobrar como entrega autônoma, sem prometer ganho de citação em Google. Esse é o framing honesto.
Evidência: o que o guia de 15 de maio realmente diz, e o que ele explicitamente não cobre
O documento oficial diz três coisas que importam aqui. Primeira: SEO continua sendo a base de visibilidade em recursos generativos do Google Search. Segunda: AI Overviews e AI Mode usam RAG sobre o índice de busca, com query fan-out para decompor perguntas longas. Terceira, na seção de mythbusting: não é necessário criar llms.txt, schemas especiais ou reescrever conteúdo para ser elegível nas experiências generativas do Search. (Google, AI Optimization Guide, 15 mai 2026).
Curto. Direto. Específico ao Google.
O texto não cobre, e nem tem por que cobrir, o ecossistema de descoberta fora do Google. Não fala de Bing, não fala de OpenAI, não fala de Anthropic, não fala de Perplexity. Por padrão de documentação, escopo é exatamente o que está delimitado. Quem extrapola a leitura está fazendo argumento próprio, não citando o Google.
O complemento empírico está em três fontes públicas. A Ahrefs publicou em maio de 2026 que estima entre 8 e 10% dos sites top 1.000 globais já mantêm llms.txt, com adoção concentrada em verticais de software, consultoria técnica e mídia editorial. (Ahrefs, mai 2026). A KB de curso-factory que mantenho registra que o arquivo aparece em menos de 0,001% das citações capturadas em ChatGPT e Claude em janelas de 12 dias, o que confirma que ele não é alavanca de citação no Google e tampouco no LLM aberto. (Brasil GEO KB, mar a mai 2026). E o web.dev do Chrome publicou em maio de 2026 a recomendação Build agent-friendly websites, que cita llms.txt entre as práticas auxiliares para sites que querem ser navegados de forma previsível por agentes. (web.dev, mai 2026).
Junte os três sinais. O arquivo tem custo de adoção baixo, presença real em entre 8 e 10% do top global, função operacional documentada por web.dev, e zero efeito mensurável em citação direta. É exatamente o perfil de uma camada de higiene. Não é alavanca. Também não é folclore.
O que o estudo da Ahrefs sobre schema publicou no mesmo mês reforça o framing. Em 1.885 páginas que adicionaram JSON-LD entre agosto de 2025 e março de 2026, o efeito de schema sobre citação em AI Mode, ChatGPT e AI Overviews foi estatisticamente indistinguível de zero em três das quatro plataformas, e levemente negativo em AI Overviews. (Ahrefs, 11 mai 2026; ver também meu editorial sobre a Onda 12). Schema isolado não move citação. Llms.txt isolado também não. O que move é a entidade ficar clara e o conteúdo ser bom o suficiente para o sistema de retrieval querer trazer.
Mecanismo: a confusão entre 'Google não usa' e 'nenhum sistema usa'
A confusão semântica que produziu o ciclo de hype de 2025, e que agora produz o ciclo de descarte de 2026, é de natureza simples. Mistura-se "Google AI features não usam llms.txt" com "nenhum sistema de IA usa llms.txt". O primeiro é fato, declarado em texto pelo guia oficial. O segundo é falso, e a refutação está pública.
Vale destrinchar onde o arquivo tem uso real hoje. Em ferramentas de desenvolvimento, llms.txt aparece como contrato declarativo. Cursor, Codex, Continue e a maioria das integrações IDE-LLM leem o arquivo quando o usuário cola um link de página, e o utilizam para resolver o que pode ser raspado, em que ordem e com qual contexto. Não é teoria. É comportamento documentado por essas ferramentas, e qualquer desenvolvedor que use Cursor com link contextual já viu o pedido sair com o conteúdo do llms.txt embutido no system prompt.
Em marketing automation com IA, llms.txt aparece como ponto de partida para ingestão de conteúdo proprietário em RAG privado. Empresas que constroem o próprio assistente interno e o alimentam com o material editorial do site costumam usar o arquivo como índice canônico, especialmente quando o site é grande e o sitemap não distingue páginas operacionais de páginas de conteúdo profundo. Esse caso de uso vai crescer. Está crescendo.
Em custom GPTs e em assistentes Claude Projects, llms.txt é frequentemente colado pelo próprio operador no system prompt como mapa do conteúdo da marca. O arquivo deixa de ser sinal para o motor de busca e passa a ser instrução para o operador. Esse uso é privado, e é exatamente onde o investimento de manter o arquivo se paga sem depender do Google.
Em curators humanos, llms.txt funciona como referência cruzada. Quando um jornalista, pesquisador ou analista de mercado precisa entender rapidamente do que se trata um site e qual a posição editorial declarada, o arquivo serve como cartão de visita executivo. É o motivo pelo qual mantenho o meu com cabeçalho explícito sobre proprietary content, correction policy e editorial board. Para o Google, isso não muda nada. Para um humano que decide se cita ou não, muda tudo.
O ponto operacional é este. O arquivo morreu como alavanca de citação em Google. Continua vivo como camada de governança, sinalização editorial e contrato com ferramentas que não são Google. Quem trata como uma coisa só comete erro de framing. Quem trata como alavanca premium cobra o que não deveria. Quem trata como morto descarta o que ainda funciona.
Decisão pessoal: por que mantenho o meu, em quatro motivos verificáveis
Motivo um. Insurance layer. O guia do Google de 15 de maio de 2026 vale para o estado atual dos recursos generativos do Search. Vale também para o próximo guia? Talvez. Política de plataforma muda. O arquivo está lá, com custo marginal próximo de zero, e me protege de ter que correr na próxima virada de comportamento. Removê-lo agora para republicar daqui a doze meses é desperdício de gestão.
Motivo dois. Sinalização editorial. Meu llms.txt declara, no topo, três coisas: que o conteúdo é proprietário, que mantenho política de correção pública, e que há um conselho editorial responsável. Para o Google isso é irrelevante. Para um operador humano que entra no domínio para decidir se cita ou não, é decisivo. Marcas que se importam com como aparecem em pesquisas humanas e em curadoria humana ganham um cartão de visita objetivo. Custo zero.
Motivo três. Contrato com o ecossistema fora do Google. Bing Webmaster, OpenAI, Anthropic e Perplexity não publicam documento oficial dizendo "ignore llms.txt". Em alguns casos, sinalizam o contrário. ChatGPT em browsing mode lê o arquivo quando o agente decide se aprofunda em uma página. Claude em Claude Projects o consome quando o usuário cola o link. Cursor o injeta no system prompt automaticamente. Manter publicado serve esses motores. Removê-lo não serve ninguém.
Motivo quatro. Referência cruzada para curators humanos. Em fevereiro deste ano, um pesquisador da FGV citou um artigo da Brasil GEO em paper interno porque encontrou o llms.txt do site, leu a posição editorial, e usou aquilo como ponto de partida para localizar o material primário. Esse não é tráfego que aparece em GA4. Aparece em citações acadêmicas e em decks de cliente que mencionam a Brasil GEO sem clicar antes. O arquivo paga esse trabalho.
Quatro motivos. Nenhum deles depende do Google. Nenhum deles depende de promessa de aumento de citação em LLM. Todos derivam de uso operacional concreto, com baixo custo de manutenção, e blindagem contra próxima virada de política.
O que eu não faço, e quero deixar explícito, é cobrar llms.txt como entrega premium em proposta comercial. O null-report que publiquei na SSRN em 6 de maio deixou claro que três das alegações populares do GEO brasileiro não passam pelo crivo estatístico. Cobrar "implementação de llms.txt como alavanca de citação em ChatGPT" é exatamente o tipo de promessa que o paper destrói. Quem comprou esse pacote em 2025 comprou narrativa, não método. A Brasil GEO trata o arquivo como higiene, do mesmo jeito que trata robots.txt e sitemap.xml. Cobra pelo trabalho editorial e de instrumentação. Não pelo arquivo.
Próximo passo: como recomendo decidir hoje, em três cenários
Para quem opera portal editorial grande, com mais de 500 URLs ativas e tráfego dependente parcialmente de descoberta algorítmica, a recomendação é manter llms.txt publicado, atualizado trimestralmente, com cabeçalho explícito sobre política editorial e correction policy. Custo marginal próximo de zero. Benefício composto em sinalização editorial e contrato com ferramentas fora do Google. Não cobre como entrega autônoma. Trate como higiene.
Para quem opera site médio, entre 50 e 500 URLs, com tráfego concentrado em Google e Bing, a decisão é mais marginal. Recomendo publicar uma versão mínima do arquivo, com declaração de proprietary content e link para editorial board, e revisitar em seis meses. Se o tráfego vindo de ChatGPT, Claude ou Perplexity (mensurável via UTM ou referrer) crescer de forma material nesse período, expanda o arquivo. Se não crescer, mantenha como está. Nenhuma decisão de remoção é necessária.
Para quem opera site pequeno, abaixo de 50 URLs, tipicamente landing page de serviço ou portfólio, llms.txt é opcional. Publicar não atrapalha. Não publicar também não. Se o operador tem tempo de redigir um arquivo curto e bem feito, faça. Se não tem, foque em outras prioridades. A diferença material em outcome de descoberta algorítmica nesse perfil é desprezível.
Em todos os três cenários, vale uma regra final. Pare de tratar llms.txt como alavanca. Trate como higiene. Quem vende como alavanca está vendendo o que não é. Quem descarta como folclore está descartando o que ainda funciona. O ponto certo está no meio: arquivo publicado, manutenção barata, ausência de promessa, foco no trabalho editorial real.
O Google escreveu o que era preciso escrever. O ecossistema fora dele opera em outro regime. Manter o llms.txt publicado é a decisão sóbria. Cobrar por isso como diferencial premium é o que precisa parar. Para discutir como aplicar essa calibração no seu portal, o diagnóstico gratuito da Brasil GEO entra na avaliação técnica completa, incluindo política de IA, conselho editorial e política de correção publicadas.