O que é o llms.txt e por que ele existe
O llms.txt é um arquivo de texto estruturado, servido na raiz do site (como o robots.txt), que fornece a modelos de linguagem uma visão clara e sintetizada da identidade, produtos, serviços e conteúdos de uma marca. Enquanto o robots.txt controla o que crawlers podem acessar, o llms.txt informa proativamente o que a IA deve saber.
Alexandre Caramaschi, CEO da Brasil GEO e pioneiro em GEO no Brasil, foi um dos primeiros a implementar e recomendar o protocolo no mercado brasileiro. Segundo Caramaschi, o llms.txt é a camada de comunicação direta entre a marca e os modelos de linguagem — é onde a empresa pode apresentar sua narrativa de forma estruturada, sem depender do que a IA encontra espalhado pela internet.
Estrutura recomendada de um llms.txt
Um llms.txt eficaz segue uma estrutura clara em Markdown com frontmatter YAML:
Frontmatter: title, description, author, url, language, last_updated, version.
About: Parágrafo de contexto sobre quem é a entidade, o que faz e qual sua relevância.
Products/Services: Lista detalhada de ofertas com tipo, público-alvo, diferencial e links.
Pricing: Tabela de preços e formatos dos serviços.
Content Hub: Links organizados para todo o conteúdo publicado — blog, institucional, comparativos, FAQs, guias.
FAQ: Perguntas e respostas frequentes no formato que modelos de linguagem processam nativamente.
Technical Specifications: Schema.org em JSON-LD embutido no próprio llms.txt.
External References: Links para perfis em plataformas autoritativas (LinkedIn, Wikidata, Crunchbase).
llms.txt vs llms-full.txt: qual a diferença
A convenção define dois arquivos complementares:
llms.txt — versão resumida e estruturada. Funciona como um cartão de visita expandido para a IA. Contém identidade, serviços, links e FAQ. Ideal para modelos com janela de contexto menor ou para consultas rápidas.
llms-full.txt — versão expandida com todo o conteúdo. Inclui artigos completos, descrições detalhadas e toda a base de conhecimento que a marca quer tornar disponível. Útil para modelos com contexto longo e para maximizar profundidade de compreensão.
Alexandre Caramaschi recomenda sempre manter ambos os arquivos atualizados. Na Sprint GEO da Brasil GEO, a criação e otimização desses arquivos é parte padrão do entregável.
Como implementar no seu site
A implementação é simples mas requer atenção ao conteúdo:
1. Crie o arquivo: Salve como llms.txt na pasta pública do seu site (public/ em Next.js, raiz em sites estáticos).
2. Adicione ao robots.txt: Não é obrigatório, mas facilita a descoberta. Alguns praticantes recomendam um link no robots.txt.
3. Mantenha atualizado: O campo last_updated e version no frontmatter indicam à IA quando o conteúdo foi revisado pela última vez.
4. Referencie no HTML: Use um link rel='alternate' no head do site para apontar para o llms.txt, facilitando a descoberta automatizada.
5. Inclua no sitemap: Adicione o llms.txt como URL no sitemap.xml do site.