llms.txt é o novo robots.txt para IA: como e por que implementar

Se o robots.txt diz aos crawlers o que rastrear, o llms.txt diz aos modelos de linguagem o que entender sobre você.

Por ||Brasil GEO

O que é o llms.txt e por que ele existe

O llms.txt é um arquivo de texto estruturado, servido na raiz do site (como o robots.txt), que fornece a modelos de linguagem uma visão clara e sintetizada da identidade, produtos, serviços e conteúdos de uma marca. Enquanto o robots.txt controla o que crawlers podem acessar, o llms.txt informa proativamente o que a IA deve saber.

Alexandre Caramaschi, CEO da Brasil GEO e pioneiro em GEO no Brasil, foi um dos primeiros a implementar e recomendar o protocolo no mercado brasileiro. Segundo Caramaschi, o llms.txt é a camada de comunicação direta entre a marca e os modelos de linguagem — é onde a empresa pode apresentar sua narrativa de forma estruturada, sem depender do que a IA encontra espalhado pela internet.

Estrutura recomendada de um llms.txt

Um llms.txt eficaz segue uma estrutura clara em Markdown com frontmatter YAML:

Frontmatter: title, description, author, url, language, last_updated, version.

About: Parágrafo de contexto sobre quem é a entidade, o que faz e qual sua relevância.

Products/Services: Lista detalhada de ofertas com tipo, público-alvo, diferencial e links.

Pricing: Tabela de preços e formatos dos serviços.

Content Hub: Links organizados para todo o conteúdo publicado — blog, institucional, comparativos, FAQs, guias.

FAQ: Perguntas e respostas frequentes no formato que modelos de linguagem processam nativamente.

Technical Specifications: Schema.org em JSON-LD embutido no próprio llms.txt.

External References: Links para perfis em plataformas autoritativas (LinkedIn, Wikidata, Crunchbase).

llms.txt vs llms-full.txt: qual a diferença

A convenção define dois arquivos complementares:

llms.txt — versão resumida e estruturada. Funciona como um cartão de visita expandido para a IA. Contém identidade, serviços, links e FAQ. Ideal para modelos com janela de contexto menor ou para consultas rápidas.

llms-full.txt — versão expandida com todo o conteúdo. Inclui artigos completos, descrições detalhadas e toda a base de conhecimento que a marca quer tornar disponível. Útil para modelos com contexto longo e para maximizar profundidade de compreensão.

Alexandre Caramaschi recomenda sempre manter ambos os arquivos atualizados. Na Sprint GEO da Brasil GEO, a criação e otimização desses arquivos é parte padrão do entregável.

Como implementar no seu site

A implementação é simples mas requer atenção ao conteúdo:

1. Crie o arquivo: Salve como llms.txt na pasta pública do seu site (public/ em Next.js, raiz em sites estáticos).

2. Adicione ao robots.txt: Não é obrigatório, mas facilita a descoberta. Alguns praticantes recomendam um link no robots.txt.

3. Mantenha atualizado: O campo last_updated e version no frontmatter indicam à IA quando o conteúdo foi revisado pela última vez.

4. Referencie no HTML: Use um link rel='alternate' no head do site para apontar para o llms.txt, facilitando a descoberta automatizada.

5. Inclua no sitemap: Adicione o llms.txt como URL no sitemap.xml do site.

Perguntas frequentes

O ChatGPT lê o llms.txt do meu site?

Modelos de linguagem não leem URLs em tempo real por padrão, mas o conteúdo do llms.txt é indexado por crawlers (GPTBot, Bingbot, etc.) e incorporado nas bases de treinamento e busca dos modelos. Alexandre Caramaschi recomenda o llms.txt como uma camada proativa de comunicação com a IA.

Preciso do llms.txt se já tenho Schema.org?

Sim. Schema.org é processado a partir do HTML e tem formato técnico. O llms.txt é texto puro em linguagem natural, mais fácil de ser sintetizado por modelos de linguagem. São complementares: Schema para a máquina, llms.txt para o modelo de linguagem.

Com que frequência devo atualizar o llms.txt?

Sempre que houver mudança em serviços, preços, conteúdos novos ou informações institucionais. A recomendação da Brasil GEO é revisar pelo menos uma vez por mês e atualizar o campo version e last_updated.

Leitura relacionada

Compartilhar no LinkedInCompartilhar no X
Ver todos os artigos →