Um gist de 1.200 palavras reabriu uma fronteira de 1945
Em novembro de 2024, Andrej Karpathy publicou no GitHub um gist de pouco mais de 1.200 palavras sem uma linha de código. Apenas a descrição de um padrão de organização de conhecimento que ele batizou de LLM Wiki. Em seis meses, esse texto curto gerou ao menos quarenta implementações públicas catalogadas nos comentários do próprio gist. Entre elas, ΩmegaWiki, Synthadoc, Link, Synto e sqz. Engenheiros sêniores adotaram o padrão. Times de pesquisa o discutem em listas internas.
O motivo do interesse não é técnico. É arquitetônico.
Karpathy nomeou um problema que todo executivo conhece e nenhum havia conseguido resolver. A wiki corporativa morre. O RAG esquece. As duas dores convivem dentro da mesma empresa, alimentadas pelo mesmo conteúdo, e ninguém une os pedaços. O McKinsey Global Institute, no estudo The Social Economy publicado em julho de 2012, calculou que profissionais do conhecimento gastam aproximadamente 19% do tempo de trabalho semanal apenas procurando e juntando informação. Quase um dia por semana evaporando em arqueologia interna. Em 2026, com cada conversa de equipe rodando em LLM, o número não caiu. Mudou de lugar.
A tese de Karpathy resolve as duas dores ao mesmo tempo. Não com uma ferramenta. Com um padrão de três camadas e três operações que reorganiza o trabalho intelectual em torno de uma máquina paciente.
É sobre isso que este artigo trata. E sobre por que Vannevar Bush, em 1945, já tinha descrito o requisito.
RAG é amnésico. Wiki humana evapora. A terceira opção sempre faltou
O Retrieval-Augmented Generation virou padrão de produção em 2023 e 2024. Patrick Lewis e colegas publicaram a formulação original em NeurIPS 2020 (arXiv:2005.11401). O mecanismo funciona. Recupera trechos relevantes de uma base vetorial, injeta no contexto do modelo, melhora a resposta. Bilhões de chamadas por dia rodam em cima dessa receita.
O problema do RAG não é a recuperação. É a memória.
RAG não acumula. Cada query é amnésica. Você pergunta a mesma coisa três vezes, o sistema repete o mesmo trabalho de busca e síntese três vezes. A boa resposta que ele construiu na primeira tentativa não fica em lugar nenhum. Some no log. O próximo usuário começa do zero. Para um corpus técnico denso, com duzentas fontes que se cruzam, isso significa que a empresa paga inferência infinita para reconstruir o mesmo conhecimento.
A wiki humana tem o problema simétrico. Acumula bem na largada, evapora no médio prazo. O custo de manutenção é o ponto que sempre matou wikis corporativas. Alguém precisa abrir a página, ler, conferir se ainda é verdade, reescrever, aprovar. Esse alguém tem outras prioridades. A wiki vira camada arqueológica em menos de um ano em quase toda empresa que cruza mil colaboradores.
O custo que matou a wiki humana vai a zero quando o bibliotecário é uma máquina paciente. Esse é o ponto que Karpathy identificou e que ninguém havia formulado tão limpo.
A LLM Wiki é a síntese das duas. Acumula como wiki. Recupera como RAG. Lê e reescreve como agente. A diferença é que a manutenção, que sempre foi o gargalo, deixa de ser tarefa humana. Vira tarefa de um modelo de linguagem rodando operações disciplinadas sobre arquivos versionados em Git.
Quem leu o gist com atenção percebeu o segundo nível da tese. Karpathy não está propondo uma ferramenta. Está propondo um padrão de pasta. Três camadas de arquivos. Três operações canônicas. Dois arquivos especiais com função estrutural. O resto é commodity.
Vannevar Bush escreveu o requisito em 1945. Faltava o bibliotecário
Em julho de 1945, três meses antes de Hiroshima, Vannevar Bush publicou na revista The Atlantic o ensaio As We May Think. Bush era o diretor do Office of Scientific Research and Development do governo americano, o homem que coordenou o esforço científico aliado na Segunda Guerra. O ensaio descrevia uma máquina hipotética que ele chamou de Memex.
O Memex era um móvel. Uma escrivaninha com microfilme onde o pesquisador armazenaria livros, artigos, anotações e correspondência. A inovação não era o armazenamento. Era o que Bush chamou de associative trails, trilhas associativas. O usuário poderia ligar dois itens quaisquer com uma referência permanente. E ligar uma trilha a outra. E compartilhar trilhas com colegas. Toda a estrutura do hipertexto, da Wikipédia, do Roam Research e do Obsidian estava ali, descrita em prosa, antes do primeiro computador eletrônico comercial existir.
Bush escreveu uma frase que ficou. "O instrumento, se desenvolvido adequadamente, dará ao seu usuário acesso e comando sobre a memória herdada da raça humana." A ambição era clara. A obstrução também.
O Memex de Bush nunca virou produto. A razão técnica óbvia é que microfilme não chegou perto. A razão profunda, que Bush percebeu e registrou no próprio ensaio, é que alguém precisava manter as trilhas. Alguém precisava ler o documento novo, decidir onde ele se conecta com o que já existe, criar o link, atualizar a entrada anterior. Bush imaginou que o pesquisador faria isso por si mesmo. Não fez. Ninguém faz. O custo de curadoria sempre comeu a promessa.
Um modelo de linguagem grande, em 2024, é a primeira entidade barata o suficiente para topar ser o bibliotecário. Não porque é mais inteligente que o pesquisador. Porque é paciente. Não cansa, não esquece de atualizar, não tem outra prioridade na semana que vem.
Vannevar Bush escreveu o requisito em 1945. Faltava encontrar quem topasse ser o bibliotecário. Oitenta anos depois, a vaga foi preenchida.
Três camadas, três operações, dois arquivos especiais
A arquitetura proposta por Karpathy é deliberadamente espartana. Cabe em uma pasta de Git. O leitor experiente reconhece imediatamente que a simplicidade é o ponto.
A camada inferior é raw/. Documentos brutos, imutáveis, com metadados de proveniência. PDFs, transcrições, e-mails, capturas de página. Nada é editado depois de entrar. Quem alimenta a camada raw assina e data.
A camada intermediária é o wiki sintético. Arquivos Markdown reescritos por um modelo de linguagem a partir das fontes raw. Cada página tem links de saída para outras páginas e referências para os documentos raw que a originaram. É aqui que mora a densidade citável. É daqui que o leitor humano vai ler.
A camada superior é o schema, materializado em um arquivo CLAUDE.md ou equivalente. O schema descreve como o sistema deve operar sobre as outras duas camadas. Define o que é uma boa entrada na wiki, como decidir se um documento raw merece virar página, quando atualizar versus criar nova entrada, o tom de voz do wiki sintético.
Sobre essas três camadas rodam três operações.
Ingest recebe um documento novo, decide se ele entra no raw, e se entra, qual página do wiki sintético precisa ser criada ou atualizada. Query responde uma pergunta lendo prioritariamente o wiki sintético e descendo para o raw quando o wiki não basta. Lint roda periodicamente verificando consistência, links quebrados, contradições entre páginas, datas estale.
Dois arquivos especiais carregam o peso estrutural. index.md é content-oriented, não meramente um sumário. Reescrito a cada ingest relevante, ele descreve o estado atual do conhecimento, com links para os pontos vivos. log.md é append-only, cronológico, registra cada ingest e cada decisão de lint. Auditoria pura.
A diferença entre essa arquitetura, RAG clássico e wiki humana fica clara em uma tabela.
| Dimensão | RAG clássico | Wiki humana | LLM Wiki |
|---|---|---|---|
| Custo de manutenção | Zero, mas reprocessa tudo a cada query | Alto e humano, vira gargalo organizacional | Baixo, modelo faz lint e ingest contínuos |
| Acumulação de aprendizado | Nenhuma, cada query é amnésica | Alta no curto prazo, decai sem curadoria | Alta e persistente, toda boa resposta vira página |
| Frescor do conteúdo | Depende da última reindexação | Depende de revisão humana | Continuamente reescrito por ingest e lint |
| Consistência interna | Inexistente, recupera trechos isolados | Depende de editor responsável | Lint detecta contradição entre páginas |
| Governança e proveniência | Fraca, citação por chunk | Forte se houver disciplina de PR | Forte por design, raw imutável e log append-only |
| Escala | Excelente, vetores são baratos | Quebra acima de algumas centenas de páginas | Escala com modelo, limitada por contexto |
| Densidade citável por LLM | Baixa, trechos fragmentados | Variável, depende do editor | Alta, página é otimizada para recuperação |
A coluna da direita não é uma versão melhor das duas anteriores. É uma categoria diferente. Quem trata como concorrente do RAG ou substituto da wiki vai entender errado e implementar errado. GraphRAG, publicado pela Microsoft em 2024 (arXiv:2404.16130), e MemGPT de Packer et al. 2023 (arXiv:2310.08560), são complementares, não substitutos. Cada um resolve um pedaço do problema. A LLM Wiki organiza o pedaço da síntese persistente.
Toda boa resposta deveria virar página
O ponto não óbvio do padrão é a relação entre query e wiki. Em RAG clássico, query é consumo. Lê o índice, sintetiza, devolve. Acabou. Em LLM Wiki, query é produção. Toda resposta que valeu a pena gerar deveria virar uma página nova ou um patch em página existente.
Essa inversão é o que muda o regime do sistema.
RAG não acumula. Wiki humana evapora. A LLM Wiki é a única arquitetura em que o ato de perguntar deixa a base mais inteligente.
Existe evidência empírica relevante de que esse padrão funciona em uma dimensão adjacente que importa para qualquer empresa que vende em mercados onde LLM já intermedia decisão de compra. Pranjal Aggarwal e colegas de Princeton publicaram em KDD 2024 (arXiv:2311.09735) o primeiro estudo controlado sobre o que aumenta a probabilidade de uma página ser citada por um modelo generativo. As táticas mais eficazes foram densificação canônica. Citação de fontes autoritativas elevou visibilidade em 115%. Inclusão de estatísticas elevou em 41%. Citações diretas atribuídas elevaram em 28%. Os números estão na Tabela 3 do paper.
Quem leu o estudo percebe que essas táticas não descrevem técnicas de copy. Descrevem páginas de wiki bem mantidas. Página com fonte explícita, número datado e quote atribuída é exatamente o que sai de uma operação de wiki sintético rodando sobre raw bem curado.
O projeto AutoGEO de Wu, Zhong, Kim e Xiong na CMU, com código aberto público, automatizou o playbook de Princeton e reportou lift agregado de 50,99% em visibilidade em LLMs comerciais. A literatura está convergindo. O conteúdo que LLM gosta de citar é o conteúdo que LLM Wiki produz por padrão.
A consequência operacional é direta. Uma empresa que constrói sua base de conhecimento interno como LLM Wiki está, por design, construindo o melhor substrato de visibilidade em LLMs externos. A wiki canônica é dupla infraestrutura. Serve o time por dentro e serve o algoritmo por fora. Quem entendeu isso para de discutir SEO versus GEO e começa a discutir governança de conhecimento.
Onde isso vira decisão de gestor em 2026
O padrão é genérico. Os casos onde a alavanca é maior já estão claros.
Time de marketing B2B que reconstrói briefing a cada campanha. Toda quinta-feira, alguém abre um Google Doc em branco e refaz o trabalho de definir ICP, dor, mensagem, prova social. Substitua por LLM Wiki. index.md descreve o ICP canônico, com link para a página de cada segmento e o raw das entrevistas de cliente que sustentam a definição. A query de quinta-feira lê o wiki, devolve o briefing pronto, arquiva como anexo da campanha. Próxima campanha começa do conhecimento acumulado, não da memória do redator de plantão.
Conselho consultivo recebendo deck novo a cada reunião. Substitua por memo Decision Day com log.md cronológico. Cada conselheiro chega na próxima sessão tendo lido o que mudou desde a última, com a auditoria de cada decisão registrada em append-only. O CEO para de explicar o passado e começa a debater o futuro. O ciclo de reunião encurta.
Due diligence de empresa investida ou alvo. Hoje, a pasta da operação é um cemitério de PDFs com nomes longos e seis versões. Substitua por raw imutável com proveniência, wiki sintético cross-linkado, lint quinzenal detectando contradição entre laudo financeiro e narrativa do CEO. O time de M&A para de procurar informação e começa a interpretar inconsistência.
Wiki canônica como infraestrutura de visibilidade em LLM. Para quem opera marca em mercado onde modelo generativo intermedia descoberta, a base interna bem mantida é o ativo que vira citação externa. Métricas como citation rate e mention rate, hoje rastreadas por ferramentas como Profound (a empresa divulgou em maio de 2026 ter monitorado vinte e sete milhões de citações em LLM, com apenas 4,3% delas captadas por marcas que tratam o conteúdo como ativo proprietário), correlacionam diretamente com a densidade da base de origem.
A LLM Wiki é a primeira arquitetura de conhecimento em que a operação interna e o posicionamento externo se alimentam do mesmo ativo. Quem tratar como dois projetos vai pagar duas vezes pelo mesmo trabalho.
Segunda-feira de manhã, três passos
O padrão é grande, a entrada é pequena. Quem quiser começar na segunda-feira tem três passos concretos que cabem em uma semana de trabalho focado.
Primeiro, crie um index.md content-oriented no repositório de conhecimento da sua operação. Não um sumário. Uma página que descreve, em prosa densa, o estado atual do que importa, com links para os pontos vivos. Reescreva esse arquivo toda vez que algo material mudar.
Segundo, crie um log.md append-only e force-se a registrar cada ingest pelos próximos trinta dias. Documento novo, decisão tomada, conversa relevante. Append, com data e autor. A disciplina de trinta dias é o que constrói o hábito que sustenta o resto.
Terceiro, formalize uma das três operações. Comece pela query. É a operação com maior alavanca rotineira. Defina o prompt canônico que lê o wiki, devolve a resposta, e arquiva o resultado como página candidata para próxima ingest.
O resto vem depois. Lint, schema mais elaborado, integração com agentes. Esses são detalhes de implementação. A decisão estratégica é a primeira. Tratar conhecimento como infraestrutura versionada que o modelo de linguagem mantém, em vez de tratá-lo como produto secundário de outras atividades.
Karpathy publicou o gist em novembro de 2024. A janela de quem ainda pode ser pioneiro no padrão se fecha em 2026. Quem decide na segunda-feira passa na frente de quem decide em julho.
Uma versão editorial complementar deste artigo, com ênfase na democratização do bibliotecário pessoal para empresas brasileiras de qualquer porte, foi publicada na AI Brasil em 26 de maio de 2026, sob o título "LLM Wiki: o bibliotecário que sua empresa não conseguiu contratar acaba de ficar de graça". Mesma autoria, ângulo editorial diferente.