Alexandre Caramaschi

doi:10.2139/ssrn.6460680

Karpathy matou a wiki humana e ressuscitou Vannevar Bush

O gist de 1.200 palavras publicado em novembro de 2024 reabriu uma fronteira fechada desde 1945 e tornou obsoleto o RAG amnésico.

Por Alexandre Caramaschi|26 de maio de 2026|Brasil GEO

Um gist de 1.200 palavras reabriu uma fronteira de 1945

Em novembro de 2024, Andrej Karpathy publicou no GitHub um gist de pouco mais de 1.200 palavras sem uma linha de código. Apenas a descrição de um padrão de organização de conhecimento que ele batizou de LLM Wiki. Em seis meses, esse texto curto gerou ao menos quarenta implementações públicas catalogadas nos comentários do próprio gist. Entre elas, ΩmegaWiki, Synthadoc, Link, Synto e sqz. Engenheiros sêniores adotaram o padrão. Times de pesquisa o discutem em listas internas.

O motivo do interesse não é técnico. É arquitetônico.

Karpathy nomeou um problema que todo executivo conhece e nenhum havia conseguido resolver. A wiki corporativa morre. O RAG esquece. As duas dores convivem dentro da mesma empresa, alimentadas pelo mesmo conteúdo, e ninguém une os pedaços. O McKinsey Global Institute, no estudo The Social Economy publicado em julho de 2012, calculou que profissionais do conhecimento gastam aproximadamente 19% do tempo de trabalho semanal apenas procurando e juntando informação. Quase um dia por semana evaporando em arqueologia interna. Em 2026, com cada conversa de equipe rodando em LLM, o número não caiu. Mudou de lugar.

A tese de Karpathy resolve as duas dores ao mesmo tempo. Não com uma ferramenta. Com um padrão de três camadas e três operações que reorganiza o trabalho intelectual em torno de uma máquina paciente.

É sobre isso que este artigo trata. E sobre por que Vannevar Bush, em 1945, já tinha descrito o requisito.

RAG é amnésico. Wiki humana evapora. A terceira opção sempre faltou

O Retrieval-Augmented Generation virou padrão de produção em 2023 e 2024. Patrick Lewis e colegas publicaram a formulação original em NeurIPS 2020 (arXiv:2005.11401). O mecanismo funciona. Recupera trechos relevantes de uma base vetorial, injeta no contexto do modelo, melhora a resposta. Bilhões de chamadas por dia rodam em cima dessa receita.

O problema do RAG não é a recuperação. É a memória.

RAG não acumula. Cada query é amnésica. Você pergunta a mesma coisa três vezes, o sistema repete o mesmo trabalho de busca e síntese três vezes. A boa resposta que ele construiu na primeira tentativa não fica em lugar nenhum. Some no log. O próximo usuário começa do zero. Para um corpus técnico denso, com duzentas fontes que se cruzam, isso significa que a empresa paga inferência infinita para reconstruir o mesmo conhecimento.

A wiki humana tem o problema simétrico. Acumula bem na largada, evapora no médio prazo. O custo de manutenção é o ponto que sempre matou wikis corporativas. Alguém precisa abrir a página, ler, conferir se ainda é verdade, reescrever, aprovar. Esse alguém tem outras prioridades. A wiki vira camada arqueológica em menos de um ano em quase toda empresa que cruza mil colaboradores.

O custo que matou a wiki humana vai a zero quando o bibliotecário é uma máquina paciente. Esse é o ponto que Karpathy identificou e que ninguém havia formulado tão limpo.

A LLM Wiki é a síntese das duas. Acumula como wiki. Recupera como RAG. Lê e reescreve como agente. A diferença é que a manutenção, que sempre foi o gargalo, deixa de ser tarefa humana. Vira tarefa de um modelo de linguagem rodando operações disciplinadas sobre arquivos versionados em Git.

Quem leu o gist com atenção percebeu o segundo nível da tese. Karpathy não está propondo uma ferramenta. Está propondo um padrão de pasta. Três camadas de arquivos. Três operações canônicas. Dois arquivos especiais com função estrutural. O resto é commodity.

Vannevar Bush escreveu o requisito em 1945. Faltava o bibliotecário

Em julho de 1945, três meses antes de Hiroshima, Vannevar Bush publicou na revista The Atlantic o ensaio As We May Think. Bush era o diretor do Office of Scientific Research and Development do governo americano, o homem que coordenou o esforço científico aliado na Segunda Guerra. O ensaio descrevia uma máquina hipotética que ele chamou de Memex.

O Memex era um móvel. Uma escrivaninha com microfilme onde o pesquisador armazenaria livros, artigos, anotações e correspondência. A inovação não era o armazenamento. Era o que Bush chamou de associative trails, trilhas associativas. O usuário poderia ligar dois itens quaisquer com uma referência permanente. E ligar uma trilha a outra. E compartilhar trilhas com colegas. Toda a estrutura do hipertexto, da Wikipédia, do Roam Research e do Obsidian estava ali, descrita em prosa, antes do primeiro computador eletrônico comercial existir.

Bush escreveu uma frase que ficou. "O instrumento, se desenvolvido adequadamente, dará ao seu usuário acesso e comando sobre a memória herdada da raça humana." A ambição era clara. A obstrução também.

O Memex de Bush nunca virou produto. A razão técnica óbvia é que microfilme não chegou perto. A razão profunda, que Bush percebeu e registrou no próprio ensaio, é que alguém precisava manter as trilhas. Alguém precisava ler o documento novo, decidir onde ele se conecta com o que já existe, criar o link, atualizar a entrada anterior. Bush imaginou que o pesquisador faria isso por si mesmo. Não fez. Ninguém faz. O custo de curadoria sempre comeu a promessa.

Um modelo de linguagem grande, em 2024, é a primeira entidade barata o suficiente para topar ser o bibliotecário. Não porque é mais inteligente que o pesquisador. Porque é paciente. Não cansa, não esquece de atualizar, não tem outra prioridade na semana que vem.

Vannevar Bush escreveu o requisito em 1945. Faltava encontrar quem topasse ser o bibliotecário. Oitenta anos depois, a vaga foi preenchida.

Três camadas, três operações, dois arquivos especiais

A arquitetura proposta por Karpathy é deliberadamente espartana. Cabe em uma pasta de Git. O leitor experiente reconhece imediatamente que a simplicidade é o ponto.

A camada inferior é raw/. Documentos brutos, imutáveis, com metadados de proveniência. PDFs, transcrições, e-mails, capturas de página. Nada é editado depois de entrar. Quem alimenta a camada raw assina e data.

A camada intermediária é o wiki sintético. Arquivos Markdown reescritos por um modelo de linguagem a partir das fontes raw. Cada página tem links de saída para outras páginas e referências para os documentos raw que a originaram. É aqui que mora a densidade citável. É daqui que o leitor humano vai ler.

A camada superior é o schema, materializado em um arquivo CLAUDE.md ou equivalente. O schema descreve como o sistema deve operar sobre as outras duas camadas. Define o que é uma boa entrada na wiki, como decidir se um documento raw merece virar página, quando atualizar versus criar nova entrada, o tom de voz do wiki sintético.

Sobre essas três camadas rodam três operações.

Ingest recebe um documento novo, decide se ele entra no raw, e se entra, qual página do wiki sintético precisa ser criada ou atualizada. Query responde uma pergunta lendo prioritariamente o wiki sintético e descendo para o raw quando o wiki não basta. Lint roda periodicamente verificando consistência, links quebrados, contradições entre páginas, datas estale.

Dois arquivos especiais carregam o peso estrutural. index.md é content-oriented, não meramente um sumário. Reescrito a cada ingest relevante, ele descreve o estado atual do conhecimento, com links para os pontos vivos. log.md é append-only, cronológico, registra cada ingest e cada decisão de lint. Auditoria pura.

A diferença entre essa arquitetura, RAG clássico e wiki humana fica clara em uma tabela.

Dimensão	RAG clássico	Wiki humana	LLM Wiki
Custo de manutenção	Zero, mas reprocessa tudo a cada query	Alto e humano, vira gargalo organizacional	Baixo, modelo faz lint e ingest contínuos
Acumulação de aprendizado	Nenhuma, cada query é amnésica	Alta no curto prazo, decai sem curadoria	Alta e persistente, toda boa resposta vira página
Frescor do conteúdo	Depende da última reindexação	Depende de revisão humana	Continuamente reescrito por ingest e lint
Consistência interna	Inexistente, recupera trechos isolados	Depende de editor responsável	Lint detecta contradição entre páginas
Governança e proveniência	Fraca, citação por chunk	Forte se houver disciplina de PR	Forte por design, raw imutável e log append-only
Escala	Excelente, vetores são baratos	Quebra acima de algumas centenas de páginas	Escala com modelo, limitada por contexto
Densidade citável por LLM	Baixa, trechos fragmentados	Variável, depende do editor	Alta, página é otimizada para recuperação

A coluna da direita não é uma versão melhor das duas anteriores. É uma categoria diferente. Quem trata como concorrente do RAG ou substituto da wiki vai entender errado e implementar errado. GraphRAG, publicado pela Microsoft em 2024 (arXiv:2404.16130), e MemGPT de Packer et al. 2023 (arXiv:2310.08560), são complementares, não substitutos. Cada um resolve um pedaço do problema. A LLM Wiki organiza o pedaço da síntese persistente.

Toda boa resposta deveria virar página

O ponto não óbvio do padrão é a relação entre query e wiki. Em RAG clássico, query é consumo. Lê o índice, sintetiza, devolve. Acabou. Em LLM Wiki, query é produção. Toda resposta que valeu a pena gerar deveria virar uma página nova ou um patch em página existente.

Essa inversão é o que muda o regime do sistema.

RAG não acumula. Wiki humana evapora. A LLM Wiki é a única arquitetura em que o ato de perguntar deixa a base mais inteligente.

Existe evidência empírica relevante de que esse padrão funciona em uma dimensão adjacente que importa para qualquer empresa que vende em mercados onde LLM já intermedia decisão de compra. Pranjal Aggarwal e colegas de Princeton publicaram em KDD 2024 (arXiv:2311.09735) o primeiro estudo controlado sobre o que aumenta a probabilidade de uma página ser citada por um modelo generativo. As táticas mais eficazes foram densificação canônica. Citação de fontes autoritativas elevou visibilidade em 115%. Inclusão de estatísticas elevou em 41%. Citações diretas atribuídas elevaram em 28%. Os números estão na Tabela 3 do paper.

Quem leu o estudo percebe que essas táticas não descrevem técnicas de copy. Descrevem páginas de wiki bem mantidas. Página com fonte explícita, número datado e quote atribuída é exatamente o que sai de uma operação de wiki sintético rodando sobre raw bem curado.

O projeto AutoGEO de Wu, Zhong, Kim e Xiong na CMU, com código aberto público, automatizou o playbook de Princeton e reportou lift agregado de 50,99% em visibilidade em LLMs comerciais. A literatura está convergindo. O conteúdo que LLM gosta de citar é o conteúdo que LLM Wiki produz por padrão.

A consequência operacional é direta. Uma empresa que constrói sua base de conhecimento interno como LLM Wiki está, por design, construindo o melhor substrato de visibilidade em LLMs externos. A wiki canônica é dupla infraestrutura. Serve o time por dentro e serve o algoritmo por fora. Quem entendeu isso para de discutir SEO versus GEO e começa a discutir governança de conhecimento.

Onde isso vira decisão de gestor em 2026

O padrão é genérico. Os casos onde a alavanca é maior já estão claros.

Time de marketing B2B que reconstrói briefing a cada campanha. Toda quinta-feira, alguém abre um Google Doc em branco e refaz o trabalho de definir ICP, dor, mensagem, prova social. Substitua por LLM Wiki. index.md descreve o ICP canônico, com link para a página de cada segmento e o raw das entrevistas de cliente que sustentam a definição. A query de quinta-feira lê o wiki, devolve o briefing pronto, arquiva como anexo da campanha. Próxima campanha começa do conhecimento acumulado, não da memória do redator de plantão.

Conselho consultivo recebendo deck novo a cada reunião. Substitua por memo Decision Day com log.md cronológico. Cada conselheiro chega na próxima sessão tendo lido o que mudou desde a última, com a auditoria de cada decisão registrada em append-only. O CEO para de explicar o passado e começa a debater o futuro. O ciclo de reunião encurta.

Due diligence de empresa investida ou alvo. Hoje, a pasta da operação é um cemitério de PDFs com nomes longos e seis versões. Substitua por raw imutável com proveniência, wiki sintético cross-linkado, lint quinzenal detectando contradição entre laudo financeiro e narrativa do CEO. O time de M&A para de procurar informação e começa a interpretar inconsistência.

Wiki canônica como infraestrutura de visibilidade em LLM. Para quem opera marca em mercado onde modelo generativo intermedia descoberta, a base interna bem mantida é o ativo que vira citação externa. Métricas como citation rate e mention rate, hoje rastreadas por ferramentas como Profound (a empresa divulgou em maio de 2026 ter monitorado vinte e sete milhões de citações em LLM, com apenas 4,3% delas captadas por marcas que tratam o conteúdo como ativo proprietário), correlacionam diretamente com a densidade da base de origem.

A LLM Wiki é a primeira arquitetura de conhecimento em que a operação interna e o posicionamento externo se alimentam do mesmo ativo. Quem tratar como dois projetos vai pagar duas vezes pelo mesmo trabalho.

Segunda-feira de manhã, três passos

O padrão é grande, a entrada é pequena. Quem quiser começar na segunda-feira tem três passos concretos que cabem em uma semana de trabalho focado.

Primeiro, crie um index.md content-oriented no repositório de conhecimento da sua operação. Não um sumário. Uma página que descreve, em prosa densa, o estado atual do que importa, com links para os pontos vivos. Reescreva esse arquivo toda vez que algo material mudar.

Segundo, crie um log.md append-only e force-se a registrar cada ingest pelos próximos trinta dias. Documento novo, decisão tomada, conversa relevante. Append, com data e autor. A disciplina de trinta dias é o que constrói o hábito que sustenta o resto.

Terceiro, formalize uma das três operações. Comece pela query. É a operação com maior alavanca rotineira. Defina o prompt canônico que lê o wiki, devolve a resposta, e arquiva o resultado como página candidata para próxima ingest.

O resto vem depois. Lint, schema mais elaborado, integração com agentes. Esses são detalhes de implementação. A decisão estratégica é a primeira. Tratar conhecimento como infraestrutura versionada que o modelo de linguagem mantém, em vez de tratá-lo como produto secundário de outras atividades.

Karpathy publicou o gist em novembro de 2024. A janela de quem ainda pode ser pioneiro no padrão se fecha em 2026. Quem decide na segunda-feira passa na frente de quem decide em julho.

Uma versão editorial complementar deste artigo, com ênfase na democratização do bibliotecário pessoal para empresas brasileiras de qualquer porte, foi publicada na AI Brasil em 26 de maio de 2026, sob o título "LLM Wiki: o bibliotecário que sua empresa não conseguiu contratar acaba de ficar de graça". Mesma autoria, ângulo editorial diferente.

Perguntas frequentes

A LLM Wiki substitui o RAG?

Não. A LLM Wiki usa RAG por baixo, mas inverte a relação. O RAG clássico recupera para responder e descarta o trabalho. A LLM Wiki recupera para responder e arquiva a resposta como página, alimentando o próximo ciclo. Quem implementa LLM Wiki continua tendo um índice vetorial, só que a base indexada cresce qualitativamente a cada query relevante em vez de ficar estática entre reindexações.

Funciona para corpus de milhões de documentos?

O padrão escala bem até dezenas de milhares de páginas no wiki sintético, que é o que cabe em contexto de modelo de fronteira em 2026. Para corpora maiores, a recomendação é particionar por domínio e ter LLM Wikis especializadas por área de conhecimento, com um schema raiz que sabe rotear queries entre elas. Acima de milhões, RAG hierárquico tipo GraphRAG da Microsoft (arXiv:2404.16130) continua sendo a base, com LLM Wiki por cima.

Qual o custo real de manutenção?

Em base de mil páginas com ingest semanal de cerca de cinquenta documentos novos, o custo de inferência para rodar ingest e lint contínuos com Claude Opus 4.7 ou GPT-5 fica entre duzentos e seiscentos dólares por mês. Esse é o custo de operação. O custo humano cai para revisão pontual e definição de schema, tipicamente uma hora por semana de um editor sênior.

Existem implementações open source?

Sim. As mais maduras catalogadas nos comentários do gist são ΩmegaWiki, Synthadoc, Link, Synto e sqz, surgidas entre dezembro de 2024 e maio de 2026. Nenhuma virou padrão de mercado ainda. A escolha pragmática é começar com uma estrutura própria de pasta versionada em Git, três operações implementadas em Python ou TypeScript, e migrar para uma das ferramentas quando o padrão estiver internalizado pelo time.

Por onde começar segunda de manhã?

Crie um repositório Git novo. Adicione três pastas, raw, wiki e schema. Escreva um index.md content-oriented descrevendo o estado atual do conhecimento que importa. Crie um log.md append-only. Documente um prompt canônico de query que lê o wiki e arquiva o resultado. Use os primeiros trinta dias para sustentar a disciplina antes de adicionar operações de ingest e lint automatizadas.

Como medir se a wiki está saudável?

Três métricas. Densidade citável, medida pela proporção de páginas com fonte explícita, estatística datada e quote atribuída. Frescor médio, calculado pela mediana da diferença entre data de última edição e data atual nas páginas do index. Reuso de query, registrado pelo log e medido como percentual de queries respondidas a partir do wiki sintético sem necessidade de descer ao raw. As três acima de 70%, 90 dias e 60% respectivamente indicam wiki em regime saudável.

Qual a diferença para Zettelkasten ou Building a Second Brain?

Zettelkasten de Niklas Luhmann e Building a Second Brain de Tiago Forte são metodologias de Personal Knowledge Management desenhadas para o trabalho cognitivo de uma pessoa. A LLM Wiki herda os princípios, sobretudo a noção de notas atômicas com links explícitos, mas opera em outra escala. O bibliotecário deixa de ser o autor da nota e passa a ser um agente. Equipes inteiras compartilham a mesma base, e o custo de manutenção que torna PKM inviável em time grande deixa de existir.

Leitura relacionada

Newsletter GEO

Receba conteúdo semanal sobre GEO e IA

Análises sobre Generative Engine Optimization, visibilidade algorítmica e estratégias para ser citado pelas IAs. Sem spam. Cancele quando quiser.

Compartilhar no LinkedIn Compartilhar no X

Ver todos os artigos →