Wikidata e Wikipedia para GEO
Mergulho profundo em Wikidata e Wikipedia aplicados a Entity SEO e GEO. 12 módulos sobre modelo de dados, QIDs, SPARQL, edição ética, Schema.org sameAs e um roadmap de 90 dias para se tornar entidade citável por ChatGPT, Gemini e Perplexity.
O que você vai aprender
Ao final deste curso, você dominará o modelo de dados do Wikidata, saberá criar e editar items e artigos seguindo as políticas e boas práticas da comunidade, consultará o grafo via SPARQL, integrará Wikidata ao seu site via Schema.org sameAs e terá um roadmap de 90 dias para se tornar entidade consistentemente citada por LLMs.
Wikipedia e Wikidata são dois projetos distintos da Wikimedia Foundation que, combinados, formam a infraestrutura semântica aberta mais utilizada pela web. Wikipedia é uma enciclopédia colaborativa em linguagem natural, organizada por artigos textuais em mais de 300 idiomas. Wikidata é um banco de dados estruturado, multilíngue e legível por máquina, que descreve entidades por meio de declarações formais. A Wikipedia responde a quem, o quê, quando e por quê em texto corrido; o Wikidata responde às mesmas perguntas em triplas sujeito-predicado-objeto.
Por que estudar ambos em conjunto
- Google, Bing, Apple, Amazon, ChatGPT, Gemini e Perplexity utilizam Wikipedia e Wikidata como fonte primária de verdade sobre entidades
- Knowledge Panels do Google são fortemente alimentados por sameAs do Wikidata e por infoboxes da Wikipedia
- Datasets de treino como Common Crawl, C4, The Pile e Dolma contêm dumps integrais da Wikipedia, o que significa que cada LLM moderno leu sua página na Wikipedia (se ela existir)
- Wikidata expõe um endpoint SPARQL público que permite consultas federadas em grafo, ideal para auditoria de entidades
- Editar Wikipedia sem compreender Wikidata é perder metade da oportunidade de GEO
Diferenças estruturais essenciais
| Dimensão | Wikipedia | Wikidata |
|---|---|---|
| Formato | Texto em linguagem natural | Dados estruturados (RDF) |
| Unidade | Artigo | Item (Qxxx) e Propriedade (Pxxx) |
| Fontes | Citações inline em rodapé | Referências por declaração |
| Público | Leitor humano | Humano e máquina |
| Política de verificabilidade | Fontes secundárias confiáveis | Fontes verificáveis por declaração |
| Critério de notabilidade | Cobertura significativa em fontes independentes | Critério mais amplo: qualquer coisa identificável |
| Licença | CC BY-SA 4.0 | CC0 (domínio público) |
A licença CC0 do Wikidata é um detalhe técnico com consequência estratégica gigante. Como os dados são de domínio público, qualquer empresa pode ingerir o Wikidata sem atribuição. É por isso que Google, Apple Maps, Siri, Alexa, DuckDuckGo e praticamente todos os assistentes conversacionais utilizam Wikidata como camada de entidades. Quando você cria ou edita seu item no Wikidata, está alimentando simultaneamente dezenas de sistemas downstream.
Regra prática do curso: antes de pedir para o ChatGPT falar sobre você, pergunte 'o que a Wikipedia diz sobre [seu nome]' e em paralelo rode uma consulta no query.wikidata.org pelo seu QID (se existir). O que esses dois sistemas dizem é uma aproximação razoável do que os LLMs acreditam ser verdade sobre você.
Você compreende a diferença estrutural entre Wikipedia (texto) e Wikidata (dados estruturados), sabe por que ambos são insumos críticos de LLMs e Knowledge Graphs, e entende o papel da licença CC0 na propagação dos dados.
Perguntas frequentes
Preciso ter artigo na Wikipedia para aparecer em Knowledge Panels?
Posso criar meu próprio item no Wikidata ou isso é considerado autopromoção?
Qual a diferença prática entre Wikidata e Google Knowledge Graph?
LLMs como ChatGPT e Gemini realmente usam Wikidata em tempo real?
Posso contratar uma agência para criar artigo na Wikipedia sobre minha empresa?
Quanto tempo leva para ver impacto em Knowledge Panels e citações por LLMs?
Alexandre Caramaschi
CEO da Brasil GEO, ex-CMO da Semantix (Nasdaq), cofundador da AI Brasil
Wikidata e Wikipedia são camadas fundacionais do Knowledge Graph do Google e do treino da geração atual de LLMs. Este curso sistematiza o que aprendi operando Entity SEO em marcas B2B brasileiras, o que funciona, o que é mito e o que a comunidade Wikimedia espera de quem quer ter presença ética e sustentável no ecossistema. Para dúvidas, entre em contato pelo WhatsApp ou LinkedIn.