Alexandre Caramaschi; Alexandre Caramaschi

doi:10.2139/ssrn.6460680

Janela confirmatória v2 · em andamentoDia 58 de 90

Estamos no dia 58 de 90 da janela confirmatória v2

Iniciada em 2026-04-23 e programada para fechar em 2026-07-21. O dataset acumula 63.940 observações coletadas até o momento, distribuídas conforme o desenho fatorial pré-registrado (4 verticais × 48 queries balanceadas × 5 LLMs × 2 coletas diárias). A taxonomia, os prompts e os parâmetros de temperatura foram congelados antes da primeira coleta e permanecem imutáveis até o dia 90.

Progresso da janela64% · 32 dias restantes

2026-04-23Dia 3 (H1)Dia 38 (H2)2026-07-21

Observações acumuladas

63.940

Rodadas de coleta

240

Próxima atualização

06:00 BRT

Como o dataset cresce

Duas coletas automatizadas rodam por dia, às 06:00 e 18:00 BRT, via GitHub Actions. Cada execução percorre 4 verticais × 48 queries × 5 LLMs, gerando aproximadamente 960 observações por rodada (cerca de 1.900 por dia somando as duas coletas). Ao final de cada run, o pipeline faz commit direto no repositório papers, com manifest SHA-256 para garantir reprodutibilidade bit-a-bit. O dataset é público desde o primeiro registro — sem embargo, sem versão privada, sem curadoria posterior.

Marcos da janela:

Dia 3 (25/04/2026): potência estatística de H1 (vantagem RAG) — ✓ atingido
Dia 38 (30/05/2026): potência estatística de H2 (probe fictícia) — ✓ atingido
Dia 90 (21/07/2026): fechamento da janela e congelamento do dataset — previsto
Outubro/2026: submissão do Paper 5 à Elsevier (Information Sciences)

Papers companion“Algorithmic Authority” publicado na SSRN (Elsevier) · DOI 10.2139/ssrn.6460680
Paper 4 — Null-Triad: submetido SSRN + publicado Zenodo · DOI 10.5281/zenodo.19712217
Paper 5: em preparação, alvo Elsevier, infraestrutura v2 operacional · ver /publicacoes →

Metodologia v2 · reboot 2026-04-2378/78 tests green

Reimplementação algorítmica completa

O Paper 4 (Null-Triad) expôs três modos de falha no pipeline anterior: H1 com underpower estatístico, H2 com design-null (probe fictício desligado) e H3 com instrumentação assimétrica. O v2.0.0-reboot endereça os três simultaneamente com dez pilares metodológicos pré-registrados.

NER v2 (entity extraction)
Normalização Unicode NFC+NFKD, regex com word-boundary rigoroso, aliases canônicos e stop-contexts. Redução de 45% em falsos positivos sobre dataset histórico.
Cluster-robust inference (CR1)
Sandwich estimator com cross-group covariance para diff-of-proportions sobre clusters temporais (dias).
Null simulation empírica
Distribuição Monte Carlo de Jaccard sob H0 de uniformidade, substituindo threshold arbitrário por P5 empírico.
Power analysis pré-registrada
Rule-of-Three inverse (probe fictício), Cohen's h para diff-proportions, design-effect adjustment por correlação intra-cluster.
GLMM hierárquico
BinomialBayesMixedGLM com random intercepts aninhados (query, day, entity) para partição correta de variância.
Cohort científica v2
79 entidades BR reais (4 verticais) + 32 âncoras internacionais de calibração + 16 decoys fictícios para FPR via alucinação — 127 entidades monitoradas no total.
Query battery balanceada
192 queries com balanceamento 50/50 idioma (PT/EN) e tipo (directive/exploratory), cobertura 4 verticais × 6 categorias × 2 temporal.
Hypothesis engine (BH-FDR)
Benjamini-Hochberg automático + decision rule pré-registrada (reject iff BH-adjusted p<0,05 AND 95% CI exclui null).
Reprodutibilidade bit-para-bit
Docker image pinada + PYTHONHASHSEED fixo + SHA-256 manifest de outputs via scripts/reproduce.sh contra git tag.
Test coverage 78/78
Suite automatizada cobrindo os seis módulos analíticos do v2 (NER, CR1, null-sim, power, GLMM, hypothesis-engine).

METHODOLOGY_V2.md →CHANGELOG →Paper 4 · DOI Zenodo →Roadmap completo →

RUMO AO PAPER 5 · ALVO ELSEVIER

63.940 / 100.000 queries coletadas

Janela confirmatória 90d sobre infraestrutura v2 · encerra 22 de julho de 2026 — faltam 34 dias

Pré-registro OSF v2 · dataset Zenodo DOI separado · Cohen's κ inter-rater (200 rows)

63.9% do dataset alvo

Coleta 2x/dia · 5 LLMs · 4 verticais · Atualizado 18 de junho de 2026 às 21:05

Visão geral

Queries totais

63.940

42 dias de coleta · 240 rounds

Citações encontradas

22.516

35.2% (IC 95%: 34.8%–35.6%)

Entidades monitoradas

127

111 reais + 16 fictícias

Specificity (calibração)

100.0%

0/51317 menções a fictícias

Última coleta

hoje

19/06/2026

Verificação de variação semanal

Taxa estável — queda de contagem é volume

Compara a taxa de citação por query (não a contagem absoluta) entre os últimos 7 dias e os 7 anteriores, separando o que é variação de volume de coleta do que é variação de propensão dos LLMs a citar, com teste de significância. Minimiza suposição: só dispara alarme quando a taxa cai de fato.

Janela anterior

2026-05-28 a 2026-06-04

37,0%

4.770 citações / 12.883 queries

Janela atual

2026-06-05 a 2026-06-19

38,3%

4.098 citações / 10.688 queries

Variação da taxa:+1,32 pp(+3,6% relativo)

Garantia (teste z de 2 proporções): diferença estatisticamente significativa a 95% (|z| = 2.08). A taxa da janela atual está fora do IC95 acumulado (34.8–35.6%).

De onde vem a variação de -672 citações

Decomposição shift-share: quanto é efeito de quantas queries foram coletadas, quanto é efeito da taxa por query.

Efeito de volume

-813

-2.195 queries na janela (-17%) à taxa anterior.

Efeito de taxa

+141

Mudança de propensão a citar, mantido o volume atual.

Taxa diária — últimos 14 dias (veja você mesmo)

2026-05-282026-06-19

Ressalva de completude da janela: o dia mais recente (2026-06-19) tem só 102 queries — coleta provavelmente em andamento, subestimando a contagem. há 8 dias ausentes na janela atual. Isso reduz a contagem absoluta sem afetar a taxa — mais uma razão para ler a TAXA, não o total.

A contagem de citações caiu -672, mas a taxa por query está estável (38,3% vs 37,0%). A causa é o volume: menos queries coletadas na janela explicam -813 citações, enquanto a taxa em si até somou +141 — ou seja, os LLMs não passaram a citar menos por pergunta. Não há queda real de citação.

Insights principais

Perplexity lidera

75.8%

Maior taxa de citação entre os 5 LLMs (4367 citadas em 5760 queries). Perplexity AI é o motor que mais cita marcas brasileiras hoje.

Fintech é o vertical mais citado

42.0%

16032 queries no vertical, 6732 com citação. Vertical com cobertura empírica robusta.

Nubank domina o ranking

3604 menções

Marca mais citada por LLMs em todo o dataset. 1.7× mais citações que o segundo colocado (Mercado Livre).

100% das atribuições são named

25107 / 25119

Atribuições nomeadas (vs apenas linkadas) indicam alta precisão das citações — LLMs mencionam empresas pelo nome próprio.

44.1% das citações no início

11071 / 25119

Posição privilegiada (primeiro tercil) na resposta gerada pelo LLM. Marcas citadas no início têm maior peso de leitura.

Movimentação semanal · todos os verticais

2026-06-13 a 2026-06-19 vs. 2026-06-06 a 2026-06-12

Comparativo das citações detectadas nos últimos 7 dias contra os 7 dias anteriores, agregando as 4 verticais. Mostra de relance quem ganhou visibilidade nos LLMs, quem está perdendo terreno e quem entrou no radar nesta semana. 0 subindo · 12 caindo · 0 novos.

Estes movimentos são em contagem absoluta de citações e, portanto, sensíveis ao volume de queries coletado na janela. Para saber se houve queda real de taxa (e não apenas menos queries), veja a Verificação de variação semanal acima.

▼ Maior queda da semana

NubankFintech

436 → 59 citações (-377 · -87%)

Maiores altas

Maior ganho de citações vs. a semana anterior

Nenhuma entidade subiu nesta janela.

Maiores quedas

Maior perda de visibilidade vs. a semana anterior

1NubankFintech▼ -87%
436 → 59 (-377)
2FinPay SolutionsFintech▼ -87%
112 → 15 (-97)
3ShopNova DigitalVarejo▼ -87%
112 → 15 (-97)
4Amazon BrasilVarejo▼ -91%
46 → 4 (-42)
5BradescoFintech▼ -90%
38 → 4 (-34)
6InvolvesTecnologia▼ -88%
33 → 4 (-29)

+ 6 outras entidades fora do top 6

Novos no radar

Apareceram nos LLMs sem citações na semana anterior

Nenhuma entidade nova nesta janela.

▲ Defender quem subiu

Travar a persistência da citação: rodar os 25 prompts canônicos toda semana, mirar drift <20% em 30 dias.
Reforçar o Information Gain da página citada (dado proprietário, framework próprio) — é o que sustenta o lift.
Garantir Schema-content parity e dateModified real; redating vazio derruba o frescor.

▼ Reverter quem caiu

Checar Entity Boundary Drift (cos θ < 0,80 derruba o sinal): auditar Wikidata + 5 plataformas externas.
Buscar consenso multi-fonte (Wikipedia + Reddit + G2 + papers): 2,8× mais chance de citação cruzada.
Conferir parsing por crawler de IA: SSR + schema rendem 94% vs 23% de leitura; conteúdo só em JS some.

Variações computadas por compute_weekly_deltas.py sobre o histórico granular por entidade. Selecione um vertical específico acima para ver as hipóteses GEO de cada movimento (por que subiu, por que caiu). Recomendações pelo cânone GEO 2026.

Estado da arte GEO · 2026

Como interpretar os movimentos — e o que fazer com eles

Os números acima medem visibilidade citacional. Esta seção traduz o que move essa visibilidade segundo o cânone GEO de 2026 — as métricas certas, as alavancas de redação com lift medido, o que mudou após o Google I/O e os sinais observáveis que decidem se um LLM cita uma marca.

GEO Score · visibilidade

Posição da fonte na resposta + tokens atribuídos + frequência de citação. É o que esta página mede de forma longitudinal.

GEU Score · utilidade

Qualidade da citação + cobertura dos keypoints + coerência. Otimizar GEO sem degradar GEU — senão os engines penalizam.

O método empírico (medir lift por engine comparando pares vencedor/perdedor, sem GPU) rende +50 a +82% de GEO Score e cresce +46,4% com reescrita multi-turno (AgenticGEO). AutoGEO · ICLR 2026 (CMU)

Performance por LLM

Ordenado pela taxa de citação · 5 modelos

Perplexity

Perplexity AI

75.8%

Queries

5760

Citadas

4367

Latência média

3.0s

Modelo

sonar

Claude

Anthropic

42.0%

Queries

14554

Citadas

6112

Latência média

3.8s

Modelo

claude-haiku-4-5-20251001

ChatGPT

OpenAI

34.4%

Queries

14720

Citadas

5069

Latência média

5.9s

Modelo

gpt-4o-mini-2024-07-18

Groq

28.2%

Queries

14720

Citadas

4144

Latência média

1.8s

Modelo

llama-3.3-70b-versatile

Gemini

Google

19.9%

Queries

14186

Citadas

2824

Latência média

25.3s

Modelo

gemini-2.5-pro

Performance por Vertical

Fintech

42.0%de citação

16032 queries6732 citadas

Líder: Nubank

Varejo

39.2%de citação

16032 queries6283 citadas

Líder: Mercado Livre

Tecnologia

30.3%de citação

15898 queries4823 citadas

Líder: Totvs

Saúde

29.3%de citação

15978 queries4678 citadas

Líder: EMS

Matriz cruzada — LLM × Vertical

Identifica gaps de cobertura

Vertical / LLM	Perplexity	Claude	ChatGPT	Gemini	Groq
Fintech	86.5% n=1440	61.6% n=3680	35.4% n=3680	24.4% n=3552	28.6% n=3680
Saúde	69.5% n=1440	30.0% n=3626	26.6% n=3680	18.0% n=3552	26.5% n=3680
Tecnologia	54.4% n=1440	30.1% n=3568	37.2% n=3680	17.7% n=3530	26.4% n=3680
Varejo	92.8% n=1440	45.8% n=3680	38.6% n=3680	19.5% n=3552	31.1% n=3680

Células com borda tracejada têm amostra abaixo de 30 (n<30) — resultado estatisticamente não-confiável. Ver avisos abaixo.

Top entidades citadas

Ranking absoluto · 30 entidades com pelo menos 1 citação detectada

Nubank

3604

Mercado Livre

2084

Magazine Luiza

1907

Totvs

955

EMS

853

Americanas

795

FinPay Solutions

791

Banco Floresta Digital

782

PicPay

782

ShopNova Digital

779

DataBridge Brasil

764

MegaStore Brasil

737

TechNova Solutions

733

Clínica Horizonte Digital

728

HealthTech Brasil

722

Hypera Pharma

707

C6 Bank

631

Eurofarma

582

Amazon Brasil

578

Banco Inter

571

Bradesco

442

Casas Bahia

383

Aché

328

Neon

316

Mercado Pago

307

Itaú

292

Involves

278

CI&T

233

iFood

222

Stefanini

195

Observação: as entidades nesta listagem vêm da tabela citation_context, com extração granular já consolidada nos quatro verticais (Fintech, Saúde, Tecnologia e Varejo). O ranking é absoluto por número de citações detectadas; veja o catálogo completo abaixo para a cobertura por roster de cada vertical.

Catálogo completo · 111 empresas monitoradas

Roster canônico do projeto Papers · 4 verticais

As 111 empresas reais abaixo são monitoradas em todas as queries de cada vertical, com 16 entidades fictícias adicionais para detectar falsos positivos. Empresas com badge verde têm pelo menos 1 citação detectada na tabela citation_context.

Fintech & Bancos Digitais

16 empresas

19 com citação detectada (118.8% cobertura granular)

Nubank3604
PagBank162
Cielo5
Stone168
Banco Inter571
Mercado Pago307
Itaú292
Bradesco442
C6 Bank631
PicPay782
Ame Digital
Neon316
Original
BS2
Safra3
Banco Carrefour

Varejo & E-commerce

15 empresas

12 com citação detectada (80% cobertura granular)

Magazine Luiza1907
Casas Bahia383
Ponto Frio
Americanas795
Amazon Brasil578
Mercado Livre2084
Shopee Brasil
AliExpress Brasil
Leroy Merlin
Tok&Stok
Renner56
Riachuelo1
C&A Brasil
Centauro
Netshoes33

Saúde & Farmacêuticas

15 empresas

16 com citação detectada (106.7% cobertura granular)

Dasa92
Hapvida42
Unimed10
Eli Lilly Brasil
Raia Drogasil119
Fleury93
Rede D'Or3
Einstein126
Sírio-Libanês160
Eurofarma582
Aché328
EMS853
Hypera Pharma707
NotreDame Intermédica5
SulAmérica Saúde6

Tecnologia & TI

15 empresas

15 com citação detectada (100% cobertura granular)

Tivit58
Accenture Brasil4
Stefanini195
Totvs955
Linx16
Locaweb70
Positivo Tecnologia
Movile183
CI&T233
Vivo Empresas
Embraer
WEG
Natura &Co
iFood222
99

Qualidade dos dados

Sentimento das menções

Neutro19555 (77.8%)
Positivo5505 (21.9%)
Negativo59 (0.2%)

Tipo de atribuição

Nomeada (named)25107 (100.0%)
Apenas linkada12 (0.0%)

Posição na resposta

Início (1º tercil)11071 (44.1%)
Meio (2º tercil)8164 (32.5%)
Fim (3º tercil)5884 (23.4%)

FinOps — Custo da pesquisa

Gasto mensal

US$ 0.00

Limite mensal

US$ 100.00

0.00% do orçamento

Plataforma	Modelo	Gasto	Limite
ChatGPT	gpt-4o-mini	US$ 0.0000	US$ 15.00
Claude	claude-haiku-4-5	US$ 0.0000	US$ 20.00
Gemini	gemini-2.5-pro	US$ 0.0000	US$ 15.00
Perplexity	sonar	US$ 0.0000	US$ 25.00
Groq	llama-3.3-70b-versatile	US$ 0.0000	US$ 10.00

Série temporal de coleta

42 dias com dados · mediana 1703 queries/dia

23.5%

04-23

n=617

20.4%

04-24

n=1017

20.6%

04-25

n=1753

20.5%

04-26

n=1728

21%

04-27

n=1674

20.9%

04-28

n=1709

36.1%

04-29

n=888

36.8%

04-30

n=2184

42.7%

05-01

n=361

36.2%

05-04

n=759

38.5%

05-05

n=1481

37.4%

05-11

n=938

38%

05-12

n=911

37.8%

05-13

n=2250

38.1%

05-14

n=1088

36.3%

05-15

n=1168

36.8%

05-16

n=2454

37.8%

05-17

n=2092

34.7%

05-18

n=970

39.5%

05-19

n=1044

39%

05-20

n=1054

36.4%

05-21

n=2293

35.5%

05-22

n=2332

39%

05-23

n=1261

37%

05-24

n=2231

36.2%

05-25

n=2090

38.9%

05-26

n=1050

37.8%

05-27

n=972

36.5%

05-28

n=1703

38.1%

05-30

n=1978

37.2%

05-31

n=1130

37.5%

06-01

n=1761

36.6%

06-02

n=2241

37.2%

06-03

n=2233

36.1%

06-04

n=1837

41.4%

06-05

n=1728

36.3%

06-06

n=2163

38.4%

06-07

n=2202

38.2%

06-08

n=1986

38.6%

06-09

n=1489

35.1%

06-18

n=1018

61.8%

06-19

n=102

Taxa de citação por categoria de query

Qual tipo de pergunta dispara mais citações espontâneas? Ordenado pela taxa.

calibracao fp

96% (12120/12623)

comparativo

33.1% (3147/9520)

mercado

29.7% (2823/9504)

descoberta

27.6% (2624/9520)

confianca

12.5% (947/7600)

inovacao

8.7% (657/7579)

experiencia

2.6% (198/7594)

Português × Inglês — LLMs citam mais em qual idioma?

Inglês

37.2%

11.893 citadas / 31.970 queries

Português (BR)

33.2%

10.623 citadas / 31.970 queries

Distribuição de sentimento por LLM

ChatGPT

+798 · 3392 · −0

Claude

+1058 · 3829 · −13

Gemini

+80 · 1666 · −1

Groq

+127 · 2501 · −30

Perplexity

+3442 · 8167 · −15

Verde = positivo · cinza = neutro · vermelho = negativo · classificador automático de 3 classes

Latência de resposta por LLM

ChatGPT

5.9s

min 0.7s · max 164.2s

Claude

3.8s

min 1.0s · max 127.6s

Gemini

25.3s

min 0.7s · max 148.8s

Groq

1.8s

min 0.2s · max 7.6s

Perplexity

3.0s

min 1.6s · max 49.4s

Gap de cobertura — marcas do roster ainda não citadas

Oportunidade de GEO: marcas monitoradas que ainda não receberam menção espontânea dos LLMs em queries-alvo.

fintech (4 uncovered)

Ame DigitalOriginalBS2Banco Carrefour

varejo (7 uncovered)

Ponto FrioShopee BrasilAliExpress BrasilLeroy MerlinTok&StokC&A BrasilCentauro

saude (1 uncovered)

Eli Lilly Brasil

tecnologia (6 uncovered)

Positivo TecnologiaVivo EmpresasEmbraerWEGNatura &Co99

Avisos e metodologia

Limites estatísticos identificados

Top entidades concentradas em Fintech: reflete onde a metodologia foi calibrada inicialmente. Expansão para outros verticais em andamento.

Como os dados foram coletados

Fonte: papers.db (63940 queries dataset)
Pipeline: 7 módulos Python rodando contra APIs oficiais (Perplexity AI, Anthropic, OpenAI, Groq, Google)
Validação: 16 entidades fictícias inseridas para detectar falsos positivos
Atribuição named (100%): menção pelo nome próprio, não apenas link
Análise de sentimento: classificador automático (3 classes)
Ver Papers Roadmap completo →

Snapshot gerado em 18 de junho de 2026 às 21:05 (BRT) · Última coleta 18 de junho de 2026 às 21:05 · Fonte ao vivo via GitHub (ISR 10min)

Papers Roadmap · Artigos · Insights

Perguntas frequentes

Sobre a metodologia e os dados desta pesquisa.

Como os dados desta pesquisa são coletados?

Cada LLM (ChatGPT, Claude, Gemini, Perplexity e Groq) recebe as mesmas queries estruturadas em 4 verticais (Fintech, Saúde, Tecnologia e Varejo). As respostas são processadas automaticamente pelo pipelinepapers.db, que identifica menções a cada uma das 127 entidades monitoradas e registra se houve citação ou não. A coleta ocorre diariamente às 06:00 BRT e os dados são publicados nesta página via ISR a cada 24 horas.

O que significa a taxa de citação de 35,2%?

A taxa de citação geral representa a proporção de queries em que ao menos uma das entidades monitoradas foi mencionada na resposta do modelo. O valor atual de 35,2% indica que, na maioria das perguntas feitas aos LLMs, alguma empresa brasileira do painel foi referenciada espontaneamente na resposta — sem nenhum prompt que forçasse a menção. A amostra inclui 63.940 queries acumuladas em 42 dias de coleta, e verticais com maior cobertura editorial tendem a apresentar taxas superiores.

Por que alguns LLMs citam mais do que outros?

A frequência de citação varia conforme o volume de dados de treinamento de cada modelo, a data de corte do conhecimento e a arquitetura de busca (modelos com RAG, como o Perplexity, costumam recuperar fontes mais recentes). Empresas com maior presença em fontes de alta autoridade — portais especializados, notícias de grande circulação e repositórios acadêmicos — tendem a ser citadas com mais frequência por todos os modelos avaliados.

Os modelos usados na coleta mudam ao longo do tempo?

Sim, e cada mudança é registrada. Cada observação grava a versão exata do modelo que a gerou (model_version), permitindo segmentar a análise por versão e tratar a não-estacionariedade dos LLMs de forma estatisticamente correta. Em 17 de junho de 2026, a coleta do Gemini passou do modelo 2.5 Pro para o 2.5 Flash, com o raciocínio interno (“thinking”) desligado — uma otimização de custo (FinOps) que reduz a despesa por observação sem afetar a detecção de citação. A mudança é forward-only: dados anteriores permanecem intactos e identificados pela versão de modelo correspondente, preservando a integridade da série longitudinal.

Como posso aumentar a visibilidade da minha empresa nestes LLMs?

A disciplina responsável por isso é a GEO — Generative Engine Optimization. Ela envolve estruturação semântica de conteúdo, construção de autoridade editorial em fontes rastreadas pelos modelos, otimização de schema markup e estratégias de citação cruzada. Ofereço um diagnóstico gratuito de 45 minutos para mapear a situação atual da sua empresa e definir um plano de ação priorizado.

Janela confirmatória v2 · em andamentoDia 58 de 90

Estamos no dia 58 de 90 da janela confirmatória v2

Progresso da janela64% · 32 dias restantes

2026-04-23Dia 3 (H1)Dia 38 (H2)2026-07-21

Observações acumuladas

63.940

Rodadas de coleta

240

Próxima atualização

06:00 BRT

Como o dataset cresce

Marcos da janela:

Dia 3 (25/04/2026): potência estatística de H1 (vantagem RAG) — ✓ atingido
Dia 38 (30/05/2026): potência estatística de H2 (probe fictícia) — ✓ atingido
Dia 90 (21/07/2026): fechamento da janela e congelamento do dataset — previsto
Outubro/2026: submissão do Paper 5 à Elsevier (Information Sciences)

Metodologia v2 · reboot 2026-04-2378/78 tests green

Reimplementação algorítmica completa

NER v2 (entity extraction)
Normalização Unicode NFC+NFKD, regex com word-boundary rigoroso, aliases canônicos e stop-contexts. Redução de 45% em falsos positivos sobre dataset histórico.
Cluster-robust inference (CR1)
Sandwich estimator com cross-group covariance para diff-of-proportions sobre clusters temporais (dias).
Null simulation empírica
Distribuição Monte Carlo de Jaccard sob H0 de uniformidade, substituindo threshold arbitrário por P5 empírico.
Power analysis pré-registrada
Rule-of-Three inverse (probe fictício), Cohen's h para diff-proportions, design-effect adjustment por correlação intra-cluster.
GLMM hierárquico
BinomialBayesMixedGLM com random intercepts aninhados (query, day, entity) para partição correta de variância.
Cohort científica v2
79 entidades BR reais (4 verticais) + 32 âncoras internacionais de calibração + 16 decoys fictícios para FPR via alucinação — 127 entidades monitoradas no total.
Query battery balanceada
192 queries com balanceamento 50/50 idioma (PT/EN) e tipo (directive/exploratory), cobertura 4 verticais × 6 categorias × 2 temporal.
Hypothesis engine (BH-FDR)
Benjamini-Hochberg automático + decision rule pré-registrada (reject iff BH-adjusted p<0,05 AND 95% CI exclui null).
Reprodutibilidade bit-para-bit
Docker image pinada + PYTHONHASHSEED fixo + SHA-256 manifest de outputs via scripts/reproduce.sh contra git tag.
Test coverage 78/78
Suite automatizada cobrindo os seis módulos analíticos do v2 (NER, CR1, null-sim, power, GLMM, hypothesis-engine).

METHODOLOGY_V2.md →CHANGELOG →Paper 4 · DOI Zenodo →Roadmap completo →

RUMO AO PAPER 5 · ALVO ELSEVIER

63.940 / 100.000 queries coletadas

Janela confirmatória 90d sobre infraestrutura v2 · encerra 22 de julho de 2026 — faltam 34 dias

Pré-registro OSF v2 · dataset Zenodo DOI separado · Cohen's κ inter-rater (200 rows)

63.9% do dataset alvo

Coleta 2x/dia · 5 LLMs · 4 verticais · Atualizado 18 de junho de 2026 às 21:05

Visão geral

Queries totais

63.940

42 dias de coleta · 240 rounds

Citações encontradas

22.516

35.2% (IC 95%: 34.8%–35.6%)

Entidades monitoradas

127

111 reais + 16 fictícias

Specificity (calibração)

100.0%

0/51317 menções a fictícias

Última coleta

hoje

19/06/2026

Verificação de variação semanal

Taxa estável — queda de contagem é volume

Janela anterior

2026-05-28 a 2026-06-04

37,0%

4.770 citações / 12.883 queries

Janela atual

2026-06-05 a 2026-06-19

38,3%

4.098 citações / 10.688 queries

Variação da taxa:+1,32 pp(+3,6% relativo)

Garantia (teste z de 2 proporções): diferença estatisticamente significativa a 95% (|z| = 2.08). A taxa da janela atual está fora do IC95 acumulado (34.8–35.6%).

De onde vem a variação de -672 citações

Decomposição shift-share: quanto é efeito de quantas queries foram coletadas, quanto é efeito da taxa por query.

Efeito de volume

-813

-2.195 queries na janela (-17%) à taxa anterior.

Efeito de taxa

+141

Mudança de propensão a citar, mantido o volume atual.

Taxa diária — últimos 14 dias (veja você mesmo)

2026-05-282026-06-19

Insights principais

Perplexity lidera

75.8%

Maior taxa de citação entre os 5 LLMs (4367 citadas em 5760 queries). Perplexity AI é o motor que mais cita marcas brasileiras hoje.

Fintech é o vertical mais citado

42.0%

16032 queries no vertical, 6732 com citação. Vertical com cobertura empírica robusta.

Nubank domina o ranking

3604 menções

Marca mais citada por LLMs em todo o dataset. 1.7× mais citações que o segundo colocado (Mercado Livre).

100% das atribuições são named

25107 / 25119

Atribuições nomeadas (vs apenas linkadas) indicam alta precisão das citações — LLMs mencionam empresas pelo nome próprio.

44.1% das citações no início

11071 / 25119

Posição privilegiada (primeiro tercil) na resposta gerada pelo LLM. Marcas citadas no início têm maior peso de leitura.

Movimentação semanal · todos os verticais

2026-06-13 a 2026-06-19 vs. 2026-06-06 a 2026-06-12

▼ Maior queda da semana

NubankFintech

436 → 59 citações (-377 · -87%)

Maiores altas

Maior ganho de citações vs. a semana anterior

Nenhuma entidade subiu nesta janela.

Maiores quedas

Maior perda de visibilidade vs. a semana anterior

1NubankFintech▼ -87%
436 → 59 (-377)
2FinPay SolutionsFintech▼ -87%
112 → 15 (-97)
3ShopNova DigitalVarejo▼ -87%
112 → 15 (-97)
4Amazon BrasilVarejo▼ -91%
46 → 4 (-42)
5BradescoFintech▼ -90%
38 → 4 (-34)
6InvolvesTecnologia▼ -88%
33 → 4 (-29)

+ 6 outras entidades fora do top 6

Novos no radar

Apareceram nos LLMs sem citações na semana anterior

Nenhuma entidade nova nesta janela.

▲ Defender quem subiu

Travar a persistência da citação: rodar os 25 prompts canônicos toda semana, mirar drift <20% em 30 dias.
Reforçar o Information Gain da página citada (dado proprietário, framework próprio) — é o que sustenta o lift.
Garantir Schema-content parity e dateModified real; redating vazio derruba o frescor.

▼ Reverter quem caiu

Checar Entity Boundary Drift (cos θ < 0,80 derruba o sinal): auditar Wikidata + 5 plataformas externas.
Buscar consenso multi-fonte (Wikipedia + Reddit + G2 + papers): 2,8× mais chance de citação cruzada.
Conferir parsing por crawler de IA: SSR + schema rendem 94% vs 23% de leitura; conteúdo só em JS some.

Estado da arte GEO · 2026

Como interpretar os movimentos — e o que fazer com eles

GEO Score · visibilidade

Posição da fonte na resposta + tokens atribuídos + frequência de citação. É o que esta página mede de forma longitudinal.

GEU Score · utilidade

Qualidade da citação + cobertura dos keypoints + coerência. Otimizar GEO sem degradar GEU — senão os engines penalizam.

Performance por LLM

Ordenado pela taxa de citação · 5 modelos

Perplexity

Perplexity AI

75.8%

Queries

5760

Citadas

4367

Latência média

3.0s

Modelo

sonar

Claude

Anthropic

42.0%

Queries

14554

Citadas

6112

Latência média

3.8s

Modelo

claude-haiku-4-5-20251001

ChatGPT

OpenAI

34.4%

Queries

14720

Citadas

5069

Latência média

5.9s

Modelo

gpt-4o-mini-2024-07-18

Groq

28.2%

Queries

14720

Citadas

4144

Latência média

1.8s

Modelo

llama-3.3-70b-versatile

Gemini

Google

19.9%

Queries

14186

Citadas

2824

Latência média

25.3s

Modelo

gemini-2.5-pro

Performance por Vertical

Fintech

42.0%de citação

16032 queries6732 citadas

Líder: Nubank

Varejo

39.2%de citação

16032 queries6283 citadas

Líder: Mercado Livre

Tecnologia

30.3%de citação

15898 queries4823 citadas

Líder: Totvs

Saúde

29.3%de citação

15978 queries4678 citadas

Líder: EMS

Matriz cruzada — LLM × Vertical

Identifica gaps de cobertura

Vertical / LLM	Perplexity	Claude	ChatGPT	Gemini	Groq
Fintech	86.5% n=1440	61.6% n=3680	35.4% n=3680	24.4% n=3552	28.6% n=3680
Saúde	69.5% n=1440	30.0% n=3626	26.6% n=3680	18.0% n=3552	26.5% n=3680
Tecnologia	54.4% n=1440	30.1% n=3568	37.2% n=3680	17.7% n=3530	26.4% n=3680
Varejo	92.8% n=1440	45.8% n=3680	38.6% n=3680	19.5% n=3552	31.1% n=3680

Células com borda tracejada têm amostra abaixo de 30 (n<30) — resultado estatisticamente não-confiável. Ver avisos abaixo.

Top entidades citadas

Ranking absoluto · 30 entidades com pelo menos 1 citação detectada

Nubank

3604

Mercado Livre

2084

Magazine Luiza

1907

Totvs

955

EMS

853

Americanas

795

FinPay Solutions

791

Banco Floresta Digital

782

PicPay

782

ShopNova Digital

779

DataBridge Brasil

764

MegaStore Brasil

737

TechNova Solutions

733

Clínica Horizonte Digital

728

HealthTech Brasil

722

Hypera Pharma

707

C6 Bank

631

Eurofarma

582

Amazon Brasil

578

Banco Inter

571

Bradesco

442

Casas Bahia

383

Aché

328

Neon

316

Mercado Pago

307

Itaú

292

Involves

278

CI&T

233

iFood

222

Stefanini

195

Catálogo completo · 111 empresas monitoradas

Roster canônico do projeto Papers · 4 verticais

Fintech & Bancos Digitais

16 empresas

19 com citação detectada (118.8% cobertura granular)

Nubank3604
PagBank162
Cielo5
Stone168
Banco Inter571
Mercado Pago307
Itaú292
Bradesco442
C6 Bank631
PicPay782
Ame Digital
Neon316
Original
BS2
Safra3
Banco Carrefour

Varejo & E-commerce

15 empresas

12 com citação detectada (80% cobertura granular)

Magazine Luiza1907
Casas Bahia383
Ponto Frio
Americanas795
Amazon Brasil578
Mercado Livre2084
Shopee Brasil
AliExpress Brasil
Leroy Merlin
Tok&Stok
Renner56
Riachuelo1
C&A Brasil
Centauro
Netshoes33

Saúde & Farmacêuticas

15 empresas

16 com citação detectada (106.7% cobertura granular)

Dasa92
Hapvida42
Unimed10
Eli Lilly Brasil
Raia Drogasil119
Fleury93
Rede D'Or3
Einstein126
Sírio-Libanês160
Eurofarma582
Aché328
EMS853
Hypera Pharma707
NotreDame Intermédica5
SulAmérica Saúde6

Tecnologia & TI

15 empresas

15 com citação detectada (100% cobertura granular)

Tivit58
Accenture Brasil4
Stefanini195
Totvs955
Linx16
Locaweb70
Positivo Tecnologia
Movile183
CI&T233
Vivo Empresas
Embraer
WEG
Natura &Co
iFood222
99

Qualidade dos dados

Sentimento das menções

Neutro19555 (77.8%)
Positivo5505 (21.9%)
Negativo59 (0.2%)

Tipo de atribuição

Nomeada (named)25107 (100.0%)
Apenas linkada12 (0.0%)

Posição na resposta

Início (1º tercil)11071 (44.1%)
Meio (2º tercil)8164 (32.5%)
Fim (3º tercil)5884 (23.4%)

FinOps — Custo da pesquisa

Gasto mensal

US$ 0.00

Limite mensal

US$ 100.00

0.00% do orçamento

Plataforma	Modelo	Gasto	Limite
ChatGPT	gpt-4o-mini	US$ 0.0000	US$ 15.00
Claude	claude-haiku-4-5	US$ 0.0000	US$ 20.00
Gemini	gemini-2.5-pro	US$ 0.0000	US$ 15.00
Perplexity	sonar	US$ 0.0000	US$ 25.00
Groq	llama-3.3-70b-versatile	US$ 0.0000	US$ 10.00

Série temporal de coleta

42 dias com dados · mediana 1703 queries/dia

23.5%

04-23

n=617

20.4%

04-24

n=1017

20.6%

04-25

n=1753

20.5%

04-26

n=1728

21%

04-27

n=1674

20.9%

04-28

n=1709

36.1%

04-29

n=888

36.8%

04-30

n=2184

42.7%

05-01

n=361

36.2%

05-04

n=759

38.5%

05-05

n=1481

37.4%

05-11

n=938

38%

05-12

n=911

37.8%

05-13

n=2250

38.1%

05-14

n=1088

36.3%

05-15

n=1168

36.8%

05-16

n=2454

37.8%

05-17

n=2092

34.7%

05-18

n=970

39.5%

05-19

n=1044

39%

05-20

n=1054

36.4%

05-21

n=2293

35.5%

05-22

n=2332

39%

05-23

n=1261

37%

05-24

n=2231

36.2%

05-25

n=2090

38.9%

05-26

n=1050

37.8%

05-27

n=972

36.5%

05-28

n=1703

38.1%

05-30

n=1978

37.2%

05-31

n=1130

37.5%

06-01

n=1761

36.6%

06-02

n=2241

37.2%

06-03

n=2233

36.1%

06-04

n=1837

41.4%

06-05

n=1728

36.3%

06-06

n=2163

38.4%

06-07

n=2202

38.2%

06-08

n=1986

38.6%

06-09

n=1489

35.1%

06-18

n=1018

61.8%

06-19

n=102

Taxa de citação por categoria de query

Qual tipo de pergunta dispara mais citações espontâneas? Ordenado pela taxa.

calibracao fp

96% (12120/12623)

comparativo

33.1% (3147/9520)

mercado

29.7% (2823/9504)

descoberta

27.6% (2624/9520)

confianca

12.5% (947/7600)

inovacao

8.7% (657/7579)

experiencia

2.6% (198/7594)

Português × Inglês — LLMs citam mais em qual idioma?

Inglês

37.2%

11.893 citadas / 31.970 queries

Português (BR)

33.2%

10.623 citadas / 31.970 queries

Distribuição de sentimento por LLM

ChatGPT

+798 · 3392 · −0

Claude

+1058 · 3829 · −13

Gemini

+80 · 1666 · −1

Groq

+127 · 2501 · −30

Perplexity

+3442 · 8167 · −15

Verde = positivo · cinza = neutro · vermelho = negativo · classificador automático de 3 classes

Latência de resposta por LLM

ChatGPT

5.9s

min 0.7s · max 164.2s

Claude

3.8s

min 1.0s · max 127.6s

Gemini

25.3s

min 0.7s · max 148.8s

Groq

1.8s

min 0.2s · max 7.6s

Perplexity

3.0s

min 1.6s · max 49.4s

Gap de cobertura — marcas do roster ainda não citadas

Oportunidade de GEO: marcas monitoradas que ainda não receberam menção espontânea dos LLMs em queries-alvo.

fintech (4 uncovered)

Ame DigitalOriginalBS2Banco Carrefour

varejo (7 uncovered)

Ponto FrioShopee BrasilAliExpress BrasilLeroy MerlinTok&StokC&A BrasilCentauro

saude (1 uncovered)

Eli Lilly Brasil

tecnologia (6 uncovered)

Positivo TecnologiaVivo EmpresasEmbraerWEGNatura &Co99

Avisos e metodologia

Limites estatísticos identificados

Top entidades concentradas em Fintech: reflete onde a metodologia foi calibrada inicialmente. Expansão para outros verticais em andamento.

Como os dados foram coletados

Fonte: papers.db (63940 queries dataset)
Pipeline: 7 módulos Python rodando contra APIs oficiais (Perplexity AI, Anthropic, OpenAI, Groq, Google)
Validação: 16 entidades fictícias inseridas para detectar falsos positivos
Atribuição named (100%): menção pelo nome próprio, não apenas link
Análise de sentimento: classificador automático (3 classes)
Ver Papers Roadmap completo →

Snapshot gerado em 18 de junho de 2026 às 21:05 (BRT) · Última coleta 18 de junho de 2026 às 21:05 · Fonte ao vivo via GitHub (ISR 10min)

Papers Roadmap · Artigos · Insights

Perguntas frequentes

Sobre a metodologia e os dados desta pesquisa.

Como os dados desta pesquisa são coletados?

O que significa a taxa de citação de 35,2%?

Por que alguns LLMs citam mais do que outros?

Os modelos usados na coleta mudam ao longo do tempo?

Como posso aumentar a visibilidade da minha empresa nestes LLMs?

Research Dashboard

Estamos no dia 58 de 90 da janela confirmatória v2

Como o dataset cresce

Reimplementação algorítmica completa

Visão geral

Verificação de variação semanal

Insights principais

Movimentação semanal · todos os verticais

Maiores altas

Maiores quedas

Novos no radar

Como interpretar os movimentos — e o que fazer com eles

Performance por LLM

Perplexity

Claude

ChatGPT

Groq

Gemini

Performance por Vertical

Fintech

Varejo

Tecnologia

Saúde

Matriz cruzada — LLM × Vertical

Top entidades citadas

Catálogo completo · 111 empresas monitoradas

Fintech & Bancos Digitais

Varejo & E-commerce

Saúde & Farmacêuticas

Tecnologia & TI

Qualidade dos dados

Sentimento das menções

Tipo de atribuição

Posição na resposta

FinOps — Custo da pesquisa

Série temporal de coleta

Taxa de citação por categoria de query

Português × Inglês — LLMs citam mais em qual idioma?

Distribuição de sentimento por LLM

Latência de resposta por LLM

Gap de cobertura — marcas do roster ainda não citadas

Avisos e metodologia

Limites estatísticos identificados

Como os dados foram coletados

Perguntas frequentes

Sua empresa aparece quando o cliente pergunta ao ChatGPT?

Research Dashboard

Estamos no dia 58 de 90 da janela confirmatória v2

Como o dataset cresce

Reimplementação algorítmica completa

Visão geral

Verificação de variação semanal

Insights principais

Movimentação semanal · todos os verticais

Maiores altas

Maiores quedas

Novos no radar

Como interpretar os movimentos — e o que fazer com eles

Performance por LLM

Perplexity

Claude

ChatGPT

Groq

Gemini

Performance por Vertical

Fintech

Varejo

Tecnologia

Saúde

Matriz cruzada — LLM × Vertical

Top entidades citadas

Catálogo completo · 111 empresas monitoradas

Fintech & Bancos Digitais

Varejo & E-commerce

Saúde & Farmacêuticas

Tecnologia & TI

Qualidade dos dados

Sentimento das menções

Tipo de atribuição

Posição na resposta