can be reduced to a single number,
e nesse número, vidas são apagadas?
Mas quais pacientes se beneficiaram? Os jovens ou os velhos? Aqueles com doença leve ou grave? Homens ou mulheres?
O agregado não pode responder.
Dentro da média, alguns pacientes foram salvos – e alguns foram prejudicados.
● Responders ● Non-responders
But who são os 30%? Sem dados individuais, não podemos identificar os que responderam dos que não responderam. Não podemos praticar precision medicine.
Não resumos. Não médias. Each patient, each tumor, each outcome.
What he discovered changed breast cancer treatment forever.
"Tamoxifen works."
But the individual data revealed:
Giving tamoxifen to ER− patients was useless.
No indivíduo, a verdade aparece.
É por isso que procuramos o paciente oculto.”
Esta é a meta-análise de dados de participantes individuais.
What is found when we look closer?
Aggregate Data (AD)
- Study-level summaries
- Tamanhos de efeito de publicações
- Mean age, % male, etc.
- Rápido e acessível
- Cannot see within-study variation
Dados de participantes individuais (IPD)
- Dados brutos em nível de paciente
- Every participant's characteristics
- Actual ages, actual outcomes
- Time-intensive to obtain
- Can see who responds and who doesn't
Trial A: Mean age 55 years, Effect size 0.70 (benefit)
Trial B: Mean age 75 years, Effect size 0.90 (less benefit)
Tempting conclusion: "The drug works better in younger patients."
But this could be completely wrong.
Perhaps in Trial A, older patients within that trial responded better. Perhaps in Trial B, younger patients within that trial responded better.
Você não pode saber sem dados individuais.
True Effect Modification
Test whether treatment effect varies by patient characteristics (age, biomarkers, disease severity)
Time-to-Event Analysis
Use actual survival curves, not just hazard ratios. Handle censoring properly.
Consistent Definitions
Standardize outcome definitions, exposure timing, covariate categories across studies
Subgroup Credibility
Testar interações dentro dos estudos, evitando a falácia ecológica
Individual data shows each tree.
Se você precisa saber quais árvores estão doentes—
you must walk among them."
gathered data on 170,000 patients
and answered questions no single trial could ask?
27 trials. 174,149 patients. Every baseline characteristic. Every cardiovascular event. Every death.
The published trials asked: "Do statins work?"
Os CTT perguntaram: "Para quem as estatinas funcionam?"
Mas as perguntas que você pode responder são vale o investimento.
Benefit Proportional to LDL Reduction
Every 1 mmol/L LDL reduction = 22% lower CV events. True across all subgroups.
No Age Threshold
Benefit continues even in patients >75 years (contradicting earlier AD analyses)
Primary Prevention Works
Patients without prior CVD benefit proportionally to their baseline risk
No Cancer Signal
As preocupações sobre as estatinas causarem câncer foram definitivamente refutadas com o acompanhamento do IPD
Trial A: "High risk" = 10-year CVD risk >20%
Trial B: "High risk" = Prior MI
Trial C: "High risk" = Diabetes
You cannot compare or combine what is defined differently.
IPD allowed the CTT to redefine everyone consistently.
O IPD fornece a tradução.
What seemed contradictory becomes clear:
the same truth, measured differently."
Os dados agregados levam weeks.
Quando vale o investimento?
Você deve buscar o IPD?
Time-to-Event Outcomes
Quando as curvas de sobrevivência são importantes, não apenas as taxas de risco finais. Quando você precisa lidar com a censura adequadamente.
Continuous Effect Modifiers
Testing whether treatment effect varies by age, BMI, biomarker level (not just "high" vs "low")
Outcome Definition Problems
Quando os ensaios definem os resultados de forma diferente e você precisa padronizar
Longer Follow-Up Available
Quando os experimentadores têm dados de acompanhamento não publicados que você deseja incluir
Sua pergunta principal é: “O benefício varia de acordo com a gravidade da doença e o momento do tratamento?”
Overall Treatment Effect
Quando sua única pergunta é "Funciona?" não "Para quem?"
Homogeneous Population
When trials enrolled similar patients and effect modification is unlikely
Binary Outcomes, Short Follow-up
Quando a censura não é um problema e os resultados são simples sim/não
IPD Unobtainable
Quando os avaliadores não compartilham, os dados são perdidos ou os recursos ficam indisponíveis
Mas cada pergunta sobre which individuals
exige a presença deles em seus dados."
Agora: você analisa isso como one combined dataset
or trial by trial, then combine?
Two-Stage Approach
- Stage 1: Analyze each trial separately
- Etapa 2: Meta-analisar os resultados
- Preserves trial structure
- Familiar (like standard MA)
- Cannot handle sparse data well
One-Stage Approach
- Analise todos os dados simultaneamente
- Mixed-effects regression model
- Efeitos aleatórios para agrupamento
- Melhor para dados esparsos
- More flexible modeling
Each trial's estimate is transparent.
Parcelas florestais familiares e eu2 statistics.
2. More powerful for detecting interactions
3. Can model complex covariate relationships
4. Exact likelihood (no normal approximations)
One-Stage or Two-Stage?
The one-stage hears all voices at once.
Quando os dados são escassos e os eventos são raros—
o de um estágio captura o que o de dois estágios perde."
que salvou vidas de bebês -
but only if given at the right time?
But a puzzle remained: When should they be given?
24 hours before birth? 48 hours? A week?
Published trials couldn't answer—they didn't report timing consistently.
Maximum benefit: 24 hours to 7 days before birth
Reduced benefit: >7 days (lung maturity effect fades)
No benefit: <24 hours (not enough time to work)
After IPD: Guidelines now recommend repeat dosing se o parto não ocorrer dentro de 7 dias após o primeiro curso.
Esta precisão – impossível sem dados individuais – tem saved thousands of premature babies.
Trial B reported: "Steroid given antenatally"
Trial C reported: "Steroid-to-delivery interval: median 3 days"
Different categories. Different definitions. Incompatible summaries.
Only by examining each baby's actual steroid-to-delivery time could the optimal window be identified.
But when dar era desconhecido.
IPD transformou 'algum dia' em 'momento certo' -
e nessa precisão, as crianças viviam."
Em algum lugar, em arquivos e bancos de dados,
a história de cada paciente é registrada.
A questão é: eles vão compartilhar isso?
This is expected. Plan for it.
Trialist Collaboration
Direct contact with trial investigators. Build relationships. Offer co-authorship.
Plataformas de compartilhamento de dados
YODA Project, ClinicalStudyDataRequest.com, Vivli, ICPSR
Regulatory Agencies
EMA Policy 0070, FDA (limited), Health Canada
Journal Requirements
Many journals now require data sharing; check supplementary materials
2. Offer co-authorship—make sharing worthwhile
3. Descreva a segurança dos dados—how you'll protect their patients
4. Forneça dicionários de dados—specify exactly what you need
5. Set clear timelines—respect their time
Industry trials: less likely to share
Negative trials: less likely to share
Older trials: data may be lost
Your IPD sample may be biased.
Will they share what they have guarded?
Construa a ponte com cuidado—
pois nessa ponte o futuro dos pacientes se cruza."
from twelve trials, five countries, three decades.
But Trial A calls it "cardiovascular death"
e o Teste B chama isso "cardiac mortality".
Eles são iguais?
Trial from USA: Age in decimal years (e.g., 65.7)
Teste do Reino Unido: faixas etárias ("65-74")
Diabetes: HbA1c ≥ 6.5% vs. fasting glucose ≥ 126 vs. "physician diagnosis"
Outcome: "Major adverse cardiac event" (one trial includes stroke, another doesn't)
Antes da análise: harmonize tudo.
Crie um dicionário de dados mestre
Define every variable you need: name, type, permitted values, derivation rules
Map Each Trial's Variables
Document how each trial's coding maps to your standardized definitions
Verifique com os avaliadores
Verifique suas interpretações. Eles conhecem seus dados melhor do que você.
Validate Transformations
Reproduzir resultados publicados do IPD. Se eles não corresponderem, investigue.
Seis ensaios utilizaram uma definição padrão (códigos CID). Dois ensaios da década de 1990 utilizaram “morte cardíaca avaliada pelo investigador” sem critérios padronizados. Esses dois ensaios mostram efeitos maiores do tratamento.
Reproduza os resultados publicados de cada ensaio do IPD.
Se sua análise fornecer RR = 0,78, mas a publicação disser RR = 0,85,
something is wrong.
Find the discrepancy. Fix it. Then proceed.
different ways to name the same disease.
Antes de você pode combinar, você deve traduzir.
Antes de traduzir, você deve entender."
Mas funciona da mesma forma para os jovens e os idosos?
Para os leves e os graves?
Para aquele com o biomarcador e aquele sem?
They asked: "Does the effect differ by estrogen receptor status?"
A interação foi massiva:
ER-positive: 47% reduction in recurrence
ER-negative: No benefit at all
O efeito do tratamento differs between subgroups defined by the covariate.
Se não: o efeito do tratamento é similar across subgroups (or you lack power to detect a difference).
Between-Study Interaction
- Compares trial-level averages
- Ecological fallacy risk
- Confounded by trial design
- Low statistical power
- Pode ser feito com dados agregados
Within-Study Interaction
- Compares patients within each trial
- No ecological fallacy
- Randomization preserved
- Much higher power
- Requires IPD
Este é o padrão ouro para modificação de efeito.
Você testou 8 modificadores de efeito potenciais em sua análise.
The interaction reveals who benefits.
Teste dentro de estudos, não entre—
pois é aí que a verdade está encontrado."
Quando você procura para predict who will die,
who will recover, who will relapse—
o indivíduo é tudo.
"Will they ever wake up?"
Individual trials were too small to develop accurate prediction models.
IMPACT reuniu IPD de 11 estudos, 9.205 pacientes, e construiu um modelo que prevê resultados de 6 meses a partir de características clínicas iniciais.
External Validation Across Populations
Develop in some studies, validate in others. True test of generalizability.
Non-linear Relationships
Explore how predictors relate to outcome: linear? threshold? U-shaped?
Multiple Predictor Interactions
Age + GCS + pupil reactivity may interact in ways aggregate data cannot reveal
Proper Handling of Missing Predictors
Imputação múltipla no nível do paciente, não no nível do estudo
TRIPOD
- Prediction model reporting
- Desenvolvimento e validação
- Calibração e discriminação
- 22 item checklist
PRISMA-IPD
- IPD meta-analysis reporting
- Aquisição de dados detalhes
- Harmonization process
- Integrity checking
Quando um paciente chega com lesão cerebral traumática, o modelo fornece um probability of survival and probability of favorable outcome.
Isso orienta as conversas com as famílias. Isso informa a intensidade do tratamento. Isso ajuda a alocar recursos de UTI.
Construído a partir de dados individuais. Atendendo pacientes individuais.
você deve aprender com milhares de passados.
O IPD guarda essas histórias—
each one a teacher, if you will listen."
que foi dado a millions para seus corações?
Eles eram disse: "Pegue isso e você estará protegido."
But was every heart equally in need of protection?
Researchers quickly re-identified users by matching ratings with public IMDb reviews.
One lawsuit alleged a closeted lesbian was outed through her viewing patterns.
The lesson: removing names isn't anonymization.
IPD contém combinações suficientes de idade, diagnóstico, resposta ao tratamento e datas para identificar exclusivamente indivíduos. A privacidade exige mais do que excluir a coluna de nome – requer a compreensão de como as combinações de dados se tornam impressões digitais.
The published trials said: "Aspirin prevents heart attacks."
Mas a ATT fez a pergunta proibida:
"Em qual custo? E para quem?"
2-3 heart attacks prevented
2-3 major bleeds caused
Os benefícios e danos são cancelados
Este paciente deve tomar aspirina para prevenção primária?
(benefit > harm)
(benefit ≈ harm)
(harm > benefit)
Eles não conseguiram mostrar que os pacientes de alto risco ganharam
while low-risk patients lost.
Only by examining each patient's baseline risk,
each patient's outcomes,
could the interaction be revealed.
Ele leu online que "aspirina previne ataques cardíacos" e quer seu conselho.
pode prejudicar o seguro.
Conheça o risco do seu paciente antes de prescrever.
Isso é o que os dados individuais nos ensinaram."
95,000 patients. One truth: risk determines benefit.
"Os velhos devem ser tratados da mesma forma que os jovens?"
Some said: "Lower is always better."
Outros disseram: "Os velhos são frágeis. Seja cauteloso."
Quem estava certo?
O acampamento agressivo: "Every mmHg of BP reduction saves lives.
Treat everyone to target 120/80."
O acampamento conservador: "In the elderly, low BP causes falls, strokes, death.
There's a J-curve—too low is dangerous."
Individual trials were too small to settle it. Até que o BPLTTC recolheu os dados individuais.
Is there a J-curve at very low pressures?
Do the very old (>80 years) still benefit?
Age 55-64: 10% lower major CV events
Age 65-74: 10% lower major CV events
Age 75-84: 10% lower major CV events
Age ≥85: Still 10% lower
pinteraction = 0,85. Nenhuma evidência de modificação de idade.
who achieved very low blood pressures.
Result: No J-curve in randomized comparisons.
A aparente curva J nos dados observacionais foi reverse causation— sick patients have low BP because they're sick, not sick because their BP is low.
Somente o IPD dos ECRs poderia desvendar isso.
Should This Elderly Patient Get BP Treatment?
Proportional benefit maintained across all ages
Consider frailty, life expectancy, patient preference—but not age.
Você se lembra da meta-análise BPLTTC IPD.
Mas os dados individuais mostraram o contrário:
At every age, the benefit endures.
Do not let age alone deny protection."
when a clot blocks the brain?
Every minute, two million neurons die.
But when does the window close?
When is it too late to intervene?
But given too late, it causes bleeding into dying brain tissue.
What is the time window? 3 hours? 4.5 hours? 6 hours?
Individual trials disagreed. Guidelines were uncertain.
They knew exactly when each patient's stroke began. They knew exactly when thrombolysis was given. They knew exactly who lived, who died, who recovered.
They could map benefit against time, minute by minute.
Treated at 90 min: 1 in 4 achieve excellent outcome
Treated at 180 min: 1 in 7 achieve excellent outcome
Treated at 270 min: 1 in 14 achieve excellent outcome
Acute Ischemic Stroke: Give Thrombolysis?
URGENTLY
if eligible
imaging
avoid
Trial B: "Patients treated within 6 hours" (average: 4.2 hours)
These overlapping, inconsistent windows couldn't be compared.
Only by knowing each patient's exact time
could the continuous decay of benefit be mapped.
Door-to-needle time will add 30 minutes, making total time ~4.5 hours.
two million neurons perish.
O IPD nos mostrou a janela de esmaecimento.
Act quickly, or the window closes forever."
Você abre os arquivos com esperança.
E então você vê: empty cells.
Age: 67. Sex: Male. Smoking status: missing.
Outcome at 1 year: missing.
What now?
Missing Completely at Random (MCAR)
Lab machine broke randomly. No relation to patient characteristics. Safe to ignore (but wasteful).
Missing at Random (MAR)
Older patients more likely to miss follow-up. Missingness related to observed variables. Imputation can help.
Desaparecido não aleatoriamente (MNAR)
Pacientes com maus resultados desistem. Falta relacionada ao missing value itself. Perigoso. Requer análise de sensibilidade.
O que fazer com valores ausentes?
may suffice
imputation
sensitivity
Multiple imputation (M=20-50 datasets) reflects uncertainty sobre qual pode ter sido o valor ausente.
Isso preserva erros padrão válidos e valores p.
Systematically Missing Variables
Trial A measured biomarker X. Trial B didn't. Can't impute what was never collected.
Multilevel Structure
Patients nested within trials. Imputation model must account for clustering.
Different Follow-up Durations
Teste A seguido por 2 anos. Teste B por 5 anos. A análise de sobrevivência precisa de cuidados.
Trial Didn't Collect Your Key Covariate
analysis to trials
com a variável
varying assumptions
about unmeasured
Esses 3 ensaios tendem a ser mais antigos e menores.
It is a question: Por que isso é desconhecido?
Responda a essa pergunta antes de preencher o lacuna—
para o motivo da ausência molda a solução."
que reuniu dados de willing trialists
e declarou vitória?
But the unwilling held secrets.
E esses segredos mudaram tudo.
Cochrane reviewers requested trial data to verify efficacy. Roche refused, citing confidentiality.
Durante cinco anos, o BMJ fez campanha pela transparência. Quando os relatórios completos dos estudos clínicos foram finalmente divulgados em 2014, o quadro mudou: o Tamiflu reduziu a duração dos sintomas em menos de um dia e não evitou complicações.
Bilhões gastos em um medicamento cujas evidências completas foram trancadas.
A saga Tamiflu transformou as expectativas – hoje, a transparência dos ensaios clínicos está se tornando a norma, não a exceção.
Industry-sponsored trials: Less likely to share
Ensaios com resultados negativos: Less likely to share
Older trials: Dados frequentemente perdidos
If these trials systematically differ in effect size,
seu IPD-MA é tendencioso.<
Assessing Availability Bias
for bias
Sensibilidade análise necessária
Report IPD retrieval rate
"Obtivemos IPD de 12/15 ensaios (80%)"
Compare IPD vs. non-IPD trial characteristics
Tamanho da amostra, financiamento, data de publicação, tamanho do efeito do agregado dados
Sensitivity analysis including non-IPD trials
Análise de dois estágios combinando IPD + AD de ensaios sem compartilhamento
Discuta os motivos para o não compartilhamento
Data lost? Refused? Never requested? Each has different implications.
Sua análise de IPD mostra OR 0,70.
Use IPD onde você o possui (para testes de interação).
Suplemento com AD para estimativa de efeito geral.
Transparência sobre o que veio de onde veio onde.
As portas abertas podem esconder a verdade atrás das trancadas.
Always ask: Who refused to share?
And what might they be hiding?"
Principais fontes citadas neste Curso
- Riley RD, et al. Meta-análise de dados de participantes individuais: um manual para pesquisas em saúde. Wiley, 2021.
- Stewart LA, et al. PRISMA-IPD: Itens de relatório preferidos para revisões sistemáticas e meta-análises de dados de participantes individuais. JAMA 2015;313:1657-65.
- Early Breast Cancer Trialists' Collaborative Group. Tamoxifen for early breast cancer. Cochrane Database Syst Rev 2001.
- Cholesterol Treatment Trialists' Collaboration. Efficacy and safety of LDL-lowering therapy. Lancet 2010;376:1670-81.
- Roberts D, et al. Antenatal corticosteroids for accelerating fetal lung maturation. Cochrane Database Syst Rev 2017.
- IMPACT Study Group. Predicting outcome after traumatic brain injury. PLoS Med 2008;5:e165.
- Debray TPA, et al. Get real in individual participant data meta-analysis. Int J Epidemiol 2015;44:1287-97.
- Burke DL, et al. Meta-analysis using individual participant data. Stat Med 2017;36:320-38.
But you have learned to find them.
You have learned to ask: Who benefits? Who is harmed?
Agora vá - e não deixe nenhum paciente desaparecer na média.
O paciente oculto - agora você os vê.