can be reduced to a single number,
e in quel numero, vite vengono cancellate?
Ma quali pazienti ne hanno beneficiato? I giovani o gli anziani? Quelli con malattia lieve o grave? Uomini o donne?
L'aggregato non può rispondere.
In media, alcuni pazienti sono stati salvati e altri sono stati danneggiati.
● Responders ● Non-responders
But who sono il 30%? Senza dati individuali, non possiamo identificare i rispondenti dai non rispondenti. Non possiamo esercitarci precision medicine.
Non con riassunti. Non medie. Each patient, each tumor, each outcome.
What he discovered changed breast cancer treatment forever.
"Tamoxifen works."
But the individual data revealed:
Giving tamoxifen to ER− patients was useless.
Nell'individuo, la verità appare.
Ecco perché cerchiamo il paziente nascosto."
Questa è la meta-analisi dei dati dei singoli partecipanti.
What is found when we look closer?
Aggregate Data (AD)
- Study-level summaries
- Dimensioni degli effetti dalle pubblicazioni
- Mean age, % male, etc.
- Rapido e accessibile
- Cannot see within-study variation
Dati individuali dei partecipanti (IPD)
- Dati grezzi a livello di paziente
- Every participant's characteristics
- Actual ages, actual outcomes
- Time-intensive to obtain
- Can see who responds and who doesn't
Trial A: Mean age 55 years, Effect size 0.70 (benefit)
Trial B: Mean age 75 years, Effect size 0.90 (less benefit)
Tempting conclusion: "The drug works better in younger patients."
But this could be completely wrong.
Perhaps in Trial A, older patients within that trial responded better. Perhaps in Trial B, younger patients within that trial responded better.
Non è possibile saperlo senza l'individuo dati.
True Effect Modification
Test whether treatment effect varies by patient characteristics (age, biomarkers, disease severity)
Time-to-Event Analysis
Use actual survival curves, not just hazard ratios. Handle censoring properly.
Consistent Definitions
Standardize outcome definitions, exposure timing, covariate categories across studies
Subgroup Credibility
Testare le interazioni all'interno degli studi, evitando l'errore ecologico
Individual data shows each tree.
Se hai bisogno di sapere quali alberi sono malato—
you must walk among them."
gathered data on 170,000 patients
and answered questions no single trial could ask?
27 trials. 174,149 patients. Every baseline characteristic. Every cardiovascular event. Every death.
The published trials asked: "Do statins work?"
Il CTT ha chiesto: "Per chi funzionano le statine?"
Ma le domande a cui puoi rispondere vale l'investimento.
Benefit Proportional to LDL Reduction
Every 1 mmol/L LDL reduction = 22% lower CV events. True across all subgroups.
No Age Threshold
Benefit continues even in patients >75 years (contradicting earlier AD analyses)
Primary Prevention Works
Patients without prior CVD benefit proportionally to their baseline risk
No Cancer Signal
Le preoccupazioni sulle statine che causano il cancro sono state definitivamente confutate con il follow-up dell'IPD
Trial A: "High risk" = 10-year CVD risk >20%
Trial B: "High risk" = Prior MI
Trial C: "High risk" = Diabetes
You cannot compare or combine what is defined differently.
IPD allowed the CTT to redefine everyone consistently.
IPD fornisce la traduzione.
What seemed contradictory becomes clear:
the same truth, measured differently."
I dati aggregati richiedono weeks.
Quando vale la pena investire?
Dovresti perseguire l'IPD?
Time-to-Event Outcomes
Quando le curve di sopravvivenza contano, non solo gli rapporti di rischio finali.
Continuous Effect Modifiers
Testing whether treatment effect varies by age, BMI, biomarker level (not just "high" vs "low")
Outcome Definition Problems
Quando gli studi clinici definiscono i risultati in modo diverso e ne hai bisogno. standardizzare
Longer Follow-Up Available
Quando gli sperimentatori hanno dati di follow-up non pubblicati che si desidera includere
La tua domanda chiave è: "I benefici variano in base alla gravità della malattia e ai tempi del trattamento?"
Overall Treatment Effect
Quando la tua unica domanda è "Funziona?" non "Per chi?"
Homogeneous Population
When trials enrolled similar patients and effect modification is unlikely
Binary Outcomes, Short Follow-up
Quando la censura non è un problema e i risultati sono semplici sì/no
IPD Unobtainable
Quando i trialisti non condividono, i dati vengono persi o le risorse non sono disponibili
Ma ogni domanda su which individuals
richiede la loro presenza nei tuoi dati."
Ora: analizzarli come one combined dataset
or trial by trial, then combine?
Two-Stage Approach
- Stage 1: Analyze each trial separately
- Fase 2: meta-analizzare i risultati
- Preserves trial structure
- Familiar (like standard MA)
- Cannot handle sparse data well
One-Stage Approach
- Analizzare tutti i dati contemporaneamente
- Mixed-effects regression model
- Effetti casuali per clustering
- Meglio per dati sparsi
- More flexible modeling
Each trial's estimate is transparent.
Familiare forest plot e io2 statistics.
2. More powerful for detecting interactions
3. Can model complex covariate relationships
4. Exact likelihood (no normal approximations)
One-Stage or Two-Stage?
The one-stage hears all voices at once.
Quando i dati sono scarsi e gli eventi sono rari—
il one-stage coglie ciò che il due-stage manca."
che ha salvato la vita dei bambini—
but only if given at the right time?
But a puzzle remained: When should they be given?
24 hours before birth? 48 hours? A week?
Published trials couldn't answer—they didn't report timing consistently.
Maximum benefit: 24 hours to 7 days before birth
Reduced benefit: >7 days (lung maturity effect fades)
No benefit: <24 hours (not enough time to work)
After IPD: Guidelines now recommend repeat dosing se il parto non è avvenuto entro 7 giorni dal primo corso.
Questa precisione, impossibile senza dati individuali, ha saved thousands of premature babies.
Trial B reported: "Steroid given antenatally"
Trial C reported: "Steroid-to-delivery interval: median 3 days"
Different categories. Different definitions. Incompatible summaries.
Only by examining each baby's actual steroid-to-delivery time could the optimal window be identified.
But when darlo era sconosciuto.
IPD ha trasformato 'qualche volta' in 'il momento giusto'—
e in quella precisione, i bambini vivevano."
Da qualche parte, in file e database,
la storia di ogni paziente viene registrata.
La domanda è: la condivideranno?
This is expected. Plan for it.
Trialist Collaboration
Direct contact with trial investigators. Build relationships. Offer co-authorship.
Piattaforme di condivisione dei dati
YODA Project, ClinicalStudyDataRequest.com, Vivli, ICPSR
Regulatory Agencies
EMA Policy 0070, FDA (limited), Health Canada
Journal Requirements
Many journals now require data sharing; check supplementary materials
2. Offer co-authorship—make sharing worthwhile
3. Descrivere la sicurezza dei dati—how you'll protect their patients
4. Fornire dizionari di dati—specify exactly what you need
5. Set clear timelines—respect their time
Industry trials: less likely to share
Negative trials: less likely to share
Older trials: data may be lost
Your IPD sample may be biased.
Will they share what they have guarded?
Costruire il ponte con attenzione—
perché su quel ponte si incrociano i futuri dei pazienti."
from twelve trials, five countries, three decades.
But Trial A calls it "cardiovascular death"
e la prova B lo chiama "cardiac mortality".
Sono la stessa cosa?
Trial from USA: Age in decimal years (e.g., 65.7)
Prova dal Regno Unito: Età ("65-74")
Diabetes: HbA1c ≥ 6.5% vs. fasting glucose ≥ 126 vs. "physician diagnosis"
Outcome: "Major adverse cardiac event" (one trial includes stroke, another doesn't)
Prima dell'analisi: armonizzare tutto.
Creare un dato principale Dizionario
Define every variable you need: name, type, permitted values, derivation rules
Map Each Trial's Variables
Document how each trial's coding maps to your standardized definitions
Verifica con i trialisti
Verifica le tue interpretazioni. Conoscono i loro dati meglio di te.
Validate Transformations
Riproduci i risultati pubblicati dall'IPD. Se non corrispondono, indaga.
Sei studi hanno utilizzato una definizione standard (codici ICD). Due studi degli anni '90 hanno utilizzato la "morte cardiaca valutata dallo sperimentatore" senza criteri standardizzati. Questi due studi mostrano effetti del trattamento più ampi.
Riproduci i risultati pubblicati di ogni studio dall'IPD.
Se la tua analisi dà RR = 0,78 ma la pubblicazione dice RR = 0,85,
something is wrong.
Find the discrepancy. Fix it. Then proceed.
different ways to name the same disease.
Prima di poter combinare, devi tradurre.
Prima di tradurre, devi capire."
Ma funziona allo stesso modo per i giovani e gli anziani?
Per quelli lievi e quelli gravi?
Per quello con il biomarcatore e quello senza?
They asked: "Does the effect differ by estrogen receptor status?"
L'interazione è stata massiccia:
ER-positive: 47% reduction in recurrence
ER-negative: No benefit at all
L'effetto del trattamento differs between subgroups defined by the covariate.
In caso contrario: l'effetto del trattamento è similar across subgroups (or you lack power to detect a difference).
Between-Study Interaction
- Compares trial-level averages
- Ecological fallacy risk
- Confounded by trial design
- Low statistical power
- Si può fare con dati aggregati
Within-Study Interaction
- Compares patients within each trial
- No ecological fallacy
- Randomization preserved
- Much higher power
- Requires IPD
Questo è il gold standard per la modifica degli effetti.
Hai testato 8 potenziali modificatori dell'effetto nella tua analisi.
The interaction reveals who benefits.
Testare nell'ambito degli studi, non tra—
perché è lì che si trova la verità."
Quando si cerca predict who will die,
who will recover, who will relapse—
l'individuo è tutto.
"Will they ever wake up?"
Individual trials were too small to develop accurate prediction models.
IMPACT ha raccolto IPD da 11 studi, 9.205 pazienti e ha costruito un modello che prevede i risultati a 6 mesi dalle caratteristiche cliniche iniziali.
External Validation Across Populations
Develop in some studies, validate in others. True test of generalizability.
Non-linear Relationships
Explore how predictors relate to outcome: linear? threshold? U-shaped?
Multiple Predictor Interactions
Age + GCS + pupil reactivity may interact in ways aggregate data cannot reveal
Proper Handling of Missing Predictors
Imputazione multipla a livello del paziente, non a livello di studio
TRIPOD
- Prediction model reporting
- Sviluppo e validazione
- Calibrazione e discriminazione
- 22 item checklist
PRISMA-IPD
- IPD meta-analysis reporting
- Dettagli acquisizione dati
- Harmonization process
- Integrity checking
Quando arriva un paziente con una lesione cerebrale traumatica, il modello fornisce un probability of survival and probability of favorable outcome.
Questo guida le conversazioni con le famiglie. Questo informa l'intensità del trattamento. Questo aiuta ad allocare le risorse di terapia intensiva.
Costruito da dati individuali. Al servizio dei singoli pazienti.
devi imparare da migliaia di passato.
IPD racchiude queste storie—
each one a teacher, if you will listen."
che è stata data a millions per i loro cuori?
Erano detto: "Prendi questo e sarai protetto."
But was every heart equally in need of protection?
Researchers quickly re-identified users by matching ratings with public IMDb reviews.
One lawsuit alleged a closeted lesbian was outed through her viewing patterns.
The lesson: removing names isn't anonymization.
IPD contiene sufficienti combinazioni di età, diagnosi, risposta al trattamento e date per identificare in modo univoco individui. La privacy richiede qualcosa di più che eliminare la colonna del nome: richiede di comprendere come le combinazioni di dati diventano impronte digitali.
The published trials said: "Aspirin prevents heart attacks."
Ma l'ATT ha chiesto il proibito domanda:
"A quale costo? E per chi?"
2-3 heart attacks prevented
2-3 major bleeds caused
I benefici e i danni si annullano.
Questo paziente dovrebbe assumere l'aspirina per la terapia primaria Prevenzione?
(benefit > harm)
(benefit ≈ harm)
(harm > benefit)
Non sono riusciti a dimostrare che i pazienti ad alto rischio hanno guadagnato
while low-risk patients lost.
Only by examining each patient's baseline risk,
each patient's outcomes,
could the interaction be revealed.
Ha letto online che "l'aspirina previene gli attacchi di cuore" e vuole il tuo consiglio.
può nuocere sicuro.
Conosci il rischio del tuo paziente prima di prescrivere.
Questo è ciò che ci hanno insegnato i dati individuali."
95,000 patients. One truth: risk determines benefit.
"I vecchi dovrebbero essere trattati allo stesso modo dei giovani?"
Some said: "Lower is always better."
Altri dicevano: "I vecchi sono fragili. Sii prudente."
Chi aveva ragione?
Il campo aggressivo: "Every mmHg of BP reduction saves lives.
Treat everyone to target 120/80."
Il campo conservatore Campo: "In the elderly, low BP causes falls, strokes, death.
There's a J-curve—too low is dangerous."
Individual trials were too small to settle it. Fino a quando il BPLTTC ha raccolto i dati individuali.
Is there a J-curve at very low pressures?
Do the very old (>80 years) still benefit?
Age 55-64: 10% lower major CV events
Age 65-74: 10% lower major CV events
Age 75-84: 10% lower major CV events
Age ≥85: Still 10% lower
pinteraction = 0,85. Nessuna prova di modificazione dell'età.
who achieved very low blood pressures.
Result: No J-curve in randomized comparisons.
L'apparente curva J nei dati osservazionali era reverse causation— sick patients have low BP because they're sick, not sick because their BP is low.
Solo l'IPD degli RCT poteva districare questo problema.
Should This Elderly Patient Get BP Treatment?
Proportional benefit maintained across all ages
Consider frailty, life expectancy, patient preference—but not age.
Ricordi la meta-analisi BPLTTC IPD.
Ma i dati individuali mostravano il contrario:
At every age, the benefit endures.
Do not let age alone deny protection."
when a clot blocks the brain?
Every minute, two million neurons die.
But when does the window close?
When is it too late to intervene?
But given too late, it causes bleeding into dying brain tissue.
What is the time window? 3 hours? 4.5 hours? 6 hours?
Individual trials disagreed. Guidelines were uncertain.
They knew exactly when each patient's stroke began. They knew exactly when thrombolysis was given. They knew exactly who lived, who died, who recovered.
They could map benefit against time, minute by minute.
Treated at 90 min: 1 in 4 achieve excellent outcome
Treated at 180 min: 1 in 7 achieve excellent outcome
Treated at 270 min: 1 in 14 achieve excellent outcome
Acute Ischemic Stroke: Give Thrombolysis?
URGENTLY
if eligible
imaging
avoid
Trial B: "Patients treated within 6 hours" (average: 4.2 hours)
These overlapping, inconsistent windows couldn't be compared.
Only by knowing each patient's exact time
could the continuous decay of benefit be mapped.
Door-to-needle time will add 30 minutes, making total time ~4.5 hours.
two million neurons perish.
L'IPD ci ha mostrato la finestra in dissolvenza.
Act quickly, or the window closes forever."
Apri i file con speranza.
E poi vedi: empty cells.
Age: 67. Sex: Male. Smoking status: missing.
Outcome at 1 year: missing.
What now?
Missing Completely at Random (MCAR)
Lab machine broke randomly. No relation to patient characteristics. Safe to ignore (but wasteful).
Missing at Random (MAR)
Older patients more likely to miss follow-up. Missingness related to observed variables. Imputation can help.
Mancante non casuale (MNAR)
I pazienti con risultati scadenti abbandonano. Mancanza relativa al missing value itself. Pericoloso. Richiede un'analisi di sensibilità.
Cosa fare con i valori mancanti?
may suffice
imputation
sensitivity
Multiple imputation (M=20-50 datasets) reflects uncertainty su quale potrebbe essere stato il valore mancante.
Ciò preserva errori standard e valori p validi.
Systematically Missing Variables
Trial A measured biomarker X. Trial B didn't. Can't impute what was never collected.
Multilevel Structure
Patients nested within trials. Imputation model must account for clustering.
Different Follow-up Durations
Prova A seguita per 2 anni. Prova B per 5 anni. L'analisi della sopravvivenza ha bisogno di cure.
Trial Didn't Collect Your Key Covariate
analysis to trials
con la variabile
varying assumptions
about unmeasured
Questi 3 studi tendono ad essere più vecchi e più piccoli.
It is a question: Perché questo è sconosciuto?
Rispondi a questa domanda prima di riempire la gap—
per il motivo dell'assenza modella la soluzione."
che ha raccolto dati willing trialists
e ha dichiarato la vittoria?
But the unwilling held secrets.
E quei segreti hanno cambiato tutto.
Cochrane reviewers requested trial data to verify efficacy. Roche refused, citing confidentiality.
Per cinque anni, il BMJ ha condotto una campagna per la trasparenza. Quando i rapporti completi sugli studi clinici furono finalmente pubblicati nel 2014, il quadro cambiò: il Tamiflu ridusse la durata dei sintomi di meno di un giorno e non prevenne le complicanze.
Miliardi spesi per un farmaco le cui prove complete erano tenute nascoste.
La saga del Tamiflu ha trasformato le aspettative: oggi, la trasparenza degli studi clinici sta diventando la norma, non l'eccezione.
Industry-sponsored trials: Less likely to share
Prove con risultati negativi: Less likely to share
Older trials: Dati spesso persi
If these trials systematically differ in effect size,
il tuo IPD-MA è distorto.
Assessing Availability Bias
for bias
Analisi di sensibilità necessaria
Report IPD retrieval rate
"Abbiamo ottenuto IPD da 12/15 prove (80%)"
Compare IPD vs. non-IPD trial characteristics
Dimensione del campione, finanziamento, data di pubblicazione, dimensione dell'effetto dai dati aggregati
Sensitivity analysis including non-IPD trials
Analisi in due fasi che combina IPD + AD da studi senza condivisione
Discutere le ragioni della non condivisione
Data lost? Refused? Never requested? Each has different implications.
La tua analisi IPD mostra OR 0,70.
Utilizza IPD dove disponibile (per test di interazione).
Supplemento con AD per la stima dell'effetto complessivo.
Trasparenza su ciò che deriva dove.
Le porte aperte potrebbero nascondere la verità dietro quelle chiuse.
Always ask: Who refused to share?
And what might they be hiding?"
Fonti chiave citate in questo Corso
- Riley RD, et al. Meta-analisi dei dati dei singoli partecipanti: un manuale per la ricerca sanitaria. Wiley, 2021.
- Stewart LA, et al PRISMA-IPD: Elementi di reporting preferiti per revisioni sistematiche e meta-analisi dei dati dei singoli partecipanti. JAMA 2015;313:1657-65.
- Early Breast Cancer Trialists' Collaborative Group. Tamoxifen for early breast cancer. Cochrane Database Syst Rev 2001.
- Cholesterol Treatment Trialists' Collaboration. Efficacy and safety of LDL-lowering therapy. Lancet 2010;376:1670-81.
- Roberts D, et al. Antenatal corticosteroids for accelerating fetal lung maturation. Cochrane Database Syst Rev 2017.
- IMPACT Study Group. Predicting outcome after traumatic brain injury. PLoS Med 2008;5:e165.
- Debray TPA, et al. Get real in individual participant data meta-analysis. Int J Epidemiol 2015;44:1287-97.
- Burke DL, et al. Meta-analysis using individual participant data. Stat Med 2017;36:320-38.
But you have learned to find them.
You have learned to ask: Who benefits? Who is harmed?
Ora vai e non lasciare che nessun paziente scompaia nel mondo media."
Il paziente nascosto: ora li vedi.