can be reduced to a single number,
et dans ce nombre, des vies sont effacées?
Mais quels patients en ont bénéficié ? Les jeunes ou les vieux ? Ceux qui ont une maladie légère ou grave ? Hommes ou femmes ?
L'agrégat ne peut pas répondre.
Car dans la moyenne, certains patients ont été sauvés – et d’autres ont été blessés.
● Responders ● Non-responders
But who sont les 30% ? Sans données individuelles, nous ne pouvons pas identifier les répondeurs des non-répondants. Nous ne pouvons pas pratiquer precision medicine.
Pas des résumés. Pas des moyennes. Each patient, each tumor, each outcome.
What he discovered changed breast cancer treatment forever.
"Tamoxifen works."
But the individual data revealed:
Giving tamoxifen to ER− patients was useless.
Dans l’individu, la vérité apparaît.
C'est pourquoi nous recherchons le patient caché."
Il s'agit d'une méta-analyse des données des participants individuels.
What is found when we look closer?
Aggregate Data (AD)
- Study-level summaries
- Tailles d'effet des publications
- Mean age, % male, etc.
- Rapide et accessible
- Cannot see within-study variation
Données individuelles des participants (IPD)
- Données brutes au niveau du patient
- Every participant's characteristics
- Actual ages, actual outcomes
- Time-intensive to obtain
- Can see who responds and who doesn't
Trial A: Mean age 55 years, Effect size 0.70 (benefit)
Trial B: Mean age 75 years, Effect size 0.90 (less benefit)
Tempting conclusion: "The drug works better in younger patients."
But this could be completely wrong.
Perhaps in Trial A, older patients within that trial responded better. Perhaps in Trial B, younger patients within that trial responded better.
Vous ne pouvez pas savoir sans individu data.
True Effect Modification
Test whether treatment effect varies by patient characteristics (age, biomarkers, disease severity)
Time-to-Event Analysis
Use actual survival curves, not just hazard ratios. Handle censoring properly.
Consistent Definitions
Standardize outcome definitions, exposure timing, covariate categories across studies
Subgroup Credibility
Testez les interactions au sein des études, en évitant l'erreur écologique
Individual data shows each tree.
Si vous avez besoin de savoir quels arbres sont malades—
you must walk among them."
gathered data on 170,000 patients
and answered questions no single trial could ask?
27 trials. 174,149 patients. Every baseline characteristic. Every cardiovascular event. Every death.
The published trials asked: "Do statins work?"
Le CTT a demandé : "Pour qui les statines fonctionnent-elles ?"
Mais les questions auxquelles vous pouvez répondre valent la peine l'investissement.
Benefit Proportional to LDL Reduction
Every 1 mmol/L LDL reduction = 22% lower CV events. True across all subgroups.
No Age Threshold
Benefit continues even in patients >75 years (contradicting earlier AD analyses)
Primary Prevention Works
Patients without prior CVD benefit proportionally to their baseline risk
No Cancer Signal
Les inquiétudes concernant les statines provoquant le cancer ont été définitivement réfutées grâce au suivi de l'IPD
Trial A: "High risk" = 10-year CVD risk >20%
Trial B: "High risk" = Prior MI
Trial C: "High risk" = Diabetes
You cannot compare or combine what is defined differently.
IPD allowed the CTT to redefine everyone consistently.
IPD fournit le traduction.
What seemed contradictory becomes clear:
the same truth, measured differently."
Les données agrégées prennent weeks.
Quand l'investissement en vaut-il la peine ?
Devriez-vous poursuivre l'IPD ?
Time-to-Event Outcomes
Lorsque les courbes de survie sont importantes, pas seulement les rapports de risque finaux.
Continuous Effect Modifiers
Testing whether treatment effect varies by age, BMI, biomarker level (not just "high" vs "low")
Outcome Definition Problems
Lorsque les essais définissent les résultats différemment et que vous devez les normaliser
Longer Follow-Up Available
Lorsque les auteurs des essais disposent de données de suivi non publiées, vous souhaitez include
Votre question clé est : "Les bénéfices varient-ils en fonction de la gravité de la maladie et du moment du traitement ?"
Overall Treatment Effect
Quand votre seule question est « Est-ce que ça marche ? » pas "Pour qui ?"
Homogeneous Population
When trials enrolled similar patients and effect modification is unlikely
Binary Outcomes, Short Follow-up
Quand la censure n'est pas un problème et que les résultats sont simples oui/non
IPD Unobtainable
Lorsque les testeurs ne partagent pas, les données sont perdues ou les ressources ne sont pas disponibles
Mais chaque question sur which individuals
exige leur présence dans vos données."
Maintenant : l’analysez-vous comme one combined dataset
or trial by trial, then combine?
Two-Stage Approach
- Stage 1: Analyze each trial separately
- Étape 2 : Méta-analyser les résultats
- Preserves trial structure
- Familiar (like standard MA)
- Cannot handle sparse data well
One-Stage Approach
- Analyser toutes les données simultanément
- Mixed-effects regression model
- Effets aléatoires pour le clustering
- Mieux pour les données clairsemées
- More flexible modeling
Each trial's estimate is transparent.
Des parcelles forestières familières et moi2 statistics.
2. More powerful for detecting interactions
3. Can model complex covariate relationships
4. Exact likelihood (no normal approximations)
One-Stage or Two-Stage?
The one-stage hears all voices at once.
Lorsque les données sont rares et les événements rares :
le premier étage rattrape ce que le deux étages manque. »
qui a sauvé la vie de bébés...
but only if given at the right time?
But a puzzle remained: When should they be given?
24 hours before birth? 48 hours? A week?
Published trials couldn't answer—they didn't report timing consistently.
Maximum benefit: 24 hours to 7 days before birth
Reduced benefit: >7 days (lung maturity effect fades)
No benefit: <24 hours (not enough time to work)
After IPD: Guidelines now recommend repeat dosing si la livraison n'a pas eu lieu dans les 7 jours suivant le premier cours.
Cette précision, impossible sans données individuelles, a saved thousands of premature babies.
Trial B reported: "Steroid given antenatally"
Trial C reported: "Steroid-to-delivery interval: median 3 days"
Different categories. Different definitions. Incompatible summaries.
Only by examining each baby's actual steroid-to-delivery time could the optimal window be identified.
But when le donner était inconnu.
IPD a transformé « parfois » en « le bon moment »—
et dans cette précision, les enfants vivaient.
Quelque part, dans des fichiers et des bases de données,
l'histoire de chaque patient est enregistrée.
La question est : vont-ils la partager ?
This is expected. Plan for it.
Trialist Collaboration
Direct contact with trial investigators. Build relationships. Offer co-authorship.
Plateformes de partage de données
YODA Project, ClinicalStudyDataRequest.com, Vivli, ICPSR
Regulatory Agencies
EMA Policy 0070, FDA (limited), Health Canada
Journal Requirements
Many journals now require data sharing; check supplementary materials
2. Offer co-authorship—make sharing worthwhile
3. Décrire la sécurité des données—how you'll protect their patients
4. Fournir des dictionnaires de données—specify exactly what you need
5. Set clear timelines—respect their time
Industry trials: less likely to share
Negative trials: less likely to share
Older trials: data may be lost
Your IPD sample may be biased.
Will they share what they have guarded?
Construire le pont soigneusement—
car sur ce pont, l'avenir des patients se croise."
from twelve trials, five countries, three decades.
But Trial A calls it "cardiovascular death"
et l'essai B l'appelle "cardiac mortality".
Sont-ils identiques ?
Trial from USA: Age in decimal years (e.g., 65.7)
Essai du Royaume-Uni : tranches d'âge ("65-74")
Diabetes: HbA1c ≥ 6.5% vs. fasting glucose ≥ 126 vs. "physician diagnosis"
Outcome: "Major adverse cardiac event" (one trial includes stroke, another doesn't)
Avant analyse : harmoniser tout.
Créer un dictionnaire de données principal
Define every variable you need: name, type, permitted values, derivation rules
Map Each Trial's Variables
Document how each trial's coding maps to your standardized definitions
Vérifier auprès Trialistes
Vérifiez vos interprétations. Ils connaissent leurs données mieux que vous.
Validate Transformations
Reproduire les résultats publiés de l'IPD. S'ils ne correspondent pas, enquêtez.
Six essais utilisaient une définition standard (codes CIM). Deux essais des années 1990 utilisaient la « mort cardiaque évaluée par l'investigateur » sans critères standardisés. Ces deux essais montrent des effets de traitement plus importants.
Reproduisez les résultats publiés de chaque essai à partir de l’IPD.
Si votre analyse donne RR = 0,78 mais que la publication indique RR = 0,85,
something is wrong.
Find the discrepancy. Fix it. Then proceed.
different ways to name the same disease.
Avant de pouvoir combiner, vous devez traduire.
Avant de traduire, il faut comprendre."
Mais est-ce que cela fonctionne de la même manière pour les jeunes et les vieux ?
Pour les cas légers et graves ?
Pour celui avec le biomarqueur et celui sans ?
They asked: "Does the effect differ by estrogen receptor status?"
L’interaction a été massive :
ER-positive: 47% reduction in recurrence
ER-negative: No benefit at all
L'effet du traitement differs between subgroups defined by the covariate.
Sinon : l’effet du traitement est similar across subgroups (or you lack power to detect a difference).
Between-Study Interaction
- Compares trial-level averages
- Ecological fallacy risk
- Confounded by trial design
- Low statistical power
- Peut faire avec des données agrégées
Within-Study Interaction
- Compares patients within each trial
- No ecological fallacy
- Randomization preserved
- Much higher power
- Requires IPD
C’est la référence en matière de modification des effets.
Vous avez testé 8 modificateurs d’effets potentiels dans votre analyse.
The interaction reveals who benefits.
Testez-le au sein des études, pas entre...
car c'est là que se trouve la vérité.
Quand tu cherches à predict who will die,
who will recover, who will relapse—
l'individu est tout.
"Will they ever wake up?"
Individual trials were too small to develop accurate prediction models.
IMPACT a rassemblé les IPD de 11 études, portant sur 9 205 patients, et a construit un modèle qui prédit les résultats à 6 mois à partir des caractéristiques cliniques initiales.
External Validation Across Populations
Develop in some studies, validate in others. True test of generalizability.
Non-linear Relationships
Explore how predictors relate to outcome: linear? threshold? U-shaped?
Multiple Predictor Interactions
Age + GCS + pupil reactivity may interact in ways aggregate data cannot reveal
Proper Handling of Missing Predictors
Imputation multiple au niveau du patient, pas au niveau de l'étude
TRIPOD
- Prediction model reporting
- Développement et validation
- Calibrage et discrimination
- 22 item checklist
PRISMA-IPD
- IPD meta-analysis reporting
- Détails de l'acquisition de données
- Harmonization process
- Integrity checking
Lorsqu'un patient arrive avec un traumatisme crânien, le modèle fournit une probability of survival and probability of favorable outcome.
Cela guide les conversations avec les familles. Cela informe sur l’intensité du traitement. Cela aide à allouer les ressources de l’USI.
Construit à partir de données individuelles. Servir des patients individuels.
vous devez apprendre de milliers de passés.
IPD détient ces histoires...
each one a teacher, if you will listen."
qui a été donné à millions pour leur cœur ?
On leur a dit : "Prends ceci et tu seras protégé."
But was every heart equally in need of protection?
Researchers quickly re-identified users by matching ratings with public IMDb reviews.
One lawsuit alleged a closeted lesbian was outed through her viewing patterns.
The lesson: removing names isn't anonymization.
L'IPD contient suffisamment de combinaisons d'âge, de diagnostic, de réponse au traitement et de dates pour identifier de manière unique les individus. La confidentialité nécessite plus que la suppression de la colonne de nom : elle nécessite de comprendre comment les combinaisons de données deviennent des empreintes digitales.
The published trials said: "Aspirin prevents heart attacks."
Mais l'ATT a posé la question interdite :
"A quel prix ? Et pour qui ?"
2-3 heart attacks prevented
2-3 major bleeds caused
Les avantages et les inconvénients s’annulent.
Ce patient devrait-il prendre de l’aspirine en prévention primaire ?
(benefit > harm)
(benefit ≈ harm)
(harm > benefit)
Ils n'ont pas pu démontrer que les patients à haut risque gagnaient
while low-risk patients lost.
Only by examining each patient's baseline risk,
each patient's outcomes,
could the interaction be revealed.
Il a lu en ligne que « l'aspirine prévient les crises cardiaques » et souhaite votre avis.
peut nuire à la sécurité.
Connaissez le risque de votre patient avant de prescrire.
C'est ce que nous ont appris les données individuelles."
95,000 patients. One truth: risk determines benefit.
« Les vieux devraient-ils être traités de la même manière que les jeunes ?
Some said: "Lower is always better."
D'autres disaient : "Les vieux sont fragiles. Soyez prudent."
Qui avait raison ?
Le camp agressif : "Every mmHg of BP reduction saves lives.
Treat everyone to target 120/80."
Le camp conservateur : "In the elderly, low BP causes falls, strokes, death.
There's a J-curve—too low is dangerous."
Individual trials were too small to settle it. Jusqu'à ce que le BPLTTC collecte les données individuelles.
Is there a J-curve at very low pressures?
Do the very old (>80 years) still benefit?
Age 55-64: 10% lower major CV events
Age 65-74: 10% lower major CV events
Age 75-84: 10% lower major CV events
Age ≥85: Still 10% lower
pinteraction = 0,85. Aucune preuve de modification de l'âge.
who achieved very low blood pressures.
Result: No J-curve in randomized comparisons.
La courbe en J apparente dans les données d'observation était reverse causation— sick patients have low BP because they're sick, not sick because their BP is low.
Seuls les IPD issus d’ECR pourraient résoudre ce problème.
Should This Elderly Patient Get BP Treatment?
Proportional benefit maintained across all ages
Consider frailty, life expectancy, patient preference—but not age.
Vous vous souvenez de la méta-analyse BPLTTC IPD.
Mais les données individuelles ont montré le contraire :
At every age, the benefit endures.
Do not let age alone deny protection."
when a clot blocks the brain?
Every minute, two million neurons die.
But when does the window close?
When is it too late to intervene?
But given too late, it causes bleeding into dying brain tissue.
What is the time window? 3 hours? 4.5 hours? 6 hours?
Individual trials disagreed. Guidelines were uncertain.
They knew exactly when each patient's stroke began. They knew exactly when thrombolysis was given. They knew exactly who lived, who died, who recovered.
They could map benefit against time, minute by minute.
Treated at 90 min: 1 in 4 achieve excellent outcome
Treated at 180 min: 1 in 7 achieve excellent outcome
Treated at 270 min: 1 in 14 achieve excellent outcome
Acute Ischemic Stroke: Give Thrombolysis?
URGENTLY
if eligible
imaging
avoid
Trial B: "Patients treated within 6 hours" (average: 4.2 hours)
These overlapping, inconsistent windows couldn't be compared.
Only by knowing each patient's exact time
could the continuous decay of benefit be mapped.
Door-to-needle time will add 30 minutes, making total time ~4.5 hours.
two million neurons perish.
L'IPD nous a montré la fenêtre qui s'estompe.
Act quickly, or the window closes forever."
Vous ouvrez les dossiers avec espoir.
Et puis tu vois ça : empty cells.
Age: 67. Sex: Male. Smoking status: missing.
Outcome at 1 year: missing.
What now?
Missing Completely at Random (MCAR)
Lab machine broke randomly. No relation to patient characteristics. Safe to ignore (but wasteful).
Missing at Random (MAR)
Older patients more likely to miss follow-up. Missingness related to observed variables. Imputation can help.
Manquant pas au hasard (MNAR)
Les patients dont les résultats sont médiocres abandonnent. Manque lié au missing value itself. Dangereux. Nécessite une analyse de sensibilité.
Que faire des valeurs manquantes ?
may suffice
imputation
sensitivity
Multiple imputation (M=20-50 datasets) reflects uncertainty sur ce qu'aurait pu être la valeur manquante.
Cela préserve les erreurs standard et les valeurs p valides.
Systematically Missing Variables
Trial A measured biomarker X. Trial B didn't. Can't impute what was never collected.
Multilevel Structure
Patients nested within trials. Imputation model must account for clustering.
Different Follow-up Durations
L'essai A a suivi pendant 2 ans. Essai B pendant 5 ans. L’analyse de survie nécessite des soins.
Trial Didn't Collect Your Key Covariate
analysis to trials
avec la variable
varying assumptions
about unmeasured
Ces 3 essais ont tendance à être plus anciens et plus petits.
It is a question: Pourquoi est-ce inconnu ?
Répondez à cette question avant de combler le vide...
car la raison de l'absence façonne la solution."
qui a collecté des données auprès de willing trialists
et déclaré la victoire ?
But the unwilling held secrets.
Et ces secrets ont tout changé.
Cochrane reviewers requested trial data to verify efficacy. Roche refused, citing confidentiality.
Pendant cinq ans, le BMJ a fait campagne pour la transparence. Lorsque les rapports complets des études cliniques ont finalement été publiés en 2014, la situation a changé : le Tamiflu a réduit la durée des symptômes de moins d'une journée et n'a pas évité les complications.
Des milliards dépensés pour un médicament dont toutes les preuves étaient conservées sous clé.
La saga Tamiflu a transformé les attentes : aujourd'hui, la transparence des essais cliniques devient la norme, et non l'exception.
Industry-sponsored trials: Less likely to share
Essais avec des résultats négatifs : Less likely to share
Older trials: Données souvent perdues
If these trials systematically differ in effect size,
votre IPD-MA est biaisée.
Assessing Availability Bias
for bias
Sensibilité analyse nécessaire
Report IPD retrieval rate
"Nous avons obtenu l'IPD à partir de 12/15 essais (80%)"
Compare IPD vs. non-IPD trial characteristics
Taille de l'échantillon, financement, date de publication, taille de l'effet à partir de l'ensemble données
Sensitivity analysis including non-IPD trials
Analyse en deux étapes combinant IPD + AD à partir d'essais sans partage
Discutez des raisons de non-partage
Data lost? Refused? Never requested? Each has different implications.
Votre analyse IPD montre un OR 0,70.
Utilisez l'IPD là où vous l'avez (pour les tests d'interaction).
Complétez avec AD pour l'estimation de l'effet global.
Transparence sur ce qui est issu où.
Les portes ouvertes peuvent cacher la vérité derrière des portes verrouillées.
Always ask: Who refused to share?
And what might they be hiding?"
Sources clés citées dans ce document Cours
- Riley RD, et al. Méta-analyse des données des participants individuels : un manuel pour la recherche sur les soins de santé. Wiley, 2021.
- Stewart LA, et al. PRISMA-IPD : éléments de rapport préférés pour les revues systématiques et les méta-analyses des données des participants individuels. JAMA 2015;313:1657-65.
- Early Breast Cancer Trialists' Collaborative Group. Tamoxifen for early breast cancer. Cochrane Database Syst Rev 2001.
- Cholesterol Treatment Trialists' Collaboration. Efficacy and safety of LDL-lowering therapy. Lancet 2010;376:1670-81.
- Roberts D, et al. Antenatal corticosteroids for accelerating fetal lung maturation. Cochrane Database Syst Rev 2017.
- IMPACT Study Group. Predicting outcome after traumatic brain injury. PLoS Med 2008;5:e165.
- Debray TPA, et al. Get real in individual participant data meta-analysis. Int J Epidemiol 2015;44:1287-97.
- Burke DL, et al. Meta-analysis using individual participant data. Stat Med 2017;36:320-38.
But you have learned to find them.
You have learned to ask: Who benefits? Who is harmed?
Maintenant, allez-y et ne laissez aucun patient disparaître dans la moyenne."
Le patient caché — Vous les voyez maintenant.