can be reduced to a single number,
und in dieser Zahl, Leben werden ausgelöscht?
Doch welche Patienten profitierten? Die Jungen oder die Alten? Diejenigen mit leichter oder schwerer Erkrankung? Männer oder Frauen?
Das Aggregat kann nicht antworten.
Denn im Durchschnitt wurden einige Patienten gerettet – und einige wurden geschädigt.
● Responders ● Non-responders
But who sind das 30%? Ohne individuelle Daten können wir die Antwortenden nicht von den Nicht-Antwortenden unterscheiden. Wir können nicht üben precision medicine.
Keine Zusammenfassungen. Keine Durchschnittswerte. Each patient, each tumor, each outcome.
What he discovered changed breast cancer treatment forever.
"Tamoxifen works."
But the individual data revealed:
Giving tamoxifen to ER− patients was useless.
Im Individuum erscheint die Wahrheit.
Deshalb suchen wir den verborgenen Patienten.“
Dies ist eine Metaanalyse der Daten einzelner Teilnehmer.
What is found when we look closer?
Aggregate Data (AD)
- Study-level summaries
- Effektgrößen aus Veröffentlichungen
- Mean age, % male, etc.
- Schnell und zugänglich
- Cannot see within-study variation
Individuelle Teilnehmerdaten (IPD)
- Rohdaten auf Patientenebene
- Every participant's characteristics
- Actual ages, actual outcomes
- Time-intensive to obtain
- Can see who responds and who doesn't
Trial A: Mean age 55 years, Effect size 0.70 (benefit)
Trial B: Mean age 75 years, Effect size 0.90 (less benefit)
Tempting conclusion: "The drug works better in younger patients."
But this could be completely wrong.
Perhaps in Trial A, older patients within that trial responded better. Perhaps in Trial B, younger patients within that trial responded better.
Man kann es ohne Individuum nicht wissen Daten.
True Effect Modification
Test whether treatment effect varies by patient characteristics (age, biomarkers, disease severity)
Time-to-Event Analysis
Use actual survival curves, not just hazard ratios. Handle censoring properly.
Consistent Definitions
Standardize outcome definitions, exposure timing, covariate categories across studies
Subgroup Credibility
Testen Sie Wechselwirkungen innerhalb von Studien und vermeiden Sie den ökologischen Irrtum
Individual data shows each tree.
Wenn Sie wissen müssen, welche Bäume krank sind –
you must walk among them."
gathered data on 170,000 patients
and answered questions no single trial could ask?
27 trials. 174,149 patients. Every baseline characteristic. Every cardiovascular event. Every death.
The published trials asked: "Do statins work?"
Das CTT fragte: "Bei wem wirken Statine?"
Aber die Fragen, die Sie beantworten können, sind die Investition wert.
Benefit Proportional to LDL Reduction
Every 1 mmol/L LDL reduction = 22% lower CV events. True across all subgroups.
No Age Threshold
Benefit continues even in patients >75 years (contradicting earlier AD analyses)
Primary Prevention Works
Patients without prior CVD benefit proportionally to their baseline risk
No Cancer Signal
Bedenken, dass Statine Krebs verursachen könnten, wurden mit der IPD-Folgeuntersuchung endgültig widerlegt
Trial A: "High risk" = 10-year CVD risk >20%
Trial B: "High risk" = Prior MI
Trial C: "High risk" = Diabetes
You cannot compare or combine what is defined differently.
IPD allowed the CTT to redefine everyone consistently.
IPD liefert die Übersetzung.
What seemed contradictory becomes clear:
the same truth, measured differently."
Aggregierte Daten benötigen weeks.
Wann lohnt sich die Investition?
Sollten Sie IPD anstreben?
Time-to-Event Outcomes
Wenn Überlebenskurven wichtig sind, nicht nur endgültige Hazard-Verhältnisse.
Continuous Effect Modifiers
Testing whether treatment effect varies by age, BMI, biomarker level (not just "high" vs "low")
Outcome Definition Problems
Wenn Studien Ergebnisse unterschiedlich definieren und Sie standardisieren müssen
Longer Follow-Up Available
Wenn Studienteilnehmer unveröffentlichte Follow-up-Daten haben, die Sie möchten include
Ihre Schlüsselfrage lautet: „Variiert der Nutzen je nach Schwere der Erkrankung und Zeitpunkt der Behandlung?“
Overall Treatment Effect
Wenn Ihre einzige Frage lautet: „Funktioniert es?“ nicht „Für wen?“
Homogeneous Population
When trials enrolled similar patients and effect modification is unlikely
Binary Outcomes, Short Follow-up
Wenn Zensur kein Problem darstellt und die Ergebnisse einfach Ja/Nein sind
IPD Unobtainable
Wenn Testteilnehmer nichts teilen, gehen Daten verloren oder Ressourcen sind nicht verfügbar
Aber jede Frage bzgl which individuals
erfordert ihre Präsenz in Ihren Daten.“
Nun: Analysieren Sie es als? one combined dataset
or trial by trial, then combine?
Two-Stage Approach
- Stage 1: Analyze each trial separately
- Stufe 2: Metaanalyse der Ergebnisse
- Preserves trial structure
- Familiar (like standard MA)
- Cannot handle sparse data well
One-Stage Approach
- Analysieren Sie alle Daten gleichzeitig
- Mixed-effects regression model
- Zufällige Effekte für Clustering
- Besser für spärliche Daten
- More flexible modeling
Each trial's estimate is transparent.
Bekannte Waldgrundstücke und I2 statistics.
2. More powerful for detecting interactions
3. Can model complex covariate relationships
4. Exact likelihood (no normal approximations)
One-Stage or Two-Stage?
The one-stage hears all voices at once.
Wenn Daten spärlich und Ereignisse selten sind –
Die Ein-Stufe fängt, was die Zwei-Stufe verfehlt.“
das rettete Babys das Leben—
but only if given at the right time?
But a puzzle remained: When should they be given?
24 hours before birth? 48 hours? A week?
Published trials couldn't answer—they didn't report timing consistently.
Maximum benefit: 24 hours to 7 days before birth
Reduced benefit: >7 days (lung maturity effect fades)
No benefit: <24 hours (not enough time to work)
After IPD: Guidelines now recommend repeat dosing wenn die Lieferung nicht innerhalb von 7 Tagen nach dem ersten Kurs erfolgt ist.
Diese Präzision ist ohne individuelle Daten nicht möglich saved thousands of premature babies.
Trial B reported: "Steroid given antenatally"
Trial C reported: "Steroid-to-delivery interval: median 3 days"
Different categories. Different definitions. Incompatible summaries.
Only by examining each baby's actual steroid-to-delivery time could the optimal window be identified.
But when es zu geben war unbekannt.
IPD hat aus „irgendwann“ den „richtigen Zeitpunkt“ gemacht –
und in dieser Präzision lebten Kinder.“
Irgendwo, in Dateien und Datenbanken,
Die Geschichte jedes Patienten wird aufgezeichnet.
Die Frage ist: Werden sie es teilen?
This is expected. Plan for it.
Trialist Collaboration
Direct contact with trial investigators. Build relationships. Offer co-authorship.
Datenaustauschplattformen
YODA Project, ClinicalStudyDataRequest.com, Vivli, ICPSR
Regulatory Agencies
EMA Policy 0070, FDA (limited), Health Canada
Journal Requirements
Many journals now require data sharing; check supplementary materials
2. Offer co-authorship—make sharing worthwhile
3. Beschreiben Sie die Datensicherheit—how you'll protect their patients
4. Stellen Sie Datenwörterbücher bereit—specify exactly what you need
5. Set clear timelines—respect their time
Industry trials: less likely to share
Negative trials: less likely to share
Older trials: data may be lost
Your IPD sample may be biased.
Will they share what they have guarded?
Baue die Brücke sorgfältig –
denn auf dieser Brücke kreuzen sich die Zukunftsaussichten der Patienten.“
from twelve trials, five countries, three decades.
But Trial A calls it "cardiovascular death"
und Versuch B nennt es "cardiac mortality".
Sind sie gleich?
Trial from USA: Age in decimal years (e.g., 65.7)
Testversion aus Großbritannien: Altersgruppen („65–74“)
Diabetes: HbA1c ≥ 6.5% vs. fasting glucose ≥ 126 vs. "physician diagnosis"
Outcome: "Major adverse cardiac event" (one trial includes stroke, another doesn't)
Vor der Analyse: Alles harmonisieren.
Erstellen Sie ein Stammdatenwörterbuch
Define every variable you need: name, type, permitted values, derivation rules
Map Each Trial's Variables
Document how each trial's coding maps to your standardized definitions
Erkundigen Sie sich bei Trialisten
Überprüfen Sie Ihre Interpretationen. Sie kennen ihre Daten besser als Sie.
Validate Transformations
Reproduzieren Sie veröffentlichte Ergebnisse des IPD. Wenn sie nicht übereinstimmen, untersuchen Sie es.
Sechs Studien verwendeten eine Standarddefinition (ICD-Codes). Zwei Studien aus den 1990er Jahren verwendeten den „vom Prüfarzt beurteilten Herztod“ ohne standardisierte Kriterien. Diese beiden Studien zeigen größere Behandlungseffekte.
Reproduzieren Sie die veröffentlichten Ergebnisse jeder Studie aus dem IPD.
Wenn Ihre Analyse RR = 0,78 ergibt, die Veröffentlichung jedoch RR = 0,85 sagt,
something is wrong.
Find the discrepancy. Fix it. Then proceed.
different ways to name the same disease.
Bevor Sie kombinieren können, müssen Sie übersetzen.
Bevor Sie übersetzen, müssen Sie verstehen.“
Aber funktioniert es bei Jung und Alt gleich?
Für die Leichten und die Schweren?
Für den mit und den ohne Biomarker?
They asked: "Does the effect differ by estrogen receptor status?"
Die Interaktion war riesig:
ER-positive: 47% reduction in recurrence
ER-negative: No benefit at all
Der Behandlungseffekt differs between subgroups defined by the covariate.
Wenn nicht: Der Behandlungseffekt ist similar across subgroups (or you lack power to detect a difference).
Between-Study Interaction
- Compares trial-level averages
- Ecological fallacy risk
- Confounded by trial design
- Low statistical power
- Kann mit aggregierten Daten umgehen
Within-Study Interaction
- Compares patients within each trial
- No ecological fallacy
- Randomization preserved
- Much higher power
- Requires IPD
Dies ist der Goldstandard für Effektmodifikationen.
Sie haben in Ihrer Analyse 8 potenzielle Wirkungsmodifikatoren getestet.
The interaction reveals who benefits.
Testen Sie es im Rahmen von Studien, nicht zwischen …
denn dort liegt die Wahrheit.“
Wenn Sie es wünschen predict who will die,
who will recover, who will relapse—
das Individuum ist alles.
"Will they ever wake up?"
Individual trials were too small to develop accurate prediction models.
IMPACT sammelte IPD aus 11 Studien mit 9.205 Patienten und erstellte ein Modell, das 6-Monats-Ergebnisse anhand der ersten klinischen Merkmale vorhersagt.
External Validation Across Populations
Develop in some studies, validate in others. True test of generalizability.
Non-linear Relationships
Explore how predictors relate to outcome: linear? threshold? U-shaped?
Multiple Predictor Interactions
Age + GCS + pupil reactivity may interact in ways aggregate data cannot reveal
Proper Handling of Missing Predictors
Mehrfache Imputation auf Patientenebene, nicht auf Studienebene
TRIPOD
- Prediction model reporting
- Entwicklung und Validierung
- Kalibrierung und Diskriminierung
- 22 item checklist
PRISMA-IPD
- IPD meta-analysis reporting
- Details zur Datenerfassung
- Harmonization process
- Integrity checking
Wenn ein Patient mit traumatischer Hirnverletzung eintrifft, bietet das Modell Folgendes: probability of survival and probability of favorable outcome.
Dies leitet Gespräche mit Familien. Dies gibt Aufschluss über die Behandlungsintensität. Dies hilft bei der Zuweisung von Ressourcen auf der Intensivstation.
Aus individuellen Daten aufgebaut. Betreuung einzelner Patienten.
Sie müssen aus Tausenden von Vergangenheiten lernen.
IPD hält diese Geschichten bereit –
each one a teacher, if you will listen."
das wurde gegeben millions für ihre Herzen?
Ihnen wurde gesagt: „Nimm das und du wirst beschützt sein.“
But was every heart equally in need of protection?
Researchers quickly re-identified users by matching ratings with public IMDb reviews.
One lawsuit alleged a closeted lesbian was outed through her viewing patterns.
The lesson: removing names isn't anonymization.
IPD enthält genügend Kombinationen aus Alter, Diagnose, Ansprechen auf die Behandlung und Daten, um Personen eindeutig zu identifizieren. Datenschutz erfordert mehr als das Löschen der Namensspalte – es erfordert das Verständnis, wie Datenkombinationen zu Fingerabdrücken werden.
The published trials said: "Aspirin prevents heart attacks."
Doch der ATT stellte die verbotene Frage:
„Um welchen Preis? Und für wen?“
2-3 heart attacks prevented
2-3 major bleeds caused
Nutzen und Schaden heben sich auf.
Sollte dieser Patient zur Primärprävention Aspirin einnehmen?
(benefit > harm)
(benefit ≈ harm)
(harm > benefit)
Sie konnten nicht nachweisen, dass Hochrisikopatienten davon profitierten
while low-risk patients lost.
Only by examining each patient's baseline risk,
each patient's outcomes,
could the interaction be revealed.
Er hat online gelesen, dass „Aspirin Herzinfarkte verhindert“ und möchte Ihren Rat.
kann dem Sicheren schaden.
Informieren Sie sich über das Risiko Ihres Patienten, bevor Sie ihm etwas verschreiben.
Das haben uns die einzelnen Daten gelehrt.“
95,000 patients. One truth: risk determines benefit.
„Sollten die Alten genauso behandelt werden wie die Jungen?“
Some said: "Lower is always better."
Andere sagten: „Die Alten sind zerbrechlich. Seien Sie vorsichtig.“
Wer hatte recht?
Das aggressive Lager: "Every mmHg of BP reduction saves lives.
Treat everyone to target 120/80."
Die Konservativen Camp: "In the elderly, low BP causes falls, strokes, death.
There's a J-curve—too low is dangerous."
Individual trials were too small to settle it. Bis das BPLTTC die einzelnen Daten gesammelt hat.
Is there a J-curve at very low pressures?
Do the very old (>80 years) still benefit?
Age 55-64: 10% lower major CV events
Age 65-74: 10% lower major CV events
Age 75-84: 10% lower major CV events
Age ≥85: Still 10% lower
pinteraction = 0,85. Keine Hinweise auf eine Altersveränderung.
who achieved very low blood pressures.
Result: No J-curve in randomized comparisons.
Das scheinbare J-Kurve in Beobachtungsdaten war reverse causation— sick patients have low BP because they're sick, not sick because their BP is low.
Nur IPD aus RCTs konnte dies entschlüsseln.
Should This Elderly Patient Get BP Treatment?
Proportional benefit maintained across all ages
Consider frailty, life expectancy, patient preference—but not age.
Sie erinnern sich an die BPLTTC-IPD-Metaanalyse.
Aber die einzelnen Daten zeigten etwas anderes:
At every age, the benefit endures.
Do not let age alone deny protection."
when a clot blocks the brain?
Every minute, two million neurons die.
But when does the window close?
When is it too late to intervene?
But given too late, it causes bleeding into dying brain tissue.
What is the time window? 3 hours? 4.5 hours? 6 hours?
Individual trials disagreed. Guidelines were uncertain.
They knew exactly when each patient's stroke began. They knew exactly when thrombolysis was given. They knew exactly who lived, who died, who recovered.
They could map benefit against time, minute by minute.
Treated at 90 min: 1 in 4 achieve excellent outcome
Treated at 180 min: 1 in 7 achieve excellent outcome
Treated at 270 min: 1 in 14 achieve excellent outcome
Acute Ischemic Stroke: Give Thrombolysis?
URGENTLY
if eligible
imaging
avoid
Trial B: "Patients treated within 6 hours" (average: 4.2 hours)
These overlapping, inconsistent windows couldn't be compared.
Only by knowing each patient's exact time
could the continuous decay of benefit be mapped.
Door-to-needle time will add 30 minutes, making total time ~4.5 hours.
two million neurons perish.
Das IPD zeigte uns das verblassende Fenster.
Act quickly, or the window closes forever."
Sie öffnen die Akten voller Hoffnung.
Und dann sieht man es: empty cells.
Age: 67. Sex: Male. Smoking status: missing.
Outcome at 1 year: missing.
What now?
Missing Completely at Random (MCAR)
Lab machine broke randomly. No relation to patient characteristics. Safe to ignore (but wasteful).
Missing at Random (MAR)
Older patients more likely to miss follow-up. Missingness related to observed variables. Imputation can help.
Nicht zufällig vermisst (MNAR)
Patienten mit schlechten Ergebnissen scheiden aus. Fehlen im Zusammenhang mit dem missing value itself. Gefährlich. Erfordert eine Sensitivitätsanalyse.
Was tun bei fehlenden Werten?
may suffice
imputation
sensitivity
Multiple imputation (M=20-50 datasets) reflects uncertainty darüber, was der fehlende Wert gewesen sein könnte.
Dadurch bleiben gültige Standardfehler und p-Werte erhalten.
Systematically Missing Variables
Trial A measured biomarker X. Trial B didn't. Can't impute what was never collected.
Multilevel Structure
Patients nested within trials. Imputation model must account for clustering.
Different Follow-up Durations
Versuch A folgte 2 Jahre lang. Versuch B für 5 Jahre. Die Überlebensanalyse erfordert Sorgfalt.
Trial Didn't Collect Your Key Covariate
analysis to trials
mit der Variablen
varying assumptions
about unmeasured
Diese 3 Studien sind tendenziell älter und kleiner.
It is a question: Warum ist das unbekannt?
Beantworten Sie diese Frage, bevor Sie die Lücke füllen –
denn der Grund der Abwesenheit prägt die Lösung.“
von wem die Daten gesammelt wurden willing trialists
und den Sieg erklärt?
But the unwilling held secrets.
Und diese Geheimnisse haben alles verändert.
Cochrane reviewers requested trial data to verify efficacy. Roche refused, citing confidentiality.
Fünf Jahre lang setzte sich das BMJ für Transparenz ein. Als 2014 schließlich die vollständigen klinischen Studienberichte veröffentlicht wurden, änderte sich das Bild: Tamiflu reduzierte die Symptomdauer um weniger als einen Tag und verhinderte keine Komplikationen.
Milliarden für ein Medikament ausgegeben, dessen vollständige Beweise unter Verschluss gehalten wurden.
Die Tamiflu-Saga hat die Erwartungen verändert – heute wird die Transparenz klinischer Studien zur Norm und nicht zur Ausnahme.
Industry-sponsored trials: Less likely to share
Versuche mit negativen Ergebnissen: Less likely to share
Older trials: Daten gehen oft verloren
If these trials systematically differ in effect size,
Ihr IPD-MA ist voreingenommen.
Assessing Availability Bias
for bias
Sensitivitätsanalyse erforderlich
Report IPD retrieval rate
"Wir haben IPD aus 12/15 Versuchen erhalten (80 %)"
Compare IPD vs. non-IPD trial characteristics
Stichprobengröße, Finanzierung, Veröffentlichungsdatum, Effektgröße aus aggregierten Daten
Sensitivity analysis including non-IPD trials
Zweistufige Analyse, die IPD + AD aus nicht teilenden Studien kombiniert
Besprechen Sie die Gründe für die Nichtteilen
Data lost? Refused? Never requested? Each has different implications.
Ihre IPD-Analyse zeigt OR 0,70.
Verwenden Sie IPD dort, wo Sie es haben (für Interaktionstests).
Ergänzung mit AD zur Abschätzung der Gesamtwirkung.
Transparenz darüber, woher es kommt wobei.
Die offenen Türen können die Wahrheit hinter verschlossenen verbergen.
Always ask: Who refused to share?
And what might they be hiding?"
Hier zitierte wichtige Quellen Kurs
- Riley RD, et al. Individuelle Teilnehmerdaten-Metaanalyse: Ein Handbuch für die Gesundheitsforschung. Wiley, 2021.
- Stewart LA, et al. PRISMA-IPD: Bevorzugte Berichtselemente für systematische Überprüfungen und Metaanalysen individueller Teilnehmerdaten. JAMA 2015;313:1657-65.
- Early Breast Cancer Trialists' Collaborative Group. Tamoxifen for early breast cancer. Cochrane Database Syst Rev 2001.
- Cholesterol Treatment Trialists' Collaboration. Efficacy and safety of LDL-lowering therapy. Lancet 2010;376:1670-81.
- Roberts D, et al. Antenatal corticosteroids for accelerating fetal lung maturation. Cochrane Database Syst Rev 2017.
- IMPACT Study Group. Predicting outcome after traumatic brain injury. PLoS Med 2008;5:e165.
- Debray TPA, et al. Get real in individual participant data meta-analysis. Int J Epidemiol 2015;44:1287-97.
- Burke DL, et al. Meta-analysis using individual participant data. Stat Med 2017;36:320-38.
But you have learned to find them.
You have learned to ask: Who benefits? Who is harmed?
Jetzt gehen Sie – und lassen Sie keinen Patienten im Durchschnitt verschwinden.“
Der verborgene Patient – jetzt sehen Sie ihn.