can be reduced to a single number,
и в этом числе жизни стерты?
Но какие пациенты получили пользу? Молодой или старый? Те, у кого болезнь легкая или тяжелая? Мужчины или женщины?
Совокупность не может ответить.
В среднем некоторые пациенты были спасены, а некоторые пострадали.
● Responders ● Non-responders
But who это 30%? Без индивидуальных данных мы не можем отличить ответивших от не ответивших. Мы не можем практиковать precision medicine.
Не резюме. Не средние значения. Each patient, each tumor, each outcome.
What he discovered changed breast cancer treatment forever.
"Tamoxifen works."
But the individual data revealed:
Giving tamoxifen to ER− patients was useless.
В человеке проявляется истина.
Вот почему мы ищем скрытого пациента».
Это метаанализ данных отдельных участников.
What is found when we look closer?
Aggregate Data (AD)
- Study-level summaries
- Размеры эффекта из публикаций
- Mean age, % male, etc.
- Быстро и доступно
- Cannot see within-study variation
Индивидуальные данные участника (IPD)
- Необработанные данные на уровне пациента
- Every participant's characteristics
- Actual ages, actual outcomes
- Time-intensive to obtain
- Can see who responds and who doesn't
Trial A: Mean age 55 years, Effect size 0.70 (benefit)
Trial B: Mean age 75 years, Effect size 0.90 (less benefit)
Tempting conclusion: "The drug works better in younger patients."
But this could be completely wrong.
Perhaps in Trial A, older patients within that trial responded better. Perhaps in Trial B, younger patients within that trial responded better.
Вы не можете знать это без индивидуального исследования. данные.
True Effect Modification
Test whether treatment effect varies by patient characteristics (age, biomarkers, disease severity)
Time-to-Event Analysis
Use actual survival curves, not just hazard ratios. Handle censoring properly.
Consistent Definitions
Standardize outcome definitions, exposure timing, covariate categories across studies
Subgroup Credibility
Проверьте взаимодействие в рамках исследований, избегая экологической ошибки
Individual data shows each tree.
Если вам нужно знать, какие деревья больной—
you must walk among them."
gathered data on 170,000 patients
and answered questions no single trial could ask?
27 trials. 174,149 patients. Every baseline characteristic. Every cardiovascular event. Every death.
The published trials asked: "Do statins work?"
CTT задал вопрос: "На кого действуют статины?"
Но вопросы, на которые вы можете ответить стоит вложений.
Benefit Proportional to LDL Reduction
Every 1 mmol/L LDL reduction = 22% lower CV events. True across all subgroups.
No Age Threshold
Benefit continues even in patients >75 years (contradicting earlier AD analyses)
Primary Prevention Works
Patients without prior CVD benefit proportionally to their baseline risk
No Cancer Signal
Опасения по поводу того, что статины вызывают рак, были окончательно опровергнуты при наблюдении за ИПЗ
Trial A: "High risk" = 10-year CVD risk >20%
Trial B: "High risk" = Prior MI
Trial C: "High risk" = Diabetes
You cannot compare or combine what is defined differently.
IPD allowed the CTT to redefine everyone consistently.
IPD обеспечивает перевод.
What seemed contradictory becomes clear:
the same truth, measured differently."
Агрегированные данные требуют weeks.
Когда инвестиции того стоят?
Следует ли вам проводить ИПЗ?
Time-to-Event Outcomes
Когда важны кривые выживаемости, а не только окончательные коэффициенты риска. Когда вам необходимо правильно проводить цензуру.
Continuous Effect Modifiers
Testing whether treatment effect varies by age, BMI, biomarker level (not just "high" vs "low")
Outcome Definition Problems
Когда испытания определяют результаты по-разному, и вам нужно стандартизировать
Longer Follow-Up Available
Если у участников исследования есть неопубликованные данные последующего наблюдения, которые вы хотите включить
Ваш ключевой вопрос: "Зависит ли польза от тяжести заболевания и сроков лечения?"
Overall Treatment Effect
Когда ваш единственный вопрос: «Работает ли это?» а не «Для кого?»
Homogeneous Population
When trials enrolled similar patients and effect modification is unlikely
Binary Outcomes, Short Follow-up
Когда цензура не является проблемой и результаты просты, да/нет
IPD Unobtainable
Когда участники испытаний не делятся данными, данные теряются или ресурсы недоступны
Но каждый вопрос about which individuals
>требует их присутствия в ваших данных."
Теперь: вы анализируете их как one combined dataset
or trial by trial, then combine?
Two-Stage Approach
- Stage 1: Analyze each trial separately
- Этап 2: Метаанализ результатов
- Preserves trial structure
- Familiar (like standard MA)
- Cannot handle sparse data well
One-Stage Approach
- Анализируйте все данные одновременно
- Mixed-effects regression model
- Случайные эффекты для кластеризация
- Лучше для разреженных данных
- More flexible modeling
Each trial's estimate is transparent.
Знакомые лесные участки и I2 statistics.
2. More powerful for detecting interactions
3. Can model complex covariate relationships
4. Exact likelihood (no normal approximations)
One-Stage or Two-Stage?
The one-stage hears all voices at once.
Когда данных мало, а события редки—
одноэтапный ловит то, что упускает двухэтапный."
, который спас жизни младенцев—
but only if given at the right time?
But a puzzle remained: When should they be given?
24 hours before birth? 48 hours? A week?
Published trials couldn't answer—they didn't report timing consistently.
Maximum benefit: 24 hours to 7 days before birth
Reduced benefit: >7 days (lung maturity effect fades)
No benefit: <24 hours (not enough time to work)
After IPD: Guidelines now recommend repeat dosing если роды не произошли в течение 7 дней после первых
Эта точность, невозможная без индивидуальных данных, имеет saved thousands of premature babies.
Trial B reported: "Steroid given antenatally"
Trial C reported: "Steroid-to-delivery interval: median 3 days"
Different categories. Different definitions. Incompatible summaries.
Only by examining each baby's actual steroid-to-delivery time could the optimal window be identified.
But when отдать его было неизвестно.
IPD превратил «когда-нибудь» в «нужное время»—
и в такой точности жили дети.»
Где-то в файлах и базах данных,
история каждого пациента записывается.
Вопрос в том, поделятся ли они этим?
This is expected. Plan for it.
Trialist Collaboration
Direct contact with trial investigators. Build relationships. Offer co-authorship.
Платформы обмена данными
YODA Project, ClinicalStudyDataRequest.com, Vivli, ICPSR
Regulatory Agencies
EMA Policy 0070, FDA (limited), Health Canada
Journal Requirements
Many journals now require data sharing; check supplementary materials
2. Offer co-authorship—make sharing worthwhile
3. Опишите безопасность данных.—how you'll protect their patients
4. Предоставьте словари данных—specify exactly what you need
5. Set clear timelines—respect their time
Industry trials: less likely to share
Negative trials: less likely to share
Older trials: data may be lost
Your IPD sample may be biased.
Will they share what they have guarded?
Стройте мост осторожно —
ибо на этом мосту пересекаются судьбы пациентов».
from twelve trials, five countries, three decades.
But Trial A calls it "cardiovascular death"
и в Испытании Б это называется "cardiac mortality".
Они одинаковые?
Trial from USA: Age in decimal years (e.g., 65.7)
Испытание из Великобритании: Возрастные группы («65–74»)
Diabetes: HbA1c ≥ 6.5% vs. fasting glucose ≥ 126 vs. "physician diagnosis"
Outcome: "Major adverse cardiac event" (one trial includes stroke, another doesn't)
Перед анализом: гармонизируйте все.
Создайте словарь основных данных
Define every variable you need: name, type, permitted values, derivation rules
Map Each Trial's Variables
Document how each trial's coding maps to your standardized definitions
Проконсультируйтесь с триалистами
Проверьте свои интерпретации. Они знают свои данные лучше, чем вы.
Validate Transformations
Воспроизведите опубликованные результаты IPD. Если они не совпадают, проведите расследование.
В шести исследованиях использовалось стандартное определение (коды МКБ). В двух исследованиях 1990-х годов использовалась «сердечная смерть по оценке исследователя» без каких-либо стандартизированных критериев. Эти два исследования показывают больший эффект лечения.
Воспроизведите опубликованные результаты каждого исследования из IPD.
Если ваш анализ дает RR = 0,78, но в публикации указано RR = 0,85,
something is wrong.
Find the discrepancy. Fix it. Then proceed.
different ways to name the same disease.
Прежде чем вы сможете объединить, вы должны перевести.
Прежде чем переводить, вы должны понять».
Но работает ли это одинаково для молодых и старых?
Для легких и тяжелых?
Для того, у кого есть биомаркер, и для того, у кого нет?
They asked: "Does the effect differ by estrogen receptor status?"
Взаимодействие было масштабным:
ER-positive: 47% reduction in recurrence
ER-negative: No benefit at all
Эффект лечения differs between subgroups defined by the covariate.
Если нет: эффект лечения similar across subgroups (or you lack power to detect a difference).
Between-Study Interaction
- Compares trial-level averages
- Ecological fallacy risk
- Confounded by trial design
- Low statistical power
- Можно использовать агрегированные данные
Within-Study Interaction
- Compares patients within each trial
- No ecological fallacy
- Randomization preserved
- Much higher power
- Requires IPD
Это золотой стандарт модификации эффектов.
В ходе анализа вы протестировали 8 потенциальных модификаторов эффекта.
The interaction reveals who benefits.
Проверьте это в рамках учебы, а не между…
ибо именно там находится истина».
Когда вы стремитесь predict who will die,
who will recover, who will relapse—
личность - это все.
"Will they ever wake up?"
Individual trials were too small to develop accurate prediction models.
IMPACT собрал IPD из 11 исследований, 9205 пациентов, и построил модель, которая предсказывает 6-месячные результаты на основе начальных клинических особенностей.
External Validation Across Populations
Develop in some studies, validate in others. True test of generalizability.
Non-linear Relationships
Explore how predictors relate to outcome: linear? threshold? U-shaped?
Multiple Predictor Interactions
Age + GCS + pupil reactivity may interact in ways aggregate data cannot reveal
Proper Handling of Missing Predictors
Множественное вменение на уровне пациента, а не на уровне исследования
TRIPOD
- Prediction model reporting
- Разработка и валидация
- Калибровка и дискриминация
- 22 item checklist
PRISMA-IPD
- IPD meta-analysis reporting
- Подробности получения данных
- Harmonization process
- Integrity checking
Когда пациент поступает с черепно-мозговой травмой, модель обеспечивает probability of survival and probability of favorable outcome.
Это направляет беседы с семьями. Это влияет на интенсивность лечения. Это помогает распределить ресурсы отделения интенсивной терапии.
Построено на основе индивидуальных данных. Обслуживание отдельных пациентов.
вы должны учиться на тысячах прошлых событий.
IPD хранит эти истории…
each one a teacher, if you will listen."
что было дано millions для их сердец?
Им сказали: «Возьмите это, и вы будете защищены».
But was every heart equally in need of protection?
Researchers quickly re-identified users by matching ratings with public IMDb reviews.
One lawsuit alleged a closeted lesbian was outed through her viewing patterns.
The lesson: removing names isn't anonymization.
IPD содержит достаточное количество комбинаций возраста, диагноза, реакции на лечение и дат, чтобы однозначно идентифицировать людей. Конфиденциальность требует большего, чем просто удаление столбца имени: необходимо понимание того, как комбинации данных становятся отпечатками пальцев.
The published trials said: "Aspirin prevents heart attacks."
Но ДТО задал запрещенный вопрос:
«Какой ценой? И для кого?»
2-3 heart attacks prevented
2-3 major bleeds caused
Польза и вред компенсируются.
Следует ли этому пациенту принимать аспирин для первичной профилактики?
(benefit > harm)
(benefit ≈ harm)
(harm > benefit)
Они не смогли доказать, что пациенты из группы высокого риска получили
while low-risk patients lost.
Only by examining each patient's baseline risk,
each patient's outcomes,
could the interaction be revealed.
Он прочитал в Интернете, что «аспирин предотвращает сердечные приступы», и хочет вашего совета.
может нанести вред безопасности.
Прежде чем назначать препарат, узнайте о риске для вашего пациента.
Именно этому нас научили отдельные данные».
95,000 patients. One truth: risk determines benefit.
«Следует ли относиться к старикам так же, как и к молодым?»
Some said: "Lower is always better."
Другие говорили: «Старые хрупки. Будьте осторожны».
Кто был прав?
Агрессивный лагерь: "Every mmHg of BP reduction saves lives.
Treat everyone to target 120/80."
Консерватор Лагерь: "In the elderly, low BP causes falls, strokes, death.
There's a J-curve—too low is dangerous."
Individual trials were too small to settle it. Пока BPLTTC не соберет отдельные данные.
Is there a J-curve at very low pressures?
Do the very old (>80 years) still benefit?
Age 55-64: 10% lower major CV events
Age 65-74: 10% lower major CV events
Age 75-84: 10% lower major CV events
Age ≥85: Still 10% lower
pinteraction = 0,85. Никаких признаков возрастной модификации.
who achieved very low blood pressures.
Result: No J-curve in randomized comparisons.
Очевидно J-кривая в данных наблюдений была reverse causation— sick patients have low BP because they're sick, not sick because their BP is low.
Только ИПД из РКИ могло распутать это.
Should This Elderly Patient Get BP Treatment?
Proportional benefit maintained across all ages
Consider frailty, life expectancy, patient preference—but not age.
Вы помните метаанализ BPLTTC IPD.
Но отдельные данные показали обратное:
At every age, the benefit endures.
Do not let age alone deny protection."
when a clot blocks the brain?
Every minute, two million neurons die.
But when does the window close?
When is it too late to intervene?
But given too late, it causes bleeding into dying brain tissue.
What is the time window? 3 hours? 4.5 hours? 6 hours?
Individual trials disagreed. Guidelines were uncertain.
They knew exactly when each patient's stroke began. They knew exactly when thrombolysis was given. They knew exactly who lived, who died, who recovered.
They could map benefit against time, minute by minute.
Treated at 90 min: 1 in 4 achieve excellent outcome
Treated at 180 min: 1 in 7 achieve excellent outcome
Treated at 270 min: 1 in 14 achieve excellent outcome
Acute Ischemic Stroke: Give Thrombolysis?
URGENTLY
if eligible
imaging
avoid
Trial B: "Patients treated within 6 hours" (average: 4.2 hours)
These overlapping, inconsistent windows couldn't be compared.
Only by knowing each patient's exact time
could the continuous decay of benefit be mapped.
Door-to-needle time will add 30 minutes, making total time ~4.5 hours.
two million neurons perish.
IPD показал нам окно затухания.
Act quickly, or the window closes forever."
Вы открываете файлы с надеждой.
И тогда вы видите это: empty cells.
Age: 67. Sex: Male. Smoking status: missing.
Outcome at 1 year: missing.
What now?
Missing Completely at Random (MCAR)
Lab machine broke randomly. No relation to patient characteristics. Safe to ignore (but wasteful).
Missing at Random (MAR)
Older patients more likely to miss follow-up. Missingness related to observed variables. Imputation can help.
Пропало не случайно (MNAR)
Пациенты с плохими результатами выбывают из исследования. Отсутствие, связанное с missing value itself. Опасный. Требуется анализ чувствительности.
Что делать с отсутствующими значениями?
may suffice
imputation
sensitivity
Multiple imputation (M=20-50 datasets) reflects uncertainty о том, каким могло быть недостающее значение.
Это сохраняет допустимые стандартные ошибки и значения p.
Systematically Missing Variables
Trial A measured biomarker X. Trial B didn't. Can't impute what was never collected.
Multilevel Structure
Patients nested within trials. Imputation model must account for clustering.
Different Follow-up Durations
Испытание А длилось 2 года. Испытание Б на 5 лет. Анализ выживаемости требует осторожности.
Trial Didn't Collect Your Key Covariate
analysis to trials
с переменной
varying assumptions
about unmeasured
Эти три исследования, как правило, старше и меньше по размеру.
It is a question: Почему это неизвестно?
Ответьте на этот вопрос, прежде чем заполнить пробел —
причина отсутствия определяет решение».
который собрал данные из willing trialists
и объявил победу?
But the unwilling held secrets.
И эти тайны изменили всё.
Cochrane reviewers requested trial data to verify efficacy. Roche refused, citing confidentiality.
В течение пяти лет BMJ выступал за прозрачность. Когда в 2014 году наконец были опубликованы полные отчеты о клинических исследованиях, картина изменилась: Тамифлю сократил продолжительность симптомов менее чем на день и не предотвратил осложнений.
Миллиарды потрачены на препарат, все доказательства которого были заперты.
Сага о Тамифлю изменила ожидания: сегодня прозрачность клинических исследований становится нормой, а не исключением.
Industry-sponsored trials: Less likely to share
Испытания с отрицательными результатами: Less likely to share
Older trials: Данные часто теряются
If these trials systematically differ in effect size,
ваш IPD-MA предвзят.
Assessing Availability Bias
for bias
Необходим анализ чувствительности
Report IPD retrieval rate
«Мы получили ИПЗ в 12 из 15 исследований (80%)»
Compare IPD vs. non-IPD trial characteristics
Размер выборки, финансирование, дата публикации, размер эффекта на основе совокупных данных
Sensitivity analysis including non-IPD trials
Двухэтапный анализ, объединяющий IPD + AD из исследований без совместного использования
Обсудите причины отказа от обмена
Data lost? Refused? Never requested? Each has different implications.
Ваш анализ IPD показывает OR 0,70.
Используйте IPD там, где он у вас есть (для тестирования взаимодействия).
Дополните AD для оценки общего эффекта.
Прозрачность о том, что и откуда.
Открытые двери могут скрыть правду за запертыми.
Always ask: Who refused to share?
And what might they be hiding?"
Ключевые источники, цитируемые в этом курсе
- Riley RD, et al. Метаанализ данных отдельных участников: Справочник по исследованиям в области здравоохранения. Wiley, 2021.
- Стюарт Л.А. и др. PRISMA-IPD: Предпочтительные элементы отчетности для систематических обзоров и метаанализа данных отдельных участников. JAMA 2015;313:1657-65.
- Early Breast Cancer Trialists' Collaborative Group. Tamoxifen for early breast cancer. Cochrane Database Syst Rev 2001.
- Cholesterol Treatment Trialists' Collaboration. Efficacy and safety of LDL-lowering therapy. Lancet 2010;376:1670-81.
- Roberts D, et al. Antenatal corticosteroids for accelerating fetal lung maturation. Cochrane Database Syst Rev 2017.
- IMPACT Study Group. Predicting outcome after traumatic brain injury. PLoS Med 2008;5:e165.
- Debray TPA, et al. Get real in individual participant data meta-analysis. Int J Epidemiol 2015;44:1287-97.
- Burke DL, et al. Meta-analysis using individual participant data. Stat Med 2017;36:320-38.
But you have learned to find them.
You have learned to ask: Who benefits? Who is harmed?
А теперь идите — и не позволяйте ни одному пациенту исчезнуть в среднем».
Скрытый пациент — теперь вы его видите.