can be reduced to a single number,
그 숫자에서 생명이 지워지는지 보지 못하셨나요?
그러나 어떤 환자가 혜택을 받았습니까? 젊은이인가, 늙은이인가? 질병이 경증이거나 중증인 경우? 남자입니까, 여자입니까?
전체가 답변할 수 없습니다.
평균적으로 일부 환자는 목숨을 구했고 일부는 피해를 입었습니다.
● Responders ● Non-responders
But who 30%입니까? 개별 데이터가 없으면 응답자와 비응답자를 식별할 수 없습니다. 우리는 precision medicine.
요약을 연습할 수 없습니다. 평균이 아닙니다. Each patient, each tumor, each outcome.
What he discovered changed breast cancer treatment forever.
"Tamoxifen works."
But the individual data revealed:
Giving tamoxifen to ER− patients was useless.
개인에게서 진실이 나타난다.
이것이 우리가 숨은 환자를 찾는 이유이다."
이것이 개인 참가자 데이터 메타분석이다.
What is found when we look closer?
Aggregate Data (AD)
- Study-level summaries
- 출판물의 효과 크기
- Mean age, % male, etc.
- 빠르고 액세스 가능
- Cannot see within-study variation
개별 참가자 데이터(IPD)
- 환자 수준 원시 데이터
- Every participant's characteristics
- Actual ages, actual outcomes
- Time-intensive to obtain
- Can see who responds and who doesn't
Trial A: Mean age 55 years, Effect size 0.70 (benefit)
Trial B: Mean age 75 years, Effect size 0.90 (less benefit)
Tempting conclusion: "The drug works better in younger patients."
But this could be completely wrong.
Perhaps in Trial A, older patients within that trial responded better. Perhaps in Trial B, younger patients within that trial responded better.
개인이 없이는 알 수 없습니다. data.
True Effect Modification
Test whether treatment effect varies by patient characteristics (age, biomarkers, disease severity)
Time-to-Event Analysis
Use actual survival curves, not just hazard ratios. Handle censoring properly.
Consistent Definitions
Standardize outcome definitions, exposure timing, covariate categories across studies
Subgroup Credibility
생태적 오류를 피하면서 연구 내 상호 작용 테스트
Individual data shows each tree.
어떤 나무가 병든지 알아야 하는 경우—
you must walk among them."
gathered data on 170,000 patients
and answered questions no single trial could ask?
27 trials. 174,149 patients. Every baseline characteristic. Every cardiovascular event. Every death.
The published trials asked: "Do statins work?"
CTT 질문: "스타틴은 누구에게 효과가 있습니까?"
그러나 답변할 수 있는 질문은 투자할 가치가 있습니다.
Benefit Proportional to LDL Reduction
Every 1 mmol/L LDL reduction = 22% lower CV events. True across all subgroups.
No Age Threshold
Benefit continues even in patients >75 years (contradicting earlier AD analyses)
Primary Prevention Works
Patients without prior CVD benefit proportionally to their baseline risk
No Cancer Signal
암을 유발하는 스타틴에 대한 우려는 IPD 후속 조치를 통해 확실하게 반박되었습니다
Trial A: "High risk" = 10-year CVD risk >20%
Trial B: "High risk" = Prior MI
Trial C: "High risk" = Diabetes
You cannot compare or combine what is defined differently.
IPD allowed the CTT to redefine everyone consistently.
IPD는
What seemed contradictory becomes clear:
the same truth, measured differently."
데이터 집계에 소요되는 시간 weeks.
언제 투자할 가치가 있습니까?
IPD를 추구해야 합니까?
Time-to-Event Outcomes
최종 위험 비율뿐만 아니라 생존 곡선이 중요한 경우. 검열을 적절하게 처리해야 하는 경우.
Continuous Effect Modifiers
Testing whether treatment effect varies by age, BMI, biomarker level (not just "high" vs "low")
Outcome Definition Problems
시험에서 결과를 다르게 정의하고 표준화해야 하는 경우
Longer Follow-Up Available
시험자가 발표하지 않은 후속 데이터가 있는 경우 include
핵심 질문입니다. "질병의 심각도와 치료 시기에 따라 혜택이 달라지나요?"
Overall Treatment Effect
유일한 질문이 "작동합니까?"일 때 "누구를 위해?"가 아닙니다.
Homogeneous Population
When trials enrolled similar patients and effect modification is unlikely
Binary Outcomes, Short Follow-up
검열이 문제가 되지 않고 결과가 단순한 예/아니오인 경우
IPD Unobtainable
시험 참가자가 공유하지 않으면 데이터가 손실되거나 리소스를 사용할 수 없는 경우
그러나 모든 질문에 about which individuals
데이터에 이들의 존재를 요구합니다."
이제: 다음과 같이 분석하세요. one combined dataset
or trial by trial, then combine?
Two-Stage Approach
- Stage 1: Analyze each trial separately
- 2단계: 결과 메타 분석
- Preserves trial structure
- Familiar (like standard MA)
- Cannot handle sparse data well
One-Stage Approach
- 모든 데이터를 동시에 분석
- Mixed-effects regression model
- 클러스터링
- 희소 데이터에 더 적합
- More flexible modeling
Each trial's estimate is transparent.
익숙한 산림 계획과 I2 statistics.
2. More powerful for detecting interactions
3. Can model complex covariate relationships
4. Exact likelihood (no normal approximations)
One-Stage or Two-Stage?
The one-stage hears all voices at once.
데이터가 희박하고 이벤트가 드문 경우—
1단계 2단계에서 놓친 부분을 포착합니다."
—
but only if given at the right time?
But a puzzle remained: When should they be given?
24 hours before birth? 48 hours? A week?
Published trials couldn't answer—they didn't report timing consistently.
Maximum benefit: 24 hours to 7 days before birth
Reduced benefit: >7 days (lung maturity effect fades)
No benefit: <24 hours (not enough time to work)
After IPD: Guidelines now recommend repeat dosing 처음 후 7일 이내에 배송이 이루어지지 않은 경우 물론입니다.
개별 데이터 없이는 불가능한 이 정밀도에는 saved thousands of premature babies.
Trial B reported: "Steroid given antenatally"
Trial C reported: "Steroid-to-delivery interval: median 3 days"
Different categories. Different definitions. Incompatible summaries.
Only by examining each baby's actual steroid-to-delivery time could the optimal window be identified.
But when 그것을 주는 것은 알 수 없었습니다.
IPD는 '언젠가'를 '적절한 때'로 바꾸었습니다.
그리고 그 정확성 속에서 아이들은 살았습니다."
어딘가의 파일과 데이터베이스
각 환자의 이야기가 기록됩니다..
문제는 환자가 이를 공유할 것인가입니다.
This is expected. Plan for it.
Trialist Collaboration
Direct contact with trial investigators. Build relationships. Offer co-authorship.
데이터 공유 플랫폼
YODA Project, ClinicalStudyDataRequest.com, Vivli, ICPSR
Regulatory Agencies
EMA Policy 0070, FDA (limited), Health Canada
Journal Requirements
Many journals now require data sharing; check supplementary materials
2. Offer co-authorship—make sharing worthwhile
3. 데이터 보안 설명—how you'll protect their patients
4. 데이터 사전 제공—specify exactly what you need
5. Set clear timelines—respect their time
Industry trials: less likely to share
Negative trials: less likely to share
Older trials: data may be lost
Your IPD sample may be biased.
Will they share what they have guarded?
브리지를 구축하세요. 신중하게—
그 다리 위에서는 환자의 미래가 교차합니다."
from twelve trials, five countries, three decades.
But Trial A calls it "cardiovascular death"
및 시험 B가 이를 호출 "cardiac mortality".
동일합니까?
Trial from USA: Age in decimal years (e.g., 65.7)
영국의 시험: 연령 밴드 ("65-74")
Diabetes: HbA1c ≥ 6.5% vs. fasting glucose ≥ 126 vs. "physician diagnosis"
Outcome: "Major adverse cardiac event" (one trial includes stroke, another doesn't)
분석 전: 모든 것을 조화시키세요.
마스터 데이터 생성 사전
Define every variable you need: name, type, permitted values, derivation rules
Map Each Trial's Variables
Document how each trial's coding maps to your standardized definitions
시험 참가자에게 확인
해석을 확인하세요. 그들은 당신보다 자신의 데이터를 더 잘 알고 있습니다.
Validate Transformations
IPD에서 게시된 결과를 재현합니다. 일치하지 않으면 조사하십시오.
6건의 임상시험에서는 표준 정의(ICD 코드)를 사용했습니다. 1990년대 두 건의 임상시험에서는 표준화된 기준 없이 "시험자가 평가한 심장사"를 사용했습니다. 이 두 가지 실험은 더 큰 치료 효과를 보여줍니다.
IPD에서 각 시험의 게시된 결과를 재현합니다.
분석에서 RR = 0.78이지만 출판물에는 RR = 0.85로 나와 있는 경우
something is wrong.
Find the discrepancy. Fix it. Then proceed.
different ways to name the same disease.
수행하기 전에 결합하려면 번역해야 합니다.
번역하기 전에 먼저 이해해야 합니다."
그런데 어린이와 노인 모두에게 동일하게 효과가 있나요?
경증 환자와 중증 환자에게 적용됩니까?
바이오마커가 있는 사람과 없이?
They asked: "Does the effect differ by estrogen receptor status?"
상호작용은 엄청났습니다:
ER-positive: 47% reduction in recurrence
ER-negative: No benefit at all
치료 효과 differs between subgroups defined by the covariate.
그렇지 않은 경우: 치료 효과는 similar across subgroups (or you lack power to detect a difference).
Between-Study Interaction
- Compares trial-level averages
- Ecological fallacy risk
- Confounded by trial design
- Low statistical power
- 집합으로 할 수 있습니다 데이터
Within-Study Interaction
- Compares patients within each trial
- No ecological fallacy
- Randomization preserved
- Much higher power
- Requires IPD
이것은 효과 수정에 대한 표준입니다.
분석에서 8가지 잠재적 효과 수정자를 테스트했습니다.
The interaction reveals who benefits.
연구 사이가 아닌 연구 내에서 테스트하세요.
진실은 여기에 있습니다. "
찾을 때 predict who will die,
who will recover, who will relapse—
개인이 전부입니다.
"Will they ever wake up?"
Individual trials were too small to develop accurate prediction models.
IMPACT는 11개 연구, 9,205명의 환자로부터 IPD를 수집했으며, 초기 임상 특징에서 6개월 결과를 예측하는 모델을 구축했습니다.
External Validation Across Populations
Develop in some studies, validate in others. True test of generalizability.
Non-linear Relationships
Explore how predictors relate to outcome: linear? threshold? U-shaped?
Multiple Predictor Interactions
Age + GCS + pupil reactivity may interact in ways aggregate data cannot reveal
Proper Handling of Missing Predictors
연구 수준이 아닌 환자 수준에서 다중 대치
TRIPOD
- Prediction model reporting
- 개발 및 검증
- 보정 및 차별
- 22 item checklist
PRISMA-IPD
- IPD meta-analysis reporting
- 데이터 획득 세부 정보
- Harmonization process
- Integrity checking
외상성 뇌 손상을 입은 환자가 도착하면 모델은 probability of survival and probability of favorable outcome.
가족과의 대화를 안내합니다. 이는 치료 강도를 알려줍니다. 이는 ICU 리소스를 할당하는 데 도움이 됩니다.
개별 데이터로 구축되었습니다. 개별 환자에게 서비스를 제공합니다.
수천 개의 과거로부터 배워야 합니다.
IPD는 이러한 이야기를 보유하고 있습니다.
each one a teacher, if you will listen."
그들의 마음을 위해 주어진 작은 흰색 판 millions 을 생각해 보지 않으셨나요?
그들은 말함: "이것을 가져가세요. 그러면 당신은 보호받을 것입니다."
But was every heart equally in need of protection?
Researchers quickly re-identified users by matching ratings with public IMDb reviews.
One lawsuit alleged a closeted lesbian was outed through her viewing patterns.
The lesson: removing names isn't anonymization.
IPD에는 고유하게 식별할 수 있는 연령, 진단, 치료 반응 및 날짜의 충분한 조합이 포함되어 있습니다. 개인. 개인 정보 보호에는 이름 열을 삭제하는 것 이상이 필요합니다. 즉, 데이터 조합이 지문이 되는 방식을 이해해야 합니다.
The published trials said: "Aspirin prevents heart attacks."
에서 개별 데이터를 수집했지만 ATT는 다음과 같은 금지된 질문을 했습니다.
"At 비용은 얼마입니까?"
2-3 heart attacks prevented
2-3 major bleeds caused
혜택과 해로움이 사라집니다. out.
이 환자는 1차 예방을 위해 아스피린을 복용해야 합니까?
(benefit > harm)
(benefit ≈ harm)
(harm > benefit)
고위험 환자가
while low-risk patients lost.
Only by examining each patient's baseline risk,
each patient's outcomes,
could the interaction be revealed.
그는 온라인에서 "아스피린이 심장마비를 예방한다"는 내용을 읽고 조언을 구했습니다.
안전합니다.
처방하기 전에 환자의 위험을 파악하십시오.
이것이 개별 데이터가 우리에게 가르쳐 준 것입니다."
95,000 patients. One truth: risk determines benefit.
"노인을 젊은이와 동일하게 대우해야 합니까?"
Some said: "Lower is always better."
다른 사람들은 말했습니다: "노인은 연약합니다. 조심하세요."
누가 맞았나요?
공격적 진영: "Every mmHg of BP reduction saves lives.
Treat everyone to target 120/80."
보수주의자 캠프: "In the elderly, low BP causes falls, strokes, death.
There's a J-curve—too low is dangerous."
Individual trials were too small to settle it. BPLTTC가 개별 데이터를 수집할 때까지.
Is there a J-curve at very low pressures?
Do the very old (>80 years) still benefit?
Age 55-64: 10% lower major CV events
Age 65-74: 10% lower major CV events
Age 75-84: 10% lower major CV events
Age ≥85: Still 10% lower
pinteraction = 0.85였습니다. 연령 수정에 대한 증거가 없습니다.
who achieved very low blood pressures.
Result: No J-curve in randomized comparisons.
명백한 사실 관찰 데이터의 J-곡선은 reverse causation— sick patients have low BP because they're sick, not sick because their BP is low.
RCT의 IPD만이 이를 풀 수 있었습니다.
Should This Elderly Patient Get BP Treatment?
Proportional benefit maintained across all ages
Consider frailty, life expectancy, patient preference—but not age.
BPLTTC IPD 메타 분석을 기억하시나요?
그러나 개별 데이터는 그렇지 않은 것으로 나타났습니다.
At every age, the benefit endures.
Do not let age alone deny protection."
when a clot blocks the brain?
Every minute, two million neurons die.
But when does the window close?
When is it too late to intervene?
But given too late, it causes bleeding into dying brain tissue.
What is the time window? 3 hours? 4.5 hours? 6 hours?
Individual trials disagreed. Guidelines were uncertain.
They knew exactly when each patient's stroke began. They knew exactly when thrombolysis was given. They knew exactly who lived, who died, who recovered.
They could map benefit against time, minute by minute.
Treated at 90 min: 1 in 4 achieve excellent outcome
Treated at 180 min: 1 in 7 achieve excellent outcome
Treated at 270 min: 1 in 14 achieve excellent outcome
Acute Ischemic Stroke: Give Thrombolysis?
URGENTLY
if eligible
imaging
avoid
Trial B: "Patients treated within 6 hours" (average: 4.2 hours)
These overlapping, inconsistent windows couldn't be compared.
Only by knowing each patient's exact time
could the continuous decay of benefit be mapped.
Door-to-needle time will add 30 minutes, making total time ~4.5 hours.
two million neurons perish.
IPD는 우리에게 페이딩 윈도우를 보여주었습니다.
Act quickly, or the window closes forever."
당신은 희망을 가지고 파일을 엽니다.
그러면 다음과 같이 보입니다. empty cells.
Age: 67. Sex: Male. Smoking status: missing.
Outcome at 1 year: missing.
What now?
Missing Completely at Random (MCAR)
Lab machine broke randomly. No relation to patient characteristics. Safe to ignore (but wasteful).
Missing at Random (MAR)
Older patients more likely to miss follow-up. Missingness related to observed variables. Imputation can help.
무작위로 누락되지 않음(MNAR)
결과가 좋지 않은 환자는 탈락합니다. 관련 누락 missing value itself. 위험한. 민감도 분석이 필요합니다.
누락된 값으로 무엇을 해야 합니까?
may suffice
imputation
sensitivity
Multiple imputation (M=20-50 datasets) reflects uncertainty 누락된 값이 무엇인지에 대해 설명합니다.
이는 유효한 표준 오류와 p-값을 유지합니다.
Systematically Missing Variables
Trial A measured biomarker X. Trial B didn't. Can't impute what was never collected.
Multilevel Structure
Patients nested within trials. Imputation model must account for clustering.
Different Follow-up Durations
재판 A는 2년 동안 이어졌습니다. 5년 동안 평가판 B. 생존 분석에는주의가 필요합니다.
Trial Didn't Collect Your Key Covariate
analysis to trials
변수와 함께
varying assumptions
about unmeasured
이 3가지 시험은 오래되고 규모가 작은 경향이 있습니다.
It is a question: 이것이 왜 알려지지 않았습니까?
공백을 메우기 전에 그 질문에 대답하세요.
부재의 이유가 해결책을 결정하기 때문이다."
누가 데이터를 수집했는가 willing trialists
그리고 승리를 선언했는가?
But the unwilling held secrets.
그리고 그 비밀이 모든 것을 바꾸었습니다.
Cochrane reviewers requested trial data to verify efficacy. Roche refused, citing confidentiality.
5년 동안 BMJ는 투명성을 위한 캠페인을 벌였습니다. 2014년에 마침내 전체 임상 연구 보고서가 발표되었을 때 상황이 바뀌었습니다. 타미플루는 증상 기간을 하루 미만으로 줄였고 합병증을 예방하지 못했습니다.
완전한 증거가 숨겨져 있는 약물에 수십억 달러를 지출했습니다.
타미플루 사건은 기대를 변화시켰습니다. 오늘날 임상 시험 투명성은 예외가 아닌 표준이 되고 있습니다.
Industry-sponsored trials: Less likely to share
부정적인 결과가 있는 시험: Less likely to share
Older trials: 데이터가 자주 손실됩니다
If these trials systematically differ in effect size,
IPD-MA가 편향되어 있습니다.
Assessing Availability Bias
for bias
민감도 분석 필요
Report IPD retrieval rate
"12/15 시험에서 IPD를 얻었습니다. (80%)"
Compare IPD vs. non-IPD trial characteristics
총계 데이터의 표본 크기, 자금, 출판 날짜, 효과 크기
Sensitivity analysis including non-IPD trials
비공유 시험의 IPD와 AD를 결합한 2단계 분석
비공유 이유 논의
Data lost? Refused? Never requested? Each has different implications.
귀하의 IPD 분석에서는 OR 0.70을 보여줍니다.
IPD가 있는 곳에서 사용하세요(상호작용 테스트용).
전체 효과 추정을 위해 AD를 보완하세요.
결과에 대한 투명성 where.
열린 문은 잠긴 문 뒤에 진실을 숨길 수 있습니다.
Always ask: Who refused to share?
And what might they be hiding?"
여기에 인용된 주요 출처 과정
- Riley RD, et al. 개별 참가자 데이터 메타 분석: 의료 연구를 위한 핸드북 Wiley, 2021.
- Stewart LA, et al. PRISMA-IPD: 개별 참가자 데이터의 체계적인 검토 및 메타 분석을 위해 선호되는 보고 항목입니다. JAMA 2015;313:1657-65.
- Early Breast Cancer Trialists' Collaborative Group. Tamoxifen for early breast cancer. Cochrane Database Syst Rev 2001.
- Cholesterol Treatment Trialists' Collaboration. Efficacy and safety of LDL-lowering therapy. Lancet 2010;376:1670-81.
- Roberts D, et al. Antenatal corticosteroids for accelerating fetal lung maturation. Cochrane Database Syst Rev 2017.
- IMPACT Study Group. Predicting outcome after traumatic brain injury. PLoS Med 2008;5:e165.
- Debray TPA, et al. Get real in individual participant data meta-analysis. Int J Epidemiol 2015;44:1287-97.
- Burke DL, et al. Meta-analysis using individual participant data. Stat Med 2017;36:320-38.
But you have learned to find them.
You have learned to ask: Who benefits? Who is harmed?
이제 시작하세요. 평균에서 환자가 사라지지 않도록 하세요."
숨겨진 환자 — 이제 그들을 볼 수 있습니다.