द हिडन पेशेंट: व्यक्तिगत प्रतिभागी डेटा मेटा-विश्लेषण पर एक कोर्स

क्या आपने नहीं देखा कि कैसे एक हजार मरीज
can be reduced to a single number,
और उस संख्या में जानें मिट जाती हैं?

स्लाइड 1.2: समग्र भ्रम

कुल भ्रम

EVERY META-ANALYSIS YOU'VE EVER READ

A meta-analysis reports: "Treatment reduces mortality by 15%."

लेकिन किन मरीजों को फायदा हुआ? युवा या बूढ़े? जिनको हल्की बीमारी है या गंभीर? पुरुष या महिला?

कुल उत्तर नहीं दे सकता।

औसत के भीतर, कुछ रोगियों को बचा लिया गया - और कुछ को नुकसान पहुँचाया गया।

स्लाइड 1.3: छिपी हुई विषमता

What Aggregates Hide

● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●

● Responders ● Non-responders

THE TRAGEDY

"Overall benefit: 30%"

But who 30% हैं? व्यक्तिगत डेटा के बिना, हम गैर-उत्तरदाताओं में से उत्तरदाताओं की पहचान नहीं कर सकते। हम अभ्यास नहीं कर सकते precision medicine.

Oxford, 1985

EARLY BREAST CANCER TRIALISTS' COLLABORATIVE GROUP

Richard Peto gathered something unprecedented: the raw data on every woman in every tamoxifen trial.

नहीं सारांश। औसत नहीं। Each patient, each tumor, each outcome.

What he discovered changed breast cancer treatment forever.

Early Breast Cancer Trialists' Collaborative Group. Lancet 1988;2:61-72

स्लाइड 1.5: डिस्कवरी

प्रकाशित परीक्षणों में कहा गया:
"Tamoxifen works."

But the individual data revealed:

ER+ vs ER−

Tamoxifen only worked in estrogen receptor positive tumors

क्या छिपा हुआ था

कोई भी एकल परीक्षण इस इंटरैक्शन का पता लगाने के लिए पर्याप्त बड़ा नहीं था। केवल सभी परीक्षणों से व्यक्तिगत रोगी डेटा को मिलाकर ही सच्चाई सामने आ सकती है:

Giving tamoxifen to ER− patients was useless.

स्लाइड 1.6: बचना

"कुल मिलाकर, व्यक्ति गायब हो जाता है।
व्यक्ति में, सत्य प्रकट होता है।
यही कारण है कि हम छिपे हुए रोगी की तलाश करते हैं।"

यह व्यक्तिगत प्रतिभागी डेटा है मेटा-विश्लेषण।

What is lost when we summarize?
What is found when we look closer?

स्लाइड 2.2: दो दृष्टिकोण

Two Ways to Synthesize

Aggregate Data (AD)

Study-level summaries
प्रकाशनों से प्रभाव आकार
Mean age, % male, etc.
त्वरित और सुलभ
Cannot see within-study variation

व्यक्तिगत प्रतिभागी डेटा (IPD)

रोगी स्तर का कच्चा डेटा
Every participant's characteristics
Actual ages, actual outcomes
Time-intensive to obtain
Can see who responds and who doesn't

स्लाइड 2.3: पारिस्थितिक भ्रांति

पारिस्थितिक भ्रांति

एकत्रित सोच का खतरा

Imagine two trials of a drug for heart failure.

Trial A: Mean age 55 years, Effect size 0.70 (benefit)
Trial B: Mean age 75 years, Effect size 0.90 (less benefit)

Tempting conclusion: "The drug works better in younger patients."

But this could be completely wrong.

The Trap

ECOLOGICAL FALLACY

प्रत्येक परीक्षण के भीतर, उम्र और उपचार प्रभाव के बीच का संबंध completely different परीक्षण के बीच के संबंध से हो सकता है।

Perhaps in Trial A, older patients within that trial responded better. Perhaps in Trial B, younger patients within that trial responded better.

आप व्यक्ति के बिना नहीं जान सकते डेटा।

THE RULE

Between-study relationships ≠ Within-study relationships

Aggregate data can only show between-study patterns

What IPD Enables

1

True Effect Modification

Test whether treatment effect varies by patient characteristics (age, biomarkers, disease severity)

2

Time-to-Event Analysis

Use actual survival curves, not just hazard ratios. Handle censoring properly.

3

Consistent Definitions

Standardize outcome definitions, exposure timing, covariate categories across studies

4

Subgroup Credibility

पारिस्थितिक भ्रांति से बचते हुए, अध्ययन के भीतर परस्पर क्रिया का परीक्षण करें

"कुल डेटा जंगल को दर्शाता है।
Individual data shows each tree.
यदि आपको यह जानना है कि कौन से पेड़ बीमार हैं-
you must walk among them."

क्या आपने नहीं देखा कि कैसे one collaboration
gathered data on 170,000 patients
and answered questions no single trial could ask?

स्लाइड 3.2: सीटीटी

Oxford, 1994-Present

CHOLESTEROL TREATMENT TRIALISTS' COLLABORATION

सीटीटी ने व्यक्तिगत डेटा एकत्र किया से every major statin trial.

27 trials. 174,149 patients. Every baseline characteristic. Every cardiovascular event. Every death.

The published trials asked: "Do statins work?"

CTT ने पूछा: "स्टैटिन किसके लिए काम करते हैं?"

CTT Collaboration. Lancet 2010;376:1670-81

स्लाइड 3.3: संख्याएँ

आईपीडी का पैमाना

27

Trials Combined

174,149

Individual Patients

5

डेटा के वर्ष इकट्ठा करना

THE INVESTMENT

आईपीडी इकट्ठा करने में वर्षों की बातचीत, डेटा ट्रांसफर, सफाई और सामंजस्य स्थापित होता है।

लेकिन जिन सवालों का आप जवाब दे सकते हैं वे हैं निवेश के लायक.

स्लाइड 3.4: खोज

What CTT Discovered

✓

Benefit Proportional to LDL Reduction

Every 1 mmol/L LDL reduction = 22% lower CV events. True across all subgroups.

✓

No Age Threshold

Benefit continues even in patients >75 years (contradicting earlier AD analyses)

✓

Primary Prevention Works

Patients without prior CVD benefit proportionally to their baseline risk

✗

No Cancer Signal

कैंसर पैदा करने वाले स्टैटिन के बारे में चिंताओं को आईपीडी फॉलो-अप के साथ निश्चित रूप से खारिज कर दिया गया था

स्लाइड 3.5: AD उत्तर क्यों नहीं दे सका

कुल डेटा विफल क्यों हुआ

THE LIMITATION

Published trials categorized patients differently.

Trial A: "High risk" = 10-year CVD risk >20%
Trial B: "High risk" = Prior MI
Trial C: "High risk" = Diabetes

You cannot compare or combine what is defined differently.

IPD allowed the CTT to redefine everyone consistently.

"When trials speak different languages,
आईपीडी प्रदान करता है अनुवाद।
What seemed contradictory becomes clear:
the same truth, measured differently."

IPD takes years to gather.
कुल डेटा लेता है weeks.

निवेश कब लायक है?

स्लाइड 4.2: निर्णय रूपरेखा

निर्णय वृक्ष

क्या आपको आगे बढ़ना चाहिए आईपीडी?

क्या आपका प्रश्न उपचार प्रभाव संशोधन के बारे में है?

↓

YES

"Who benefits most?"

NO

"Does it work overall?"

↓

IPD likely needed

AD may suffice

When IPD Is Essential

1

Time-to-Event Outcomes

जब उत्तरजीविता वक्र मायने रखता है, न कि केवल अंतिम जोखिम अनुपात। जब आपको सेंसरिंग को ठीक से संभालने की आवश्यकता होती है।

2

Continuous Effect Modifiers

Testing whether treatment effect varies by age, BMI, biomarker level (not just "high" vs "low")

3

Outcome Definition Problems

जब परीक्षण परिणामों को अलग-अलग परिभाषित करते हैं और आपको मानकीकृत करने की आवश्यकता होती है

4

Longer Follow-Up Available

जब परीक्षणकर्ताओं के पास होता है। अप्रकाशित अनुवर्ती डेटा जिसे आप शामिल करना चाहते हैं

🔀 अनुसंधान रणनीति निर्णय

आप COVID-19 निमोनिया के लिए कॉर्टिकोस्टेरॉइड्स के मेटा-विश्लेषण की योजना बना रहे हैं। आपके पास प्रकाशित डेटा के साथ 10 योग्य आरसीटी हैं। एक सहकर्मी पूछता है: "क्या हमें आईपीडी प्राप्त करने का प्रयास करना चाहिए, या बस एक समग्र बनाना चाहिए विश्लेषण?"

आपका मुख्य प्रश्न है: "क्या लाभ रोग की गंभीरता और उपचार के समय के अनुसार भिन्न होता है?"

आप क्या सलाह देते हैं?

A बस AD करें - हमें तुरंत परिणाम चाहिए और IPD में बहुत अधिक समय लगता है

B IPD अपनाएं - हमारा प्रश्न प्रभाव संशोधन के बारे में है रोगी की विशेषताएं

C प्रकाशनों से परीक्षण-स्तर की गंभीरता श्रेणियों द्वारा उपसमूह विश्लेषण करें

जब समग्र डेटा पर्याप्त हो

✓

Overall Treatment Effect

जब आपका एकमात्र प्रश्न यह हो कि "क्या यह काम करता है?" नहीं "किसके लिए?"

✓

Homogeneous Population

When trials enrolled similar patients and effect modification is unlikely

✓

Binary Outcomes, Short Follow-up

जब सेंसरिंग कोई मुद्दा नहीं है और परिणाम सरल हाँ/नहीं हैं

✓

IPD Unobtainable

जब परीक्षणकर्ता साझा नहीं करेंगे, तो डेटा खो जाता है, या संसाधन अनुपलब्ध होते हैं

"प्रत्येक प्रश्न के लिए व्यक्ति की आवश्यकता नहीं होती है।
लेकिन हर सवाल के बारे में which individuals
आपके डेटा में उनकी उपस्थिति की मांग करता है।"

आपने व्यक्तिगत डेटा एकत्र कर लिया है.

अब: क्या आप इसका विश्लेषण इस प्रकार करते हैं? one combined dataset
or trial by trial, then combine?

Two Analytical Approaches

Two-Stage Approach

Stage 1: Analyze each trial separately
चरण 2: परिणामों का मेटा-विश्लेषण करें
Preserves trial structure
Familiar (like standard MA)
Cannot handle sparse data well

One-Stage Approach

सभी डेटा का एक साथ विश्लेषण करें
Mixed-effects regression model
क्लस्टरिंग के लिए यादृच्छिक प्रभाव
विरल डेटा के लिए बेहतर
More flexible modeling

दो-चरण: परिचित पथ

STAGE 1 (Within Each Trial)

Estimate treatment effect for trial k: θ_k

उस परीक्षण से व्यक्तिगत रोगी डेटा का उपयोग करना

STAGE 2 (Across Trials)

Meta-analyze θ₁, θ₂, ... θ_K

मानक यादृच्छिक-प्रभाव विधियों का उपयोग करना

ADVANTAGE

Easy to understand. Easy to explain.
Each trial's estimate is transparent.
परिचित वन भूखंड और मैं² statistics.

एक-चरण: शक्तिशाली पथ

MIXED-EFFECTS MODEL

Y_ij = β₀ + β₁Treatment_ij + u_j + ε_ij

i = patient, j = trial, u_j = random trial effect

ADVANTAGES

1. Handles trials with zero events (no continuity corrections)
2. More powerful for detecting interactions
3. Can model complex covariate relationships
4. Exact likelihood (no normal approximations)

अपना दृष्टिकोण चुनना

One-Stage or Two-Stage?

Do trials have sparse events (rare outcomes)?

↓

YES (sparse)

↓

One-stage preferred

Avoids zero-cell problems

NO (common events)

↓

Either works

परिणाम समान होने चाहिए

"The two-stage preserves each trial's voice.
The one-stage hears all voices at once.
जब डेटा विरल हो और घटनाएँ दुर्लभ हों—
एक-चरण वह पकड़ लेता है जो दो-चरण में छूट जाता है।"

क्या आपने दवा की कहानी नहीं सुनी
जिसने बच्चों की जान बचाई-
but only if given at the right time?

समयपूर्व विरोधाभास

NEONATAL INTENSIVE CARE UNITS WORLDWIDE

प्रसवपूर्व कॉर्टिकोस्टेरॉइड समय से पहले जन्मे शिशुओं में मृत्यु दर को कम करते हैं। इसकी स्थापना 1970 के दशक में हुई थी.

But a puzzle remained: When should they be given?

24 hours before birth? 48 hours? A week?

Published trials couldn't answer—they didn't report timing consistently.

Roberts D, et al. Cochrane Database Syst Rev 2017

स्लाइड 6.3: आईपीडी समाधान

आईपीडी ने विंडो का खुलासा किया

24h-7d

Optimal Window

>7 days

Benefit Wanes

THE DISCOVERY

By examining each baby's exact time from steroid to delivery, IPD meta-analysis showed:

Maximum benefit: 24 hours to 7 days before birth
Reduced benefit: >7 days (lung maturity effect fades)
No benefit: <24 hours (not enough time to work)

Lives Saved, Practice Changed

नैदानिक प्रभाव

आईपीडी से पहले: चिकित्सकों ने स्टेरॉयड दिए और बेहतरी की आशा की।

After IPD: Guidelines now recommend repeat dosing यदि पहले कोर्स के 7 दिनों के भीतर डिलीवरी नहीं हुई है।

यह परिशुद्धता-व्यक्तिगत डेटा के बिना असंभव-है saved thousands of premature babies.

Timing is Treatment

गलत समय पर दी गई वही दवा प्लेसिबो भी हो सकती है

समग्र डेटा यह क्यों नहीं दिखा सका?

THE PROBLEM

Trial A reported: "Steroid given within 48 hours"
Trial B reported: "Steroid given antenatally"
Trial C reported: "Steroid-to-delivery interval: median 3 days"

Different categories. Different definitions. Incompatible summaries.

Only by examining each baby's actual steroid-to-delivery time could the optimal window be identified.

"दवा काम करने के लिए जानी जाती थी।
But when इसे देना अज्ञात था।
आईपीडी ने 'कुछ समय' को 'सही समय' में बदल दिया-
और उस परिशुद्धता में, बच्चे रहते थे।"

डेटा मौजूद है।
कहीं, फाइलों और डेटाबेस में,
प्रत्येक मरीज की कहानी दर्ज की जाती है.

सवाल यह है: क्या वे इसे साझा करेंगे?

स्लाइड 7.2: क्वेस्ट

डेटा की खोज

60-80%

Typical IPD Retrieval Rate

6-24

Months to Gather

REALITY CHECK

आपको संभवतः not get 100% of trials. Some investigators will refuse. Some data is lost. Some companies won't share.

This is expected. Plan for it.

स्लाइड 7.3: डेटा स्रोत

Where IPD Lives

1

Trialist Collaboration

Direct contact with trial investigators. Build relationships. Offer co-authorship.

2

डेटा शेयरिंग प्लेटफ़ॉर्म

YODA Project, ClinicalStudyDataRequest.com, Vivli, ICPSR

3

Regulatory Agencies

EMA Policy 0070, FDA (limited), Health Canada

4

Journal Requirements

Many journals now require data sharing; check supplementary materials

स्लाइड 7.4: सहयोग पत्र

The Approach

HOW TO ASK

1. अपने प्रश्न का नेतृत्व करें—explain why IPD is essential

2. Offer co-authorship—make sharing worthwhile

3. डेटा सुरक्षा का वर्णन करें—how you'll protect their patients

4. डेटा शब्दकोश प्रदान करें—specify exactly what you need

5. Set clear timelines—respect their time

उपलब्धता पूर्वाग्रह जाल

THE DANGER

क्या होगा यदि परीक्षण जो share data उन परीक्षणों से व्यवस्थित रूप से भिन्न हैं don't share?

Industry trials: less likely to share
Negative trials: less likely to share
Older trials: data may be lost

Your IPD sample may be biased.

THE RULE

Always compare: IPD trials vs. non-IPD trials

Do they differ in effect size, sample size, funding source?

"डेटा मौजूद है। प्रश्न विश्वास का है।
Will they share what they have guarded?
पुल का निर्माण करें ध्यान से—
क्योंकि उस पुल पर, मरीजों का भविष्य पार हो जाता है।"

आपने एकत्र कर लिया है डेटा
from twelve trials, five countries, three decades.

But Trial A calls it "cardiovascular death"
और ट्रायल बी इसे कहता है "cardiac mortality".

क्या वे समान हैं?

स्लाइड 8.2: हार्मोनाइजेशन चैलेंज

द टॉवर ऑफ बैबल प्रॉब्लम

EVERY IPD META-ANALYSIS

Trial from Japan: Age in years since 1900 (e.g., "54" = 1954 birth)
Trial from USA: Age in decimal years (e.g., 65.7)
ट्रायल फ्रॉम यूके: आयु बैंड ("65-74")

Diabetes: HbA1c ≥ 6.5% vs. fasting glucose ≥ 126 vs. "physician diagnosis"

Outcome: "Major adverse cardiac event" (one trial includes stroke, another doesn't)

विश्लेषण से पहले: हर चीज में सामंजस्य बिठाएं।

स्लाइड 8.3: प्रक्रिया

सामंजस्य प्रक्रिया

1

एक मास्टर डेटा बनाएं शब्दकोश

Define every variable you need: name, type, permitted values, derivation rules

2

Map Each Trial's Variables

Document how each trial's coding maps to your standardized definitions

3

परीक्षणकर्ताओं से जांचें

अपनी व्याख्याओं को सत्यापित करें। वे अपने डेटा को आपसे बेहतर जानते हैं।

4

Validate Transformations

आईपीडी से प्रकाशित परिणाम पुन: प्रस्तुत करें। If they don't match, investigate.

🔀 परिभाषा दुविधा

You're harmonizing IPD from 8 diabetes trials. आपका प्राथमिक परिणाम "हृदय मृत्यु" है।

छह परीक्षणों में एक मानक परिभाषा (ICD कोड) का उपयोग किया गया। 1990 के दशक के दो परीक्षणों में बिना किसी मानकीकृत मानदंड के "जांचकर्ता द्वारा मूल्यांकन की गई हृदय मृत्यु" का उपयोग किया गया। ये दो परीक्षण बड़े उपचार प्रभाव दिखाते हैं।

आप इसे कैसे संभालते हैं?

A सभी 8 परीक्षण शामिल करें - अधिक डेटा बेहतर है और परिभाषाएँ "काफी करीब" हैं

B Exclude the 2 non-standardized trials to maintain outcome consistency

C 6 सुसंगत परीक्षणों के साथ प्राथमिक विश्लेषण; संवेदनशीलता विश्लेषण 2 अन्य को जोड़कर

स्लाइड 8.5: सत्यापन चरण

महत्वपूर्ण मान्यता

THE TEST

किसी भी नए विश्लेषण से पहले:

आईपीडी से प्रत्येक परीक्षण के प्रकाशित परिणामों को पुन: प्रस्तुत करें।

यदि आपका विश्लेषण आरआर = 0.78 देता है लेकिन प्रकाशन कहता है आरआर = 0.85,
something is wrong.

Find the discrepancy. Fix it. Then proceed.

"Different languages, different rulers,
different ways to name the same disease.
इससे पहले कि आप संयोजन कर सकें, आपको अनुवाद करना होगा।
अनुवाद करने से पहले, आपको समझना होगा।"

इलाज काम करता है on average.

लेकिन क्या यह युवाओं और बूढ़ों के लिए समान रूप से काम करता है?
हल्के और गंभीर के लिए?
बायोमार्कर वाले वाले के लिए और उसके बिना वाले वाले के लिए?

इंटरेक्शन जिसने ऑन्कोलॉजी को बदल दिया

EBCTCG, 1985-1998

The Early Breast Cancer Trialists' Group didn't just ask "Does tamoxifen work?"

They asked: "Does the effect differ by estrogen receptor status?"

बातचीत बड़े पैमाने पर थी:

ER-positive: 47% reduction in recurrence
ER-negative: No benefit at all

EBCTCG. Lancet 1998;351:1451-67

p_interaction < 0.00001

The most important interaction in cancer medicine

Testing Treatment-Covariate Interactions

THE MODEL

Outcome = β₁Treatment + β₂Covariate + β₃(Treatment × Covariate)

β₃ is the interaction term - does treatment effect vary by covariate?

INTERPRETATION

If β₃ is statistically significant:

उपचार प्रभाव differs between subgroups defined by the covariate.

यदि नहीं: उपचार प्रभाव है similar across subgroups (or you lack power to detect a difference).

महत्वपूर्ण अंतर

Between-Study Interaction

Compares trial-level averages
Ecological fallacy risk
Confounded by trial design
Low statistical power
समग्र डेटा के साथ कर सकते हैं

Within-Study Interaction

Compares patients within each trial
No ecological fallacy
Randomization preserved
Much higher power
Requires IPD

मुख्य अंतर्दृष्टि

आईपीडी आपको परीक्षण करने की अनुमति देता है within-study interactions, where randomization ensures the comparison is fair.

प्रभाव संशोधन के लिए यह स्वर्ण मानक है।

🔀 आयु इंटरेक्शन प्रश्न

एट्रियल फाइब्रिलेशन के लिए एंटीकोआग्यूलेशन के आपके आईपीडी मेटा-विश्लेषण में 12,000 मरीज शामिल हैं। आप आयु संबंधी अंतःक्रिया का परीक्षण करते हैं और p=0.03 पाते हैं। 75 वर्ष से कम उम्र के रोगियों में <75 वर्ष (आरआर 0.72) की तुलना में अधिक लाभ (आरआर 0.55) दिखाई देता है।

आपने अपने विश्लेषण में 8 संभावित प्रभाव संशोधकों का परीक्षण किया।

आप इस खोज की व्याख्या कैसे करते हैं?

A रिपोर्ट करें कि वृद्ध रोगियों में एंटीकोआग्युलेशन बेहतर काम करता है - अंतःक्रिया महत्वपूर्ण है

B Apply multiple testing correction; with 8 tests, p=0.03 is likely a false positive

C Report as hypothesis-generating, note the multiple comparisons, request external validation

"औसत बातचीत को छुपाता है।
The interaction reveals who benefits.
इसे अध्ययन के भीतर ही परखें, बीच में नहीं-
क्योंकि वहीं सत्य पाया जाता है।"

आईपीडी केवल उपचार के लिए नहीं है।

जब आप चाहते हैं predict who will die,
who will recover, who will relapse—
व्यक्ति ही सब कुछ है.

स्लाइड 10.2: प्रभाव कहानी

Predicting Recovery After Brain Injury

IMPACT CONSORTIUM, 2005-PRESENT

दर्दनाक मस्तिष्क की चोट के बाद, परिवार विनाशकारी प्रश्न पूछते हैं:

"Will they ever wake up?"

Individual trials were too small to develop accurate prediction models.

इम्पैक्ट ने 11 अध्ययनों, 9,205 रोगियों से आईपीडी एकत्र किया और एक मॉडल बनाया जो प्रारंभिक नैदानिक विशेषताओं से 6 महीने के परिणामों की भविष्यवाणी करता है।

IMPACT Study Group. PLoS Med 2008;5:e165

Why Prognosis Demands IPD

1

External Validation Across Populations

Develop in some studies, validate in others. True test of generalizability.

2

Non-linear Relationships

Explore how predictors relate to outcome: linear? threshold? U-shaped?

3

Multiple Predictor Interactions

Age + GCS + pupil reactivity may interact in ways aggregate data cannot reveal

4

Proper Handling of Missing Predictors

रोगी स्तर पर एकाधिक आरोपण, अध्ययन स्तर पर नहीं

Reporting Standards

TRIPOD

Prediction model reporting
विकास और सत्यापन
अंशांकन और भेदभाव
22 item checklist

PRISMA-IPD

IPD meta-analysis reporting
डेटा अधिग्रहण विवरण
Harmonization process
Integrity checking

आईपीडी पूर्वानुमानित मॉडल के लिए

You need both: मॉडल के लिए ट्राइपॉड, डेटा संश्लेषण प्रक्रिया के लिए प्रिज्मा-आईपीडी।

When Prediction Saves Lives

नैदानिक प्रभाव

The IMPACT model is now embedded in clinical decision support systems worldwide.

जब कोई मरीज दर्दनाक मस्तिष्क की चोट के साथ आता है, तो मॉडल एक probability of survival and probability of favorable outcome.

प्रदान करता है, जो परिवारों के साथ बातचीत का मार्गदर्शन करता है। इससे उपचार की तीव्रता की जानकारी मिलती है। यह आईसीयू संसाधनों को आवंटित करने में मदद करता है।

व्यक्तिगत डेटा से निर्मित। व्यक्तिगत रोगियों की सेवा करना।

"To predict one patient's future,
आपको हजारों अतीत से सीखना चाहिए।
आईपीडी में वे कहानियाँ हैं-
each one a teacher, if you will listen."

क्या आपने उस छोटी सफेद गोली
पर विचार नहीं किया है जो millions को उनके दिलों के लिए दी गई है?

वे थे बताया: "इसे लो, और तुम सुरक्षित हो जाओगे।"

But was every heart equally in need of protection?

स्लाइड 11.2: नेटफ्लिक्स पुरस्कार की कहानी

नेटफ्लिक्स पुरस्कार की कहानी

A TRUE STORY

In 2006, Netflix released 100 million "anonymized" movie ratings for a $1 million prize.

Researchers quickly re-identified users by matching ratings with public IMDb reviews.

One lawsuit alleged a closeted lesbian was outed through her viewing patterns.

The lesson: removing names isn't anonymization.

आईपीडी में विशिष्ट पहचान के लिए उम्र, निदान, उपचार प्रतिक्रिया और तारीखों के पर्याप्त संयोजन शामिल हैं व्यक्तियों. गोपनीयता के लिए नाम कॉलम को हटाने से कहीं अधिक की आवश्यकता है - इसके लिए यह समझने की आवश्यकता है कि डेटा संयोजन फिंगरप्रिंट कैसे बनते हैं।

स्लाइड 11.3: ATT सहयोग

Oxford, 2009

ANTITHROMBOTIC TRIALISTS' COLLABORATION

ATT ने 95,000 patients across 6 primary prevention trials of aspirin.

The published trials said: "Aspirin prevents heart attacks."

से व्यक्तिगत डेटा एकत्र किया, लेकिन ATT ने निषिद्ध पूछा प्रश्न:

"किस कीमत पर? और किसके लिए?"

ATT Collaboration. Lancet 2009;373:1849-60

स्लाइड 11.4: खुलासा

संख्याओं का खुलासा

-12%

Heart Attacks Prevented

+32%

Major Bleeds Caused

THE BALANCE

For every 1,000 low-risk patients 5 के लिए एस्पिरिन लेना वर्ष:

2-3 heart attacks prevented
2-3 major bleeds caused

लाभ और हानि रद्द हो जाती है।

स्लाइड 11.5: निर्णय वृक्ष

जोखिम-आधारित निर्णय

क्या इस रोगी को प्राथमिक तौर पर एस्पिरिन लेनी चाहिए रोकथाम?

10-Year CVD Risk?

↓

>20%

High Risk

10-20%

Intermediate

<10%

Low Risk

↓

Consider aspirin
(benefit > harm)

Shared decision
(benefit ≈ harm)

Avoid aspirin
(harm > benefit)

Why did published meta-analyses miss this?

एग्रीगेट्स का अंधापन

Published trials reported average benefits.

वे यह नहीं दिखा सके कि उच्च जोखिम वाले रोगियों को फायदा हुआ
while low-risk patients lost.

Only by examining each patient's baseline risk,
each patient's outcomes,
could the interaction be revealed.

🔀 प्राथमिक रोकथाम दुविधा

एक 52 वर्षीय व्यक्ति दिल के दौरे की रोकथाम के लिए एस्पिरिन के बारे में पूछता है। उन्हें पहले से कोई सीवीडी नहीं है, कोलेस्ट्रॉल सीमा रेखा पर है, बीपी नियंत्रित है, धूम्रपान नहीं करते हैं। उसका 10 साल का सीवीडी जोखिम 8% है।

उसने ऑनलाइन पढ़ा कि "एस्पिरिन दिल के दौरे को रोकता है" और आपकी सलाह चाहता है।

आप उसे क्या कहते हैं?

A "Yes, take aspirin daily - it's proven to prevent heart attacks"

B "At your risk level, aspirin's bleeding risk roughly equals its heart benefit - I'd recommend against it"

C "Take baby aspirin - the lower dose is safer"

"वह दवा जो लुप्तप्राय को बचाती है
नुकसान पहुंचा सकती है सुरक्षित।

अपनी दवा लिखने से पहले अपने मरीज के जोखिम को जानें।
व्यक्तिगत डेटा ने हमें यही सिखाया है।"

95,000 patients. One truth: risk determines benefit.

क्या आपने नहीं देखा कि वे दशकों तक कैसे बहस करते रहे:
"क्या बूढ़ों के साथ युवाओं के समान व्यवहार किया जाना चाहिए?"

Some said: "Lower is always better."
अन्य लोगों ने कहा: "बूढ़े नाजुक होते हैं। रहो सतर्क।"

कौन सही था?

स्लाइड 12.2: बहस

जे-वक्र विवाद

CARDIOLOGY CONFERENCES, 1980s-2000s

वर्षों तक, डॉक्टरों ने तर्क दिया:

आक्रामक शिविर: "Every mmHg of BP reduction saves lives.
Treat everyone to target 120/80."

रूढ़िवादी शिविर: "In the elderly, low BP causes falls, strokes, death.
There's a J-curve—too low is dangerous."

Individual trials were too small to settle it. जब तक BPLTTC ने व्यक्तिगत डेटा एकत्र नहीं किया।

स्लाइड 12.3: सहयोग

The Blood Pressure Lowering Treatment Trialists

48

Trials Combined

344,716

Individual Patients

15+

Years of Follow-up

THE QUESTION

Does the benefit of BP lowering vary by age?
Is there a J-curve at very low pressures?
Do the very old (>80 years) still benefit?

BPLTTC. Lancet 2021;397:1625-36

स्लाइड 12.4: उत्तर

उत्तर, आख़िरकार

Benefit at Every Age

आनुपातिक जोखिम में कमी 55 से 85+ की उम्र तक लगातार थी

WHAT IPD SHOWED

Every 5 mmHg BP reduction:

Age 55-64: 10% lower major CV events
Age 65-74: 10% lower major CV events
Age 75-84: 10% lower major CV events
Age ≥85: Still 10% lower

p_interaction = 0.85. आयु संशोधन का कोई सबूत नहीं.

स्लाइड 12.5: जे-वक्र मिथक

जे-वक्र के बारे में क्या?

THE RESOLUTION

बीपीएलटीटीसी ने मरीजों की जांच करके जे-वक्र का परीक्षण किया
who achieved very low blood pressures.

Result: No J-curve in randomized comparisons.

अवलोकन डेटा में स्पष्ट जे-वक्र था reverse causation— sick patients have low BP because they're sick, not sick because their BP is low.

केवल आरसीटी से आईपीडी ही इसे सुलझा सकता है।

Treating Hypertension by Age

Should This Elderly Patient Get BP Treatment?

Patient Age?

↓

55-74

75-84

85+

↓

Treat if BP elevated
Proportional benefit maintained across all ages

THE LESSON

Age alone is not a reason to withhold treatment.
Consider frailty, life expectancy, patient preference—but not age.

🔀 82 वर्षीय व्यक्ति का रक्तचाप

82 साल की महिला का बीपी 158/88 है। वह स्वतंत्र है, संज्ञानात्मक रूप से अक्षुण्ण है और उसका गिरने का कोई इतिहास नहीं है। एक सहकर्मी का कहना है: "वह आक्रामक बीपी उपचार के लिए बहुत बूढ़ी है। जे-वक्र, आप जानते हैं।"

आपको बीपीएलटीटीसी आईपीडी मेटा-विश्लेषण याद है।

What do you do?

A अपने सहकर्मी से सहमत हों - बुजुर्गों के लिए उच्च बीपी लक्ष्य स्वीकार करें

B बीपीएलटीटीसी साक्ष्य का हवाला दें कि बहुत बुजुर्गों में लाभ जारी रहता है और उपचार शुरू करें

C Wait for a cardiovascular event before treating

"उन्होंने कहा कि बूढ़े लोग दवा के लिए बहुत नाजुक थे।
लेकिन व्यक्तिगत डेटा कुछ और ही दिखाता है:

At every age, the benefit endures.
Do not let age alone deny protection."

क्या आपने समय के विरुद्ध दौड़ नहीं देखी है?
when a clot blocks the brain?

Every minute, two million neurons die.

But when does the window close?
When is it too late to intervene?

स्लाइड 13.2: दांव

Time Is Brain

1.9M

Neurons Lost Per Minute

14B

Synapses Lost Per Minute

THE QUESTION

थ्रोम्बोलिसिस थक्के को भंग कर सकता है और रक्त प्रवाह को बहाल कर सकता है।

But given too late, it causes bleeding into dying brain tissue.

What is the time window? 3 hours? 4.5 hours? 6 hours?

Individual trials disagreed. Guidelines were uncertain.

स्लाइड 13.3: आईपीडी समाधान

स्ट्रोक थ्रोम्बोलिसिस ट्रायलिस्ट

STT COLLABORATIVE GROUP, 2014

एसटीटी ने व्यक्तिगत डेटा एकत्र किया 6,756 patients across 9 major alteplase trials.

They knew exactly when each patient's stroke began. They knew exactly when thrombolysis was given. They knew exactly who lived, who died, who recovered.

They could map benefit against time, minute by minute.

STT Collaborative Group. Lancet 2014;384:1929-35

स्लाइड 13.4: समय वक्र

लुप्त होती खिड़की

0-3h

या अच्छे परिणाम के लिए 1.75

3-4.5h

या अच्छे परिणाम के लिए 1.26

4.5-6h

OR 1.15 (not significant)

लाभ का क्षय

Every 15 minutes of delay reduced the benefit.

Treated at 90 min: 1 in 4 achieve excellent outcome
Treated at 180 min: 1 in 7 achieve excellent outcome
Treated at 270 min: 1 in 14 achieve excellent outcome

थ्रोम्बोलिसिस निर्णय

Acute Ischemic Stroke: Give Thrombolysis?

Time Since Symptom Onset?

↓

0-3h

Strong benefit

3-4.5h

Moderate benefit

4.5-6h

Uncertain

>6h

Harm likely

↓

TREAT
URGENTLY

TREAT
if eligible

Consider
imaging

Generally
avoid

स्लाइड 13.6: एडी उत्तर क्यों नहीं दे सका

Why did we need individual data?

औसत की सीमा

Trial A: "Patients treated within 3 hours" (average: 2.1 hours)
Trial B: "Patients treated within 6 hours" (average: 4.2 hours)

These overlapping, inconsistent windows couldn't be compared.

Only by knowing each patient's exact time
could the continuous decay of benefit be mapped.

🔀 4 घंटे का स्ट्रोक

एक 68 वर्षीय व्यक्ति तीव्र स्ट्रोक से पीड़ित है। लक्षण की शुरुआत 4 घंटे पहले हुई थी। सीटी से पता चलता है कि कोई रक्तस्राव नहीं हुआ है, एनआईएचएसएस स्कोर 12 (मध्यम) है। परिवार पूछता है: "क्या खून का थक्का ख़त्म करने वाली दवा के लिए बहुत देर हो चुकी है?"

Door-to-needle time will add 30 minutes, making total time ~4.5 hours.

What do you do?

A "It's too late - the 3-hour window has passed"

B "हम अभी भी 4.5-घंटे की विंडो के भीतर हैं - थ्रोम्बोलिसिस के साथ तत्काल आगे बढ़ें"

C "Wait for MRI to see if there's salvageable tissue"

"Every minute the clot remains,
two million neurons perish.

आईपीडी ने हमें लुप्त होती विंडो दिखाई।
Act quickly, or the window closes forever."

आपने व्यक्तिगत डेटा एकत्र कर लिया है.
आप आशा के साथ फ़ाइलें खोलते हैं।

और फिर आप इसे देखते हैं: empty cells.

Age: 67. Sex: Male. Smoking status: missing.
Outcome at 1 year: missing.

What now?

स्लाइड 14.2: तीन प्रकार

तीन प्रकार गुमशुदगी

1

Missing Completely at Random (MCAR)

Lab machine broke randomly. No relation to patient characteristics. Safe to ignore (but wasteful).

2

Missing at Random (MAR)

Older patients more likely to miss follow-up. Missingness related to observed variables. Imputation can help.

3

मिसिंग नॉट एट रैंडम (MNAR)

खराब परिणाम वाले मरीज़ बाहर हो जाते हैं। missing value itself. से संबंधित गुमशुदगी खतरनाक है। संवेदनशीलता विश्लेषण की आवश्यकता है।

स्लाइड 14.3: निर्णय वृक्ष

गुम डेटा को संभालना

गुम मूल्यों के साथ क्या करें?

How much is missing?

↓

<5%

Minor

5-20%

Moderate

>20%

Substantial

↓

Complete case
may suffice

Multiple
imputation

Impute +
sensitivity

एकाधिक आरोप: मानक

THE PROCESS

1. Impute → 2. Analyze → 3. Pool

Create M imputed datasets, analyze each, combine using Rubin's rules

WHY MULTIPLE?

एकल प्रतिरूपण दर्शाता है कि आपको लुप्त मान ज्ञात है।

Multiple imputation (M=20-50 datasets) reflects uncertainty इस बारे में कि लुप्त मान क्या हो सकता है।

यह वैध मानक त्रुटियों और पी-मानों को सुरक्षित रखता है।

आईपीडी-विशिष्ट गुम डेटा चुनौतियाँ

1

Systematically Missing Variables

Trial A measured biomarker X. Trial B didn't. Can't impute what was never collected.

2

Multilevel Structure

Patients nested within trials. Imputation model must account for clustering.

3

Different Follow-up Durations

परीक्षण A का 2 वर्षों तक पालन किया गया। 5 साल के लिए ट्रायल बी. उत्तरजीविता विश्लेषण के लिए देखभाल की आवश्यकता होती है।

When a Variable Is Missing Entirely

Trial Didn't Collect Your Key Covariate

Is it an effect modifier or confounder?

↓

Effect Modifier

↓

Restrict interaction
analysis to trials
वेरिएबल के साथ

Confounder

↓

Sensitivity analysis
varying assumptions
about unmeasured

🔀 द मिसिंग बायोमार्कर

आपका आईपीडी-एमए परीक्षण करता है कि क्या नई कैंसर दवा बायोमार्कर-पॉजिटिव रोगियों में बेहतर काम करती है। आपके पास 8 परीक्षणों से आईपीडी है। लेकिन 3 परीक्षणों (40% रोगियों) ने बायोमार्कर को बिल्कुल भी नहीं मापा।

ये 3 परीक्षण पुराने और छोटे होते हैं।

आप इंटरैक्शन का विश्लेषण कैसे करते हैं?

A Impute the biomarker status based on other patient characteristics

B बायोमार्कर डेटा के साथ केवल 5 परीक्षणों में इंटरैक्शन का विश्लेषण करें; समग्र प्रभाव के लिए सभी परीक्षणों सहित संवेदनशीलता विश्लेषण

C मेटा-विश्लेषण से 3 परीक्षणों को पूरी तरह से बाहर निकालें

"खाली सेल कुछ भी नहीं है।
It is a question: यह अज्ञात क्यों है?

भरने से पहले उस प्रश्न का उत्तर दें अंतराल—
अनुपस्थिति का कारण समाधान को आकार देता है।"

क्या आपने उस शोधकर्ता को नहीं देखा
जिसने willing trialists
से डेटा इकट्ठा किया और जीत की घोषणा की?

But the unwilling held secrets.
और वे रहस्य बदल गए सब कुछ।

स्लाइड 15.2: टैमीफ्लू की कहानी

टैमीफ्लू की कहानी

A TRUE STORY

वर्षों से, सरकारों ने अरबों खर्च करके महामारी फ्लू के लिए टैमीफ्लू का भंडार किया।

Cochrane reviewers requested trial data to verify efficacy. Roche refused, citing confidentiality.

पांच वर्षों तक, बीएमजे ने पारदर्शिता के लिए अभियान चलाया। जब 2014 में पूर्ण नैदानिक अध्ययन रिपोर्ट अंततः जारी की गई, तो तस्वीर बदल गई: टैमीफ्लू ने लक्षण की अवधि को एक दिन से भी कम कर दिया और जटिलताओं को नहीं रोका।

एक ऐसी दवा पर अरबों खर्च किए गए जिसका पूरा सबूत छिपा हुआ था।

टैमीफ्लू गाथा ने उम्मीदों को बदल दिया - आज, नैदानिक परीक्षण पारदर्शिता आदर्श बन रही है, अपवाद नहीं।

स्लाइड 15.3: साक्ष्य

When IPD Is Selectively Available

अनुभवजन्य निष्कर्ष

अध्ययनों ने उन परीक्षणों की तुलना की है जो आईपीडी साझा करते हैं। ऐसा न करें:

Industry-sponsored trials: Less likely to share
नकारात्मक परिणामों वाले परीक्षण: Less likely to share
Older trials: डेटा अक्सर खो जाता है

If these trials systematically differ in effect size,
आपका IPD-MA पक्षपाती है।

Ahmed I, et al. BMJ 2012;344:d7762

स्लाइड 15.4: तुलना

Always Compare: IPD vs. Non-IPD Trials

Assessing Availability Bias

Compare AD effects: trials with IPD vs. without

↓

Similar Effects

↓

Low concern
for bias

Different Effects

↓

High concern
संवेदनशीलता विश्लेषण की आवश्यकता है

स्लाइड 15.5: चेकलिस्ट

उपलब्धता पूर्वाग्रह चेकलिस्ट

✓

Report IPD retrieval rate

"हमने 12/15 परीक्षणों से आईपीडी प्राप्त किया (80%)"

✓

Compare IPD vs. non-IPD trial characteristics

नमूना आकार, फंडिंग, प्रकाशन तिथि, कुल डेटा से प्रभाव का आकार

✓

Sensitivity analysis including non-IPD trials

गैर-साझाकरण परीक्षणों से IPD + AD को मिलाकर दो-चरणीय विश्लेषण

✓

गैर-साझाकरण के कारणों पर चर्चा करें

Data lost? Refused? Never requested? Each has different implications.

🔀 अनिच्छुक परीक्षणकर्ता

सर्जिकल हस्तक्षेप के आपके आईपीडी-एमए ने 12 योग्य परीक्षणों में से 8 (67%) से डेटा प्राप्त किया। 4 गैर-साझाकरण परीक्षण सभी उद्योग-वित्त पोषित हैं और 8 आईपीडी परीक्षणों (पूलित या 0.72) की तुलना में उनके प्रकाशनों (पूलित या 0.95) में छोटे लाभ दिखाते हैं।

आपका आईपीडी विश्लेषण दिखाता है या 0.70।

आप कैसे रिपोर्ट करते हैं यह?

A Report IPD result (OR 0.70) as the main finding - IPD is gold standard

B गैर-साझाकरण परीक्षणों से एडी सहित उपलब्धता पूर्वाग्रह और संवेदनशीलता विश्लेषण के बारे में प्रमुख चेतावनी के साथ रिपोर्ट आईपीडी परिणाम

C Wait until you get 100% IPD before publishing

स्लाइड 15.7: संयुक्त दृष्टिकोण

दो-चरण हाइब्रिड समाधान

COMBINING IPD + AD

Stage 1: Analyze IPD trials → get θ_IPD

Stage 2: Meta-analyze θ_IPD + θ_AD गैर-आईपीडी से परीक्षण

Uses all available evidence, even when IPD incomplete

THE PRINCIPLE

आईपीडी सब कुछ या कुछ भी नहीं है।

आईपीडी का उपयोग करें जहां यह आपके पास है (इंटरेक्शन परीक्षण के लिए)।
समग्र प्रभाव आकलन के लिए AD के साथ पूरक।
क्या हुआ इसके बारे में पारदर्शिता कहां।

"इच्छुक व्यक्ति संपूर्ण का प्रतिनिधित्व नहीं कर सकता।
खुले दरवाजे बंद दरवाजों के पीछे सच्चाई छिपा सकते हैं।

Always ask: Who refused to share?
And what might they be hiding?"

प्रारंभिक स्तन कैंसर परीक्षणकर्ताओं के समूह ने क्या पाया कि व्यक्तिगत परीक्षण नहीं कर सके?

Tamoxifen works better than placebo

Tamoxifen only works in estrogen receptor positive tumors

Tamoxifen has significant side effects

Tamoxifen works better in younger women

What is the "ecological fallacy" in meta-analysis?

Assuming environmental factors don't affect treatment

Assuming between-study relationships apply to within-study (individual) relationships

विभिन्न पारिस्थितिक क्षेत्रों से पूलिंग अध्ययन

Using outdated trials in modern meta-analyses

एक-चरण आईपीडी विश्लेषण को कब प्राथमिकता दी जाती है दो-चरण?

When trials have sparse events or rare outcomes

When you have many large trials

When you want to create forest plots

जब परिणाम सामान्य हों और अनुवर्ती कार्रवाई कम हो

आपको कई परीक्षणों से आईपीडी का विश्लेषण करने से पहले क्या करना चाहिए?

तुरंत सभी डेटा को पूल करें और मुख्य विश्लेषण चलाएं

Exclude trials with missing variables

प्रत्येक परीक्षण के प्रकाशित परिणामों को पुन: प्रस्तुत करें डेटा अखंडता को सत्यापित करने के लिए आईपीडी

Convert all continuous variables to categorical

References

इसमें उद्धृत मुख्य स्रोत कोर्स

Riley RD, et al. व्यक्तिगत प्रतिभागी डेटा मेटा-विश्लेषण: हेल्थकेयर अनुसंधान के लिए एक पुस्तिका। Wiley, 2021.
स्टीवर्ट एलए, एट अल। PRISMA-IPD: व्यवस्थित समीक्षा और व्यक्तिगत प्रतिभागी डेटा के मेटा-विश्लेषण के लिए पसंदीदा रिपोर्टिंग आइटम। JAMA 2015;313:1657-65.
Early Breast Cancer Trialists' Collaborative Group. Tamoxifen for early breast cancer. Cochrane Database Syst Rev 2001.
Cholesterol Treatment Trialists' Collaboration. Efficacy and safety of LDL-lowering therapy. Lancet 2010;376:1670-81.
Roberts D, et al. Antenatal corticosteroids for accelerating fetal lung maturation. Cochrane Database Syst Rev 2017.
IMPACT Study Group. Predicting outcome after traumatic brain injury. PLoS Med 2008;5:e165.
Debray TPA, et al. Get real in individual participant data meta-analysis. Int J Epidemiol 2015;44:1287-97.
Burke DL, et al. Meta-analysis using individual participant data. Stat Med 2017;36:320-38.

✔

Course Complete

"कुल मिलाकर, व्यक्ति गायब हो जाता है।
But you have learned to find them.
You have learned to ask: Who benefits? Who is harmed?

अब जाएं—और औसतन कोई भी मरीज़ गायब न हो जाए।”

छिपा हुआ रोगी - अब आप उन्हें देखें।