can be reduced to a single number,
और उस संख्या में जानें मिट जाती हैं?
लेकिन किन मरीजों को फायदा हुआ? युवा या बूढ़े? जिनको हल्की बीमारी है या गंभीर? पुरुष या महिला?
कुल उत्तर नहीं दे सकता।
औसत के भीतर, कुछ रोगियों को बचा लिया गया - और कुछ को नुकसान पहुँचाया गया।
● Responders ● Non-responders
But who 30% हैं? व्यक्तिगत डेटा के बिना, हम गैर-उत्तरदाताओं में से उत्तरदाताओं की पहचान नहीं कर सकते। हम अभ्यास नहीं कर सकते precision medicine.
नहीं सारांश। औसत नहीं। Each patient, each tumor, each outcome.
What he discovered changed breast cancer treatment forever.
"Tamoxifen works."
But the individual data revealed:
Giving tamoxifen to ER− patients was useless.
व्यक्ति में, सत्य प्रकट होता है।
यही कारण है कि हम छिपे हुए रोगी की तलाश करते हैं।"
यह व्यक्तिगत प्रतिभागी डेटा है मेटा-विश्लेषण।
What is found when we look closer?
Aggregate Data (AD)
- Study-level summaries
- प्रकाशनों से प्रभाव आकार
- Mean age, % male, etc.
- त्वरित और सुलभ
- Cannot see within-study variation
व्यक्तिगत प्रतिभागी डेटा (IPD)
- रोगी स्तर का कच्चा डेटा
- Every participant's characteristics
- Actual ages, actual outcomes
- Time-intensive to obtain
- Can see who responds and who doesn't
Trial A: Mean age 55 years, Effect size 0.70 (benefit)
Trial B: Mean age 75 years, Effect size 0.90 (less benefit)
Tempting conclusion: "The drug works better in younger patients."
But this could be completely wrong.
Perhaps in Trial A, older patients within that trial responded better. Perhaps in Trial B, younger patients within that trial responded better.
आप व्यक्ति के बिना नहीं जान सकते डेटा।
True Effect Modification
Test whether treatment effect varies by patient characteristics (age, biomarkers, disease severity)
Time-to-Event Analysis
Use actual survival curves, not just hazard ratios. Handle censoring properly.
Consistent Definitions
Standardize outcome definitions, exposure timing, covariate categories across studies
Subgroup Credibility
पारिस्थितिक भ्रांति से बचते हुए, अध्ययन के भीतर परस्पर क्रिया का परीक्षण करें
Individual data shows each tree.
यदि आपको यह जानना है कि कौन से पेड़ बीमार हैं-
you must walk among them."
gathered data on 170,000 patients
and answered questions no single trial could ask?
27 trials. 174,149 patients. Every baseline characteristic. Every cardiovascular event. Every death.
The published trials asked: "Do statins work?"
CTT ने पूछा: "स्टैटिन किसके लिए काम करते हैं?"
लेकिन जिन सवालों का आप जवाब दे सकते हैं वे हैं निवेश के लायक.
Benefit Proportional to LDL Reduction
Every 1 mmol/L LDL reduction = 22% lower CV events. True across all subgroups.
No Age Threshold
Benefit continues even in patients >75 years (contradicting earlier AD analyses)
Primary Prevention Works
Patients without prior CVD benefit proportionally to their baseline risk
No Cancer Signal
कैंसर पैदा करने वाले स्टैटिन के बारे में चिंताओं को आईपीडी फॉलो-अप के साथ निश्चित रूप से खारिज कर दिया गया था
Trial A: "High risk" = 10-year CVD risk >20%
Trial B: "High risk" = Prior MI
Trial C: "High risk" = Diabetes
You cannot compare or combine what is defined differently.
IPD allowed the CTT to redefine everyone consistently.
आईपीडी प्रदान करता है अनुवाद।
What seemed contradictory becomes clear:
the same truth, measured differently."
कुल डेटा लेता है weeks.
निवेश कब लायक है?
क्या आपको आगे बढ़ना चाहिए आईपीडी?
Time-to-Event Outcomes
जब उत्तरजीविता वक्र मायने रखता है, न कि केवल अंतिम जोखिम अनुपात। जब आपको सेंसरिंग को ठीक से संभालने की आवश्यकता होती है।
Continuous Effect Modifiers
Testing whether treatment effect varies by age, BMI, biomarker level (not just "high" vs "low")
Outcome Definition Problems
जब परीक्षण परिणामों को अलग-अलग परिभाषित करते हैं और आपको मानकीकृत करने की आवश्यकता होती है
Longer Follow-Up Available
जब परीक्षणकर्ताओं के पास होता है। अप्रकाशित अनुवर्ती डेटा जिसे आप शामिल करना चाहते हैं
आपका मुख्य प्रश्न है: "क्या लाभ रोग की गंभीरता और उपचार के समय के अनुसार भिन्न होता है?"
Overall Treatment Effect
जब आपका एकमात्र प्रश्न यह हो कि "क्या यह काम करता है?" नहीं "किसके लिए?"
Homogeneous Population
When trials enrolled similar patients and effect modification is unlikely
Binary Outcomes, Short Follow-up
जब सेंसरिंग कोई मुद्दा नहीं है और परिणाम सरल हाँ/नहीं हैं
IPD Unobtainable
जब परीक्षणकर्ता साझा नहीं करेंगे, तो डेटा खो जाता है, या संसाधन अनुपलब्ध होते हैं
लेकिन हर सवाल के बारे में which individuals
आपके डेटा में उनकी उपस्थिति की मांग करता है।"
अब: क्या आप इसका विश्लेषण इस प्रकार करते हैं? one combined dataset
or trial by trial, then combine?
Two-Stage Approach
- Stage 1: Analyze each trial separately
- चरण 2: परिणामों का मेटा-विश्लेषण करें
- Preserves trial structure
- Familiar (like standard MA)
- Cannot handle sparse data well
One-Stage Approach
- सभी डेटा का एक साथ विश्लेषण करें
- Mixed-effects regression model
- क्लस्टरिंग के लिए यादृच्छिक प्रभाव
- विरल डेटा के लिए बेहतर
- More flexible modeling
Each trial's estimate is transparent.
परिचित वन भूखंड और मैं2 statistics.
2. More powerful for detecting interactions
3. Can model complex covariate relationships
4. Exact likelihood (no normal approximations)
One-Stage or Two-Stage?
The one-stage hears all voices at once.
जब डेटा विरल हो और घटनाएँ दुर्लभ हों—
एक-चरण वह पकड़ लेता है जो दो-चरण में छूट जाता है।"
जिसने बच्चों की जान बचाई-
but only if given at the right time?
But a puzzle remained: When should they be given?
24 hours before birth? 48 hours? A week?
Published trials couldn't answer—they didn't report timing consistently.
Maximum benefit: 24 hours to 7 days before birth
Reduced benefit: >7 days (lung maturity effect fades)
No benefit: <24 hours (not enough time to work)
After IPD: Guidelines now recommend repeat dosing यदि पहले कोर्स के 7 दिनों के भीतर डिलीवरी नहीं हुई है।
यह परिशुद्धता-व्यक्तिगत डेटा के बिना असंभव-है saved thousands of premature babies.
Trial B reported: "Steroid given antenatally"
Trial C reported: "Steroid-to-delivery interval: median 3 days"
Different categories. Different definitions. Incompatible summaries.
Only by examining each baby's actual steroid-to-delivery time could the optimal window be identified.
But when इसे देना अज्ञात था।
आईपीडी ने 'कुछ समय' को 'सही समय' में बदल दिया-
और उस परिशुद्धता में, बच्चे रहते थे।"
कहीं, फाइलों और डेटाबेस में,
प्रत्येक मरीज की कहानी दर्ज की जाती है.
सवाल यह है: क्या वे इसे साझा करेंगे?
This is expected. Plan for it.
Trialist Collaboration
Direct contact with trial investigators. Build relationships. Offer co-authorship.
डेटा शेयरिंग प्लेटफ़ॉर्म
YODA Project, ClinicalStudyDataRequest.com, Vivli, ICPSR
Regulatory Agencies
EMA Policy 0070, FDA (limited), Health Canada
Journal Requirements
Many journals now require data sharing; check supplementary materials
2. Offer co-authorship—make sharing worthwhile
3. डेटा सुरक्षा का वर्णन करें—how you'll protect their patients
4. डेटा शब्दकोश प्रदान करें—specify exactly what you need
5. Set clear timelines—respect their time
Industry trials: less likely to share
Negative trials: less likely to share
Older trials: data may be lost
Your IPD sample may be biased.
Will they share what they have guarded?
पुल का निर्माण करें ध्यान से—
क्योंकि उस पुल पर, मरीजों का भविष्य पार हो जाता है।"
from twelve trials, five countries, three decades.
But Trial A calls it "cardiovascular death"
और ट्रायल बी इसे कहता है "cardiac mortality".
क्या वे समान हैं?
Trial from USA: Age in decimal years (e.g., 65.7)
ट्रायल फ्रॉम यूके: आयु बैंड ("65-74")
Diabetes: HbA1c ≥ 6.5% vs. fasting glucose ≥ 126 vs. "physician diagnosis"
Outcome: "Major adverse cardiac event" (one trial includes stroke, another doesn't)
विश्लेषण से पहले: हर चीज में सामंजस्य बिठाएं।
एक मास्टर डेटा बनाएं शब्दकोश
Define every variable you need: name, type, permitted values, derivation rules
Map Each Trial's Variables
Document how each trial's coding maps to your standardized definitions
परीक्षणकर्ताओं से जांचें
अपनी व्याख्याओं को सत्यापित करें। वे अपने डेटा को आपसे बेहतर जानते हैं।
Validate Transformations
आईपीडी से प्रकाशित परिणाम पुन: प्रस्तुत करें। If they don't match, investigate.
छह परीक्षणों में एक मानक परिभाषा (ICD कोड) का उपयोग किया गया। 1990 के दशक के दो परीक्षणों में बिना किसी मानकीकृत मानदंड के "जांचकर्ता द्वारा मूल्यांकन की गई हृदय मृत्यु" का उपयोग किया गया। ये दो परीक्षण बड़े उपचार प्रभाव दिखाते हैं।
आईपीडी से प्रत्येक परीक्षण के प्रकाशित परिणामों को पुन: प्रस्तुत करें।
यदि आपका विश्लेषण आरआर = 0.78 देता है लेकिन प्रकाशन कहता है आरआर = 0.85,
something is wrong.
Find the discrepancy. Fix it. Then proceed.
different ways to name the same disease.
इससे पहले कि आप संयोजन कर सकें, आपको अनुवाद करना होगा।
अनुवाद करने से पहले, आपको समझना होगा।"
लेकिन क्या यह युवाओं और बूढ़ों के लिए समान रूप से काम करता है?
हल्के और गंभीर के लिए?
बायोमार्कर वाले वाले के लिए और उसके बिना वाले वाले के लिए?
They asked: "Does the effect differ by estrogen receptor status?"
बातचीत बड़े पैमाने पर थी:
ER-positive: 47% reduction in recurrence
ER-negative: No benefit at all
उपचार प्रभाव differs between subgroups defined by the covariate.
यदि नहीं: उपचार प्रभाव है similar across subgroups (or you lack power to detect a difference).
Between-Study Interaction
- Compares trial-level averages
- Ecological fallacy risk
- Confounded by trial design
- Low statistical power
- समग्र डेटा के साथ कर सकते हैं
Within-Study Interaction
- Compares patients within each trial
- No ecological fallacy
- Randomization preserved
- Much higher power
- Requires IPD
प्रभाव संशोधन के लिए यह स्वर्ण मानक है।
आपने अपने विश्लेषण में 8 संभावित प्रभाव संशोधकों का परीक्षण किया।
The interaction reveals who benefits.
इसे अध्ययन के भीतर ही परखें, बीच में नहीं-
क्योंकि वहीं सत्य पाया जाता है।"
जब आप चाहते हैं predict who will die,
who will recover, who will relapse—
व्यक्ति ही सब कुछ है.
"Will they ever wake up?"
Individual trials were too small to develop accurate prediction models.
इम्पैक्ट ने 11 अध्ययनों, 9,205 रोगियों से आईपीडी एकत्र किया और एक मॉडल बनाया जो प्रारंभिक नैदानिक विशेषताओं से 6 महीने के परिणामों की भविष्यवाणी करता है।
External Validation Across Populations
Develop in some studies, validate in others. True test of generalizability.
Non-linear Relationships
Explore how predictors relate to outcome: linear? threshold? U-shaped?
Multiple Predictor Interactions
Age + GCS + pupil reactivity may interact in ways aggregate data cannot reveal
Proper Handling of Missing Predictors
रोगी स्तर पर एकाधिक आरोपण, अध्ययन स्तर पर नहीं
TRIPOD
- Prediction model reporting
- विकास और सत्यापन
- अंशांकन और भेदभाव
- 22 item checklist
PRISMA-IPD
- IPD meta-analysis reporting
- डेटा अधिग्रहण विवरण
- Harmonization process
- Integrity checking
जब कोई मरीज दर्दनाक मस्तिष्क की चोट के साथ आता है, तो मॉडल एक probability of survival and probability of favorable outcome.
प्रदान करता है, जो परिवारों के साथ बातचीत का मार्गदर्शन करता है। इससे उपचार की तीव्रता की जानकारी मिलती है। यह आईसीयू संसाधनों को आवंटित करने में मदद करता है।
व्यक्तिगत डेटा से निर्मित। व्यक्तिगत रोगियों की सेवा करना।
आपको हजारों अतीत से सीखना चाहिए।
आईपीडी में वे कहानियाँ हैं-
each one a teacher, if you will listen."
पर विचार नहीं किया है जो millions को उनके दिलों के लिए दी गई है?
वे थे बताया: "इसे लो, और तुम सुरक्षित हो जाओगे।"
But was every heart equally in need of protection?
Researchers quickly re-identified users by matching ratings with public IMDb reviews.
One lawsuit alleged a closeted lesbian was outed through her viewing patterns.
The lesson: removing names isn't anonymization.
आईपीडी में विशिष्ट पहचान के लिए उम्र, निदान, उपचार प्रतिक्रिया और तारीखों के पर्याप्त संयोजन शामिल हैं व्यक्तियों. गोपनीयता के लिए नाम कॉलम को हटाने से कहीं अधिक की आवश्यकता है - इसके लिए यह समझने की आवश्यकता है कि डेटा संयोजन फिंगरप्रिंट कैसे बनते हैं।
The published trials said: "Aspirin prevents heart attacks."
से व्यक्तिगत डेटा एकत्र किया, लेकिन ATT ने निषिद्ध पूछा प्रश्न:
"किस कीमत पर? और किसके लिए?"
2-3 heart attacks prevented
2-3 major bleeds caused
लाभ और हानि रद्द हो जाती है।
क्या इस रोगी को प्राथमिक तौर पर एस्पिरिन लेनी चाहिए रोकथाम?
(benefit > harm)
(benefit ≈ harm)
(harm > benefit)
वे यह नहीं दिखा सके कि उच्च जोखिम वाले रोगियों को फायदा हुआ
while low-risk patients lost.
Only by examining each patient's baseline risk,
each patient's outcomes,
could the interaction be revealed.
उसने ऑनलाइन पढ़ा कि "एस्पिरिन दिल के दौरे को रोकता है" और आपकी सलाह चाहता है।
नुकसान पहुंचा सकती है सुरक्षित।
अपनी दवा लिखने से पहले अपने मरीज के जोखिम को जानें।
व्यक्तिगत डेटा ने हमें यही सिखाया है।"
95,000 patients. One truth: risk determines benefit.
"क्या बूढ़ों के साथ युवाओं के समान व्यवहार किया जाना चाहिए?"
Some said: "Lower is always better."
अन्य लोगों ने कहा: "बूढ़े नाजुक होते हैं। रहो सतर्क।"
कौन सही था?
आक्रामक शिविर: "Every mmHg of BP reduction saves lives.
Treat everyone to target 120/80."
रूढ़िवादी शिविर: "In the elderly, low BP causes falls, strokes, death.
There's a J-curve—too low is dangerous."
Individual trials were too small to settle it. जब तक BPLTTC ने व्यक्तिगत डेटा एकत्र नहीं किया।
Is there a J-curve at very low pressures?
Do the very old (>80 years) still benefit?
Age 55-64: 10% lower major CV events
Age 65-74: 10% lower major CV events
Age 75-84: 10% lower major CV events
Age ≥85: Still 10% lower
pinteraction = 0.85. आयु संशोधन का कोई सबूत नहीं.
who achieved very low blood pressures.
Result: No J-curve in randomized comparisons.
अवलोकन डेटा में स्पष्ट जे-वक्र था reverse causation— sick patients have low BP because they're sick, not sick because their BP is low.
केवल आरसीटी से आईपीडी ही इसे सुलझा सकता है।
Should This Elderly Patient Get BP Treatment?
Proportional benefit maintained across all ages
Consider frailty, life expectancy, patient preference—but not age.
आपको बीपीएलटीटीसी आईपीडी मेटा-विश्लेषण याद है।
लेकिन व्यक्तिगत डेटा कुछ और ही दिखाता है:
At every age, the benefit endures.
Do not let age alone deny protection."
when a clot blocks the brain?
Every minute, two million neurons die.
But when does the window close?
When is it too late to intervene?
But given too late, it causes bleeding into dying brain tissue.
What is the time window? 3 hours? 4.5 hours? 6 hours?
Individual trials disagreed. Guidelines were uncertain.
They knew exactly when each patient's stroke began. They knew exactly when thrombolysis was given. They knew exactly who lived, who died, who recovered.
They could map benefit against time, minute by minute.
Treated at 90 min: 1 in 4 achieve excellent outcome
Treated at 180 min: 1 in 7 achieve excellent outcome
Treated at 270 min: 1 in 14 achieve excellent outcome
Acute Ischemic Stroke: Give Thrombolysis?
URGENTLY
if eligible
imaging
avoid
Trial B: "Patients treated within 6 hours" (average: 4.2 hours)
These overlapping, inconsistent windows couldn't be compared.
Only by knowing each patient's exact time
could the continuous decay of benefit be mapped.
Door-to-needle time will add 30 minutes, making total time ~4.5 hours.
two million neurons perish.
आईपीडी ने हमें लुप्त होती विंडो दिखाई।
Act quickly, or the window closes forever."
आप आशा के साथ फ़ाइलें खोलते हैं।
और फिर आप इसे देखते हैं: empty cells.
Age: 67. Sex: Male. Smoking status: missing.
Outcome at 1 year: missing.
What now?
Missing Completely at Random (MCAR)
Lab machine broke randomly. No relation to patient characteristics. Safe to ignore (but wasteful).
Missing at Random (MAR)
Older patients more likely to miss follow-up. Missingness related to observed variables. Imputation can help.
मिसिंग नॉट एट रैंडम (MNAR)
खराब परिणाम वाले मरीज़ बाहर हो जाते हैं। missing value itself. से संबंधित गुमशुदगी खतरनाक है। संवेदनशीलता विश्लेषण की आवश्यकता है।
गुम मूल्यों के साथ क्या करें?
may suffice
imputation
sensitivity
Multiple imputation (M=20-50 datasets) reflects uncertainty इस बारे में कि लुप्त मान क्या हो सकता है।
यह वैध मानक त्रुटियों और पी-मानों को सुरक्षित रखता है।
Systematically Missing Variables
Trial A measured biomarker X. Trial B didn't. Can't impute what was never collected.
Multilevel Structure
Patients nested within trials. Imputation model must account for clustering.
Different Follow-up Durations
परीक्षण A का 2 वर्षों तक पालन किया गया। 5 साल के लिए ट्रायल बी. उत्तरजीविता विश्लेषण के लिए देखभाल की आवश्यकता होती है।
Trial Didn't Collect Your Key Covariate
analysis to trials
वेरिएबल के साथ
varying assumptions
about unmeasured
ये 3 परीक्षण पुराने और छोटे होते हैं।
It is a question: यह अज्ञात क्यों है?
भरने से पहले उस प्रश्न का उत्तर दें अंतराल—
अनुपस्थिति का कारण समाधान को आकार देता है।"
जिसने willing trialists
से डेटा इकट्ठा किया और जीत की घोषणा की?
But the unwilling held secrets.
और वे रहस्य बदल गए सब कुछ।
Cochrane reviewers requested trial data to verify efficacy. Roche refused, citing confidentiality.
पांच वर्षों तक, बीएमजे ने पारदर्शिता के लिए अभियान चलाया। जब 2014 में पूर्ण नैदानिक अध्ययन रिपोर्ट अंततः जारी की गई, तो तस्वीर बदल गई: टैमीफ्लू ने लक्षण की अवधि को एक दिन से भी कम कर दिया और जटिलताओं को नहीं रोका।
एक ऐसी दवा पर अरबों खर्च किए गए जिसका पूरा सबूत छिपा हुआ था।
टैमीफ्लू गाथा ने उम्मीदों को बदल दिया - आज, नैदानिक परीक्षण पारदर्शिता आदर्श बन रही है, अपवाद नहीं।
Industry-sponsored trials: Less likely to share
नकारात्मक परिणामों वाले परीक्षण: Less likely to share
Older trials: डेटा अक्सर खो जाता है
If these trials systematically differ in effect size,
आपका IPD-MA पक्षपाती है।
Assessing Availability Bias
for bias
संवेदनशीलता विश्लेषण की आवश्यकता है
Report IPD retrieval rate
"हमने 12/15 परीक्षणों से आईपीडी प्राप्त किया (80%)"
Compare IPD vs. non-IPD trial characteristics
नमूना आकार, फंडिंग, प्रकाशन तिथि, कुल डेटा से प्रभाव का आकार
Sensitivity analysis including non-IPD trials
गैर-साझाकरण परीक्षणों से IPD + AD को मिलाकर दो-चरणीय विश्लेषण
गैर-साझाकरण के कारणों पर चर्चा करें
Data lost? Refused? Never requested? Each has different implications.
आपका आईपीडी विश्लेषण दिखाता है या 0.70।
आईपीडी का उपयोग करें जहां यह आपके पास है (इंटरेक्शन परीक्षण के लिए)।
समग्र प्रभाव आकलन के लिए AD के साथ पूरक।
क्या हुआ इसके बारे में पारदर्शिता कहां।
खुले दरवाजे बंद दरवाजों के पीछे सच्चाई छिपा सकते हैं।
Always ask: Who refused to share?
And what might they be hiding?"
इसमें उद्धृत मुख्य स्रोत कोर्स
- Riley RD, et al. व्यक्तिगत प्रतिभागी डेटा मेटा-विश्लेषण: हेल्थकेयर अनुसंधान के लिए एक पुस्तिका। Wiley, 2021.
- स्टीवर्ट एलए, एट अल। PRISMA-IPD: व्यवस्थित समीक्षा और व्यक्तिगत प्रतिभागी डेटा के मेटा-विश्लेषण के लिए पसंदीदा रिपोर्टिंग आइटम। JAMA 2015;313:1657-65.
- Early Breast Cancer Trialists' Collaborative Group. Tamoxifen for early breast cancer. Cochrane Database Syst Rev 2001.
- Cholesterol Treatment Trialists' Collaboration. Efficacy and safety of LDL-lowering therapy. Lancet 2010;376:1670-81.
- Roberts D, et al. Antenatal corticosteroids for accelerating fetal lung maturation. Cochrane Database Syst Rev 2017.
- IMPACT Study Group. Predicting outcome after traumatic brain injury. PLoS Med 2008;5:e165.
- Debray TPA, et al. Get real in individual participant data meta-analysis. Int J Epidemiol 2015;44:1287-97.
- Burke DL, et al. Meta-analysis using individual participant data. Stat Med 2017;36:320-38.
But you have learned to find them.
You have learned to ask: Who benefits? Who is harmed?
अब जाएं—और औसतन कोई भी मरीज़ गायब न हो जाए।”
छिपा हुआ रोगी - अब आप उन्हें देखें।