मॉड्यूल 0: उद्घाटन

प्रत्येक संकेत सत्य नहीं है।

🎯 Learning Objectives

  • मेटा-विश्लेषण को परिभाषित करें और साक्ष्य संश्लेषण में इसकी भूमिका समझाएं
  • पहचानें कि अध्ययन कब नहीं होना चाहिए एकत्रित
  • साक्ष्य पदानुक्रम का वर्णन करें और जहां व्यवस्थित समीक्षाएं बैठती हैं
  • Recognize that meta-analysis can mislead when done poorly
  • इस पाठ्यक्रम को संचालित करने वाले सात सिद्धांतों को याद करें

यह पाठ्यक्रम मौजूद है क्योंकि

चिकित्सा थी गलत।

एक बार भी नहीं। शायद ही कभी नहीं. बार-बार. इस तरह से उन मरीज़ों की मौत हो गई जो इस बात पर भरोसा करते थे कि सबूत सही हैं।

एक ही प्रश्न को संबोधित करने वाले कई स्वतंत्र अध्ययनों के परिणामों को संयोजित करने की एक सांख्यिकीय विधि।

1976
Term coined by Gene Glass
~50,000
Published per year
#1
Evidence hierarchy*

*When well conducted. Quality of conduct matters more than study design alone — as GRADE recognizes.

1

Increase Statistical Power

Individual studies may be too small to detect effects.

2

Improve Precision

Narrower confidence intervals around effect estimates.

3

Resolve Disagreement

जब अध्ययन में टकराव होता है, तो पूलिंग सिग्नल को स्पष्ट कर सकती है।

4

Explore Heterogeneity

Identify why effects differ across populations or settings.

But meta-analysis can also

MISLEAD

When done poorly, it amplifies bias rather than truth.

1

अध्ययन मौलिक रूप से भिन्न चीज़ों को मापते हैं (सेब और संतरे)

2

Extreme heterogeneity that cannot be explained

3

One study dominates all others (megastudy problem)

4

अध्ययनों में पूर्वाग्रह का उच्च जोखिम है जिसे समायोजित नहीं किया जा सकता है

पूलिंग एक विशेषाधिकार है, अधिकार नहीं.

The decision to combine must be defended.

Systematic Reviews & Meta-Analyses of RCTs

Randomized Controlled Trials

Cohort Studies

Case-Control Studies

Case Series / Expert Opinion

पदानुक्रम में स्थिति कार्यप्रणाली की गुणवत्ता पर निर्भर करती है, न कि केवल अध्ययन के प्रकार पर।

इस कोर्स के माध्यम से पढ़ाया जाता है

evidence reversals.

प्रत्येक मॉड्यूल एक कहानी के साथ खुलता है कि दवा ने कैसे गलतियाँ कीं। फिर हम वह तरीका सीखते हैं जिससे नुकसान रोका जा सकता था।

ये वाक्यांश आपकी यात्रा के दौरान वापस आएंगे:

1. "हर संकेत सत्य नहीं होता।"

2. "तरीके मरीज़ों को हमारे आत्मविश्वास से बचाते हैं।"

3. "What was hidden in plain sight?"

4. "बिना उत्पत्ति के संख्या कोई संख्या नहीं है।"

5. "विषमता एक संदेश है, शोर नहीं।"

6. "साक्ष्य का अभाव अनुपस्थिति का प्रमाण नहीं है।"

7. "Certainty must be earned, not assumed."

1. आपको कभी-कभी मेटा-विश्लेषण में अध्ययन को पूल क्यों नहीं करना चाहिए?

A. Pooling is always better than single studies
B. When heterogeneity is extreme or studies measure different things
C. Pooling is always appropriate for RCTs
D. Statistical methods handle any situation

2. साक्ष्य पदानुक्रम में आरसीटी की व्यवस्थित समीक्षाएँ कहाँ बैठती हैं?

A. At the top
B. Same level as individual RCTs
C. नीचे समूह अध्ययन
D. Same as expert opinion

यात्रा शुरू करें.

मॉड्यूल 1: प्रश्न

मॉड्यूल 1: प्रश्न (कास्ट)

प्रत्येक संकेत सत्य नहीं है।

यह त्रुटि के बारे में कहानी नहीं है.

यह निश्चितता के बारे में एक कहानी है।

🎯 Learning Objectives

  • व्यवस्थित समीक्षा के लिए एक केंद्रित PICO प्रश्न तैयार करें
  • Distinguish surrogate outcomes from patient-important outcomes
  • Explain why biological plausibility alone is insufficient evidence
  • साक्ष्य-आधारित चिकित्सा के लिए CAST परीक्षण और इसके निहितार्थ का वर्णन करें
  • सिद्धांत लागू करें: "हर उज्ज्वल संकेत मार्गदर्शन नहीं है"

excess deaths per year

From a treatment everyone believed worked.

यह कहानी है कि हमने कैसे विश्वास किया - और हम कैसे गलत थे।

Patients with frequent PVCs after MI had 2-5x higher mortality.

400,000+
MI survivors/year
~40%
महत्वपूर्ण पीवीसी के साथ
160,000
at elevated risk

A massive clinical need. A clear target.

Antiarrhythmic drugs were developed, FDA approved,
and prescribed to ~200,000 patients per year.

इस कहानी में कोई खलनायक नजर नहीं आता.

सभी ने उपलब्ध सर्वोत्तम साक्ष्यों पर कार्य किया।

PREMISE 1

PVCs after MI predict sudden cardiac death

PREMISE 2

Antiarrhythmic drugs suppress PVCs

PREMISE 3

Suppressing PVCs should prevent sudden death

श्रृंखला तार्किक थी. निष्कर्ष अपरिहार्य लगा।

Finally, someone asked: "Does suppressing PVCs actually save lives?"

Design
Randomized, double-blind, placebo-controlled
Population
Post-MI patients with asymptomatic PVCs
Intervention
Encainide, flecainide, or moricizine vs placebo
Run-in
Only patients with ≥80% PVC suppression randomized
Primary endpoint
Death or cardiac arrest with resuscitation
Sample size
1,498 patients (encainide/flecainide arms)

डेटा सुरक्षा निगरानी बोर्ड परीक्षण को जल्दी रोक देता है।

Outcome Drug (n=755) Placebo (n=743)
Arrhythmic deaths 33 9
All cardiac deaths 43 16
Total deaths 56 22
Death rate 7.4% 3.0%
Relative Risk of Death: 2.5
95% CI: 1.6 - 4.5 | p < 0.001

अतालता को पूरी तरह से दबाने वाली दवाओं ने मृत्यु दर में 150% की वृद्धि की।

मानव लागत

Before CAST, ~200,000 Americans per year received these drugs.

~9,000

excess deaths per year - possibly more

Vietnam War: ~6,000 US deaths/year • These drugs: ~9,000+ deaths/year

For every number, a name we will never know.

Look again.

PREMISE 1

PVCs after MI predict sudden cardiac death

PREMISE 2

Antiarrhythmic drugs suppress PVCs

← THE LEAP
PREMISE 3

Suppressing PVCs should prevent sudden death

यह धारणा कि मार्कर को दबाने से परिणाम ठीक हो जाएगा, कभी परीक्षण नहीं किया गया।

1

पीवीसी क्षतिग्रस्त ऊतक का एक मार्कर था, मृत्यु का कारण नहीं

2

The drugs had proarrhythmic effects - triggering deadlier rhythms

3

सरोगेट में सुधार हुआ जबकि परिणाम खराब हुआ - एक अलग सरोगेट

सरोगेट ने झूठ नहीं बोला. हमने यह गलत प्रश्न पूछा।

Every answerable clinical question has four components:

P - POPULATION
मरीज़ कौन हैं? उनकी विशेषताएँ क्या हैं?
I - INTERVENTION
What treatment or exposure is being evaluated?
C - COMPARATOR
What is the alternative? Placebo? Standard care?
O - OUTCOME
What matters to patients? Hard endpoints vs surrogates.
CAST PICO
Post-MI patients with PVCs | Antiarrhythmics | Placebo | Mortality
🔍

जांच अभ्यास: कास्ट से पहले साक्ष्य

आप 1988 में हृदय रोग विशेषज्ञ हैं। एक मरीज़ एमआई से बच गया है लेकिन उसे बार-बार पीवीसी होता है। अवलोकन संबंधी साहित्य स्पष्ट है...

Studyपीवीसी वाले मरीज़Mortality Risk
Lown (1977)High-grade PVCs2.4x higher
Bigger (1984)>10 PVCs/hour3.1x higher
Mukharji (1984)Complex PVCs4.8x higher

संकेत साफ़ है. तंत्र प्रशंसनीय है. क्या आप एंटीरियथमिक्स लिखेंगे?

Before: Observational Logic

PVCs → Higher mortality

Drugs suppress PVCs

∴ Drugs should reduce mortality

After: CAST RCT (1989)

Death rate on drug: 7.4%

Death rate on placebo: 3.0%

RR = 2.5 (150% increase in deaths)

सरोगेट में सुधार हुआ। मरीजों की मौत हो गई. यही कारण है कि हम पूछते हैं: "परिणाम क्या मायने रखता है?"

1

जैविक संभाव्यता प्रमाण नहीं है

A logical mechanism doesn't guarantee the expected effect.

2

Surrogate endpoints can mislead

Improving a biomarker doesn't prove improvement in outcomes.

3

यादृच्छिक परीक्षण सबसे मजबूत कारणात्मक साक्ष्य प्रदान करते हैं

अकेले अवलोकन संबंधी डेटा शायद ही कभी गड़बड़ी के कारण हस्तक्षेप का कारण स्थापित करता है।

4

सर्वसम्मति साक्ष्य नहीं है

200,000 नुस्खे, एफडीए अनुमोदन और दिशानिर्देश सभी गलत थे।

This is why we do meta-analysis: to see past apparent truths.

कहानी: डेस-II सरोगेट त्रासदी

यदि आपके द्वारा पूछा गया प्रश्न यह निर्धारित करता है कि कौन जीवित है और कौन मरता है?

REAL DATA

1989 में, हृदय रोग विशेषज्ञों को यह पता था पीवीसी दमन संभव था एनकेनाइड और फ़्लीकेनाइड के साथ। सरोगेट समापन बिंदु एकदम सही लग रहा था: दवाओं ने पीवीसी को दबा दिया 80%+. But CAST randomized 1,498 patients सक्रिय दवा बनाम प्लेसिबो। समय से पहले रोक दी गई थी सुनवाई: 56 deaths in the drug group vs 22 in placebo. Mortality increased 2.5-fold. An estimated ~9,000 excess American deaths per year इन दवाओं के लिए जिम्मेदार थे।

हृदय रोग विशेषज्ञ की पसंद: 1987
आपके पोस्ट-एमआई रोगी को बार-बार पीवीसी होते हैं। आपके पास ऐसी दवाएं हैं जो उन्हें पूरी तरह से दबा देती हैं। आप क्या करते हैं?
पथ ए: सरोगेट का इलाज करें
Prescribe encainide — PVCs vanish, the ECG looks clean
बायोमार्कर में सुधार होता है। आप आत्मविश्वास महसूस करते हैं. रोगी मर जाता है.
OUTCOME: An estimated 50,000+ excess deaths across the US during years of use
PATH B: Demand a Mortality Trial
आग्रह करें: "मुझे दिखाएँ कि जीवित रहने में सुधार होता है, न कि केवल ईसीजी में"
परीक्षण से नुकसान का पता चलता है। दवाएँ वापस ले ली जाती हैं। जान बच जाती है.
परिणाम: सही PICO प्रश्न किसी विपत्ति को रोकता है
THE REVELATION
सवाल कभी नहीं था "क्या हम पीवीसी को दबा सकते हैं?" यह था "क्या पीवीसी दमन से जान बचती है?" एक सरोगेट समापन बिंदु ने गलत प्रश्न का उत्तर दिया। सही PICO ने शुरू से ही परिणाम के रूप में मृत्यु दर की मांग की होगी।

What appears certain may be wrong.

What everyone believes may be false.

ऐसे तरीके मौजूद हैं जिससे मरीज़ों को हमारे भरोसे की कीमत नहीं चुकानी पड़ती।

यही कारण है कि आप यहाँ हैं.

1. एंटीरैडमिक तर्क में मूलभूत त्रुटि क्या थी?

A. परीक्षण यादृच्छिक नहीं थे
B. Treating a surrogate (PVCs) was assumed to improve outcomes
C. नमूना आकार बहुत छोटा था
D. एफडीए की मंजूरी जल्दबाज़ी में दी गई

2. PICO में, "O" का क्या अर्थ है और यह क्यों मायने रखता है?

A. Observation - what researchers see
B. उद्देश्य - अनुसंधान लक्ष्य
C. Outcome - what matters to patients
D. संगठन - अध्ययन संरचना

प्रत्येक संकेत सत्य नहीं है।

तरीके मरीज़ों को हमारे आत्मविश्वास से बचाते हैं।

मॉड्यूल 2: प्रोटोकॉल (एचआरटी)

What was hidden in plain sight?

यह एक कहानी है

observational evidence.

🎯 Learning Objectives

  • Explain why protocol pre-registration prevents bias
  • Identify key elements of a PROSPERO registration
  • Distinguish healthy user bias from true treatment effects
  • Describe why observational studies overestimated HRT benefits
  • सिद्धांत लागू करें: "तरीके मरीजों को हमारे आत्मविश्वास से बचाते हैं"

observational studies

All showing hormone replacement therapy protected postmenopausal women from heart disease.

सबूत जबरदस्त लग रहे थे. निष्कर्ष निश्चित लग रहा था.

122,000 nurses followed for decades. HRT users had 40-50% lower cardiovascular mortality.

RR 0.56
Cardiovascular mortality
122,000
Women followed
20+ years
Follow-up

Landmark study. Impeccable methodology. Wrong conclusion.

1

Healthy User Bias: Women who chose HRT were healthier, wealthier, better educated

2

Compliance Bias: Women who took HRT consistently also took better care of themselves

3

Prescriber Bias: Doctors gave HRT to healthier women with fewer risk factors

उपचार उनकी रक्षा नहीं कर रहा था। वे पहले से ही सुरक्षित थे.

The largest randomized trial of HRT ever conducted.

Design
Randomized, double-blind, placebo-controlled
Population
Postmenopausal women aged 50-79
Intervention
Estrogen + Progestin vs Placebo
Sample size
16,608 women
Primary endpoint
Coronary heart disease
Planned duration
8.5 years

Trial stopped early after 5.2 years. Harm exceeded benefits.

Outcome Hazard Ratio Direction
Coronary heart disease 1.29 HARM
Stroke 1.41 HARM
Breast cancer 1.26 HARM
Pulmonary embolism 2.13 HARM
Complete Reversal
30 वर्षों के अवलोकन संबंधी साक्ष्य पलट दिए गए

The Lesson

PRE-SPECIFY

A protocol written before the search begins prevents fishing, prevents bias, prevents hindsight distortion.

कहानी: हार्मोन टाइमिंग परिकल्पना

क्या होगा यदि उपचार काम करता है - लेकिन केवल कुछ के लिए?

REAL DATA

WHI showed HRT increased cardiovascular events overall. But later analyses revealed a critical pattern: women who started HRT within 10 years of menopause had REDUCED cardiovascular risk. Women starting 20+ years after menopause had INCREASED risk. The overall null/harm result hid a timing effect.

विश्लेषक की दुविधा
आप WHI उपसमूहों का विश्लेषण कर रहे हैं। समग्र परिणाम हानि दर्शाता है। क्या आप अधिक गहराई तक खुदाई करते हैं?
PATH A: Report Overall Only
Conclude HRT is harmful for all postmenopausal women
Simple message. Guidelines recommend against HRT universally.
OUTCOME: Deny potential benefit to younger menopausal women
PATH B: Pre-Specify Timing Subgroups
Analyze by years since menopause (biologically plausible)
सुरक्षित एचआरटी आरंभ के लिए "समय विंडो" की खोज करें।
OUTCOME: Enable personalized recommendations
THE REVELATION
मछली पकड़ते समय उपसमूह विश्लेषण खतरनाक होता है। यह आवश्यक है जब जीव विज्ञान प्रभाव संशोधन की भविष्यवाणी करता है। समय संबंधी परिकल्पना जैविक रूप से प्रशंसनीय थी - और इसे पहले से निर्दिष्ट किया जाना चाहिए था।
1

खोजने से पहले पंजीकरण करें

PROSPERO: International prospective register of systematic reviews

2

अपने निर्णय लॉक करें

PICO, search strategy, outcomes, analysis plan - all pre-specified

3

Document Amendments

परिवर्तन की अनुमति है लेकिन पारदर्शी और उचित होना चाहिए

4

Prevent Duplication

शुरू करने से पहले जांचें कि क्या आपकी समीक्षा पहले से मौजूद है

1. नर्सों के स्वास्थ्य अध्ययन से पता चला कि एचआरटी से लाभ क्यों हुआ जबकि डब्ल्यूएचआई को नहीं हुआ?

A. Nurses' Health had too few patients
B. Healthy user bias in observational studies
C. Nurses' Health had shorter follow-up
D. Different hormone formulations were used

2. What is the primary purpose of PROSPERO registration?

A. To register clinical trials
B. समीक्षा पूर्ण करने में तेजी लाने के लिए
C. तरीकों को पूर्व-निर्दिष्ट करना और पूर्वाग्रह को रोकना
D. समीक्षाओं के लिए धन प्राप्त करना

पूर्व विशिष्टता नौकरशाही नहीं है.

It is protection.

Against our own tendency to find what we expect.

तरीके मरीज़ों को हमारे आत्मविश्वास से बचाते हैं।

What was hidden in plain sight?

मॉड्यूल 3: खोज

मॉड्यूल 3: खोज (रोसिग्लिटाज़ोन)

What was hidden in plain sight?

यह एक कहानी है

what they didn't publish.

🎯 Learning Objectives

  • Develop a comprehensive search strategy using PRESS guidelines
  • Search multiple databases including grey literature sources
  • Identify trial registries and regulatory databases (ClinicalTrials.gov, FDA)
  • Explain how the rosiglitazone case exposed hidden cardiovascular harms
  • सिद्धांत लागू करें: "स्पष्ट दृश्य में क्या छिपा था?"

annual sales at peak

अवंदिया (रोसिग्लिटाज़ोन) दुनिया की सबसे अधिक बिकने वाली मधुमेह दवाओं में से एक थी।

प्रकाशित परीक्षण आश्वस्त करने वाले लगे। अप्रकाशित लोगों ने एक अलग कहानी बताई।

Published trials showed rosiglitazone effectively lowered HbA1c. Cardiovascular outcomes were rarely reported.

1999
FDA approval
6M+
Patients treated
~0.7%
HbA1c reduction

सरोगेट अच्छा लग रहा था. लेकिन वास्तविक हृदय संबंधी घटनाओं के बारे में क्या?

डॉ. स्टीवन निसेन ने जीएसके की अपनी वेबसाइट से अप्रकाशित परीक्षण डेटा प्राप्त किया।

कानूनी समझौते के तहत जीएसके को नैदानिक ​​​​परीक्षण के परिणाम ऑनलाइन पोस्ट करने की आवश्यकता थी। निसेन और वोल्स्की ने 42 परीक्षणों का विश्लेषण किया - जिनमें से कई कभी भी पत्रिकाओं में प्रकाशित नहीं हुए।

डेटा तकनीकी रूप से सार्वजनिक था।

No one had systematically searched for it.

Outcome Odds Ratio 95% CI
Myocardial Infarction 1.43 1.03 - 1.98
CV Death 1.64 0.98 - 2.74
43% Increased Risk of Heart Attack
मायोकार्डियल रोधगलन के लिए पी = 0.03

Published in NEJM. The FDA called an emergency advisory committee meeting.

The FDA Advisory Committee: July 2007

22-1
Voted: CV risk exists
20-3
चेतावनियों के साथ बाज़ार में बने रहें

कमेटी बंटी हुई थी. कुछ लोग इसे वापस लेना चाहते थे। कुछ लोगों ने मेटा-विश्लेषण को त्रुटिपूर्ण बताया।

लेकिन सिग्नल को अनदेखा नहीं किया जा सका।

1

Black box warning added for heart failure risk (2007)

2

Severe restrictions on prescribing in the US (2010)

3

Withdrawn पूरी तरह से यूरोपीय बाजार से (2010)

4

FDA now requires cardiovascular outcome trials for all diabetes drugs

PUBLISHED
PubMed, Embase, CENTRAL, Web of Science
GREY LITERATURE
Conference abstracts, dissertations, regulatory docs
TRIAL REGISTRIES
ClinicalTrials.gov, WHO ICTRP, EU CTR
REGULATORY
FDA, EMA, Health Canada submissions
COMPANY DATA
GSK, Pfizer, Roche clinical trial registries
HAND SEARCH
Reference lists, contact authors, experts

Peer Review of Electronic Search Strategies

1

शोध प्रश्न का अनुवाद

क्या खोज PICO को दर्शाती है तत्व?

2

बूलियन और प्रॉक्सिमिटी ऑपरेटर्स

क्या और, या, सही ढंग से उपयोग नहीं किया जाता है?

3

Subject Headings

क्या MeSH/Emtree शब्द उपयुक्त और विस्फोटित हैं?

4

Text Words

Synonyms, spelling variants, truncation?

5

Spelling, Syntax, Line Numbers

क्या ऐसी त्रुटियां हैं जो पुनर्प्राप्ति का कारण बनेंगी विफलताएँ?

6

सीमाएँ और फ़िल्टर

क्या दिनांक, भाषा, अध्ययन डिज़ाइन सीमाएँ उपयुक्त हैं?

Peer-reviewed searches substantially improve retrieval of key studies.

PRESS guideline: McGowan et al., 2016

प्रत्येक डेटाबेस के लिए समान खोज को अनुकूलित किया जाना चाहिए:

PubMed

"diabetes mellitus, type 2"[MeSH] OR "type 2 diabetes"[tiab]

Embase

'non insulin dependent diabetes mellitus'/exp OR 'type 2 diabetes':ti,ab

Subject headings, field tags, and operators differ between databases.

कहानी: टैमीफ्लू पारदर्शिता अभियान

क्या होता है जब आप खोजते हैं - और कुछ नहीं पाते?

REAL DATA

Governments stockpiled $9 billion महामारी फ्लू के लिए ओसेल्टामिविर (टैमीफ्लू)। कोक्रेन सहयोग ने साक्ष्यों की समीक्षा करने का प्रयास किया। 77 clinical trials, full reports existed for only 20का। रोश ने 5 yearsके लिए डेटा साझा करने से इनकार कर दिया। जब बीएमजे और कोक्रेन ने अंततः प्राप्त किया over 160,000 pages of clinical study reports, they found: Tamiflu reduced symptoms by less than 1 day, with no evidence it prevented hospitalizations or complications.

समीक्षक की दुविधा: 2009
आप टैमीफ्लू की कोक्रेन समीक्षा अपडेट कर रहे हैं। प्रकाशित परीक्षण सकारात्मक दिखते हैं. लेकिन 57 परीक्षणों की पूरी रिपोर्ट उपलब्ध नहीं है। आप क्या करते हैं?
PATH A: Analyze What's Published
Use the 20 available trials. Conclude Tamiflu is effective.
आपकी समीक्षा निरंतर भंडारण का समर्थन करती है। कमजोर सबूतों पर $9 बिलियन खर्च किए गए।
OUTCOME: Billions wasted, true efficacy unknown
PATH B: संपूर्ण डेटा की मांग करें
Refuse to publish until all trial data is accessible
5-year campaign. 160,000+ pages finally obtained. Truth emerges.
OUTCOME: Evidence policy changed; EMA now publishes all trial reports
THE REVELATION
एक खोज केवल उतनी ही अच्छी होती है जितनी खोजने योग्य हो। जब ग्रे साहित्य कॉर्पोरेट दीवारों के पीछे छिपा हुआ है, तो सबसे व्यापक पबमेड खोज भी सच्चाई से चूक जाएगी। टैमीफ्लू गाथा ने वैश्विक नीति बदल दी: ईएमए अब सभी दवाओं के लिए नैदानिक ​​​​अध्ययन रिपोर्ट प्रकाशित करता है।

If Nissen had searched only PubMed,

the signal would have remained hidden.

Comprehensive search is survival.

What was hidden in plain sight?

1. किस प्रकार के साक्ष्य स्रोत ने रोसिग्लिटाज़ोन कार्डियोवस्कुलर सिग्नल का खुलासा किया?

A. Published journal articles
B. Cochrane Library
C. Company clinical trial registry
D. FDA approval documents

2. What does PRESS stand for?

A. साक्ष्य खोज मानकों का प्रकाशन समीक्षा
B. Peer Review of Electronic Search Strategies
C. साक्ष्य संश्लेषण अध्ययन की रिपोर्टिंग के लिए प्रोटोकॉल
D. Primary Research Evidence Search System

What was hidden in plain sight?

मॉड्यूल 4: स्क्रीनिंग

मॉड्यूल 4: स्क्रीनिंग (Vioxx)

बिना मूल के संख्या एक संख्या नहीं है।

यह एक कहानी है

what they chose to report.

🎯 Learning Objectives

  • Apply PRISMA flow diagram to document study selection
  • Implement dual-reviewer screening with conflict resolution
  • चयनात्मक परिणाम रिपोर्टिंग और डेटा हेरफेर की पहचान करें
  • Calculate inter-rater reliability (Cohen's kappa)
  • सिद्धांत लागू करें: "बिना मूल के संख्या एक संख्या नहीं है"

heart attacks attributed to Vioxx

A blockbuster drug. A hidden signal. A preventable catastrophe.

के बीच 1999 और 2004 में लाखों लोगों ने इस दर्द निवारक दवा का सेवन किया। कुछ कभी घर नहीं आए।

Rofecoxib (Vioxx) एक COX-2 चयनात्मक NSAID था। पारंपरिक दर्द निवारक दवाओं की तुलना में पेट के लिए अधिक सुरक्षित के रूप में विपणन किया गया।

1999
FDA approval
$2.5B
Peak annual sales
80M+
Patients prescribed

Vioxx Gastrointestinal Outcomes Research

Design
Randomized, double-blind
Comparison
Vioxx vs Naproxen
Population
Rheumatoid arthritis
Sample
8,076 patients
Primary Outcome
GI events
Published
NEJM, November 2000
GI Outcome Vioxx Naproxen
Confirmed GI events 2.1 per 100 pt-yrs 4.5 per 100 pt-yrs
Reduction 54% fewer GI events

यह डॉक्टरों को बताया गया था। मरीजों का यही मानना ​​था।

CV Outcome Vioxx Naproxen
Myocardial Infarction 20 events 4 events
Relative Risk 5x higher in Vioxx group
5-fold Increase in Heart Attacks
Mentioned only briefly, attributed to naproxen being "cardioprotective"
1

डेटा कटऑफ हेरफेर: 3 additional heart attacks occurred after the cutoff used in publication

2

Spin: सीवी सिग्नल को नेप्रोक्सन के कार्डियोप्रोटेक्टिव होने के रूप में समझाया गया था (कोई सबूत नहीं)

3

Outcome switching: सीवी घटनाएं पूर्व-निर्दिष्ट थीं लेकिन जोर नहीं दिया गया था

4

Internal knowledge: मर्क ईमेल से पता चलता है कि वे सिग्नल के बारे में जानते थे

अप्रूव ट्रायल (2004)

कोलोरेक्टल पॉलीप रोकथाम के लिए एक परीक्षण - सुरक्षा के लिए जल्दी बंद कर दिया गया।

RR 1.92
CV events vs placebo
Sept 2004
Vioxx withdrawn

Four years after VIGOR showed a 5x risk. Four years too late.

कहानी: Vioxx निर्णय वृक्ष

क्या आपने विचार किया है क्या होता है जब कोई सिग्नल शोर में छिप जाता है?

REAL DATA

Vioxx (rofecoxib) को 1999. By 2004, estimates suggest 88,000-140,000 excess heart attacks and 30,000-40,000 deaths. Merck's own VIGOR trial showed 5x cardiovascular risk in 2000—but it was dismissed as a "naproxen cardioprotective effect."

द फोर्क इन द रोड
में मंजूरी दे दी गई थी। आप 2001 में FDA समीक्षक हैं। VIGOR डेटा Vioxx बनाम 5x दिल के दौरे के जोखिम को दर्शाता है नेप्रोक्सन।
पथ A: स्पष्टीकरण स्वीकार करें
Believe Merck's hypothesis: naproxen is cardioprotective
No additional safety studies required. Drug stays on market at full speed.
परिणाम: 4 वर्षों में 40,000+ मौतें
पथ B: मांग साक्ष्य
Require a dedicated CV safety trial before continued marketing
Delay or restrict marketing until cardiovascular safety is established.
OUTCOME: Signal detected early, lives saved
THE REVELATION
संकेत 2000 में था। गलत स्पष्टीकरण कार्रवाई में 4 साल की देरी। एक वैकल्पिक परिकल्पना - बिना सबूत के स्वीकार की गई - हजारों लोगों की जान ले ली।

Every step of screening must be documented and transparent.

Identification
Records from databases + other sources
Screening
Title/abstract review (duplicates removed)
Eligibility
Full-text assessment (with exclusion reasons)
Included
Studies in synthesis
1

Reduces Selection Bias

One reviewer might unconsciously favor certain studies

2

Catches Errors

थकान, गलत पढ़ना और गलतियाँ अपरिहार्य हैं

3

Forces Explicit Criteria

Disagreements reveal ambiguity in inclusion rules

Typical agreement: κ = 0.6-0.8

Disagreements resolved by discussion or third reviewer

Before screening thousands of records, reviewers should calibrate on a sample of 50-100 records.

1

Screen the same set independently

2

Compare decisions and discuss disagreements

3

Refine inclusion criteria until κ > 0.7

4

दस्तावेज अंशांकन प्रक्रिया और कोई भी नियम परिवर्तन

New in 2020
Separate reporting of database vs register searches
New in 2020
स्वचालन उपकरण की रिपोर्ट की जानी चाहिए
New in 2020
Citation searching documented separately
New in 2020
Reasons for exclusion at full-text mandatory

PRISMA 2020 ने संश्लेषण विधियों, निश्चितता मूल्यांकन और प्रोटोकॉल पंजीकरण पर विस्तारित रिपोर्टिंग के साथ चेकलिस्ट को काफी हद तक संशोधित किया।

If Vioxx's cardiovascular data had been screened by independent reviewers,

if all pre-specified outcomes had been required to be reported,

88,000 heart attacks might have been prevented.

बिना मूल के संख्या एक संख्या नहीं है।

1. VIGOR परीक्षण में, नेप्रोक्सन की तुलना में Vioxx समूह में MI का सापेक्ष जोखिम क्या था?

A. 1.5x higher
B. 2x higher
C. 5x higher
D. 10x higher

2. Why is dual screening (two independent reviewers) important?

A. It makes screening faster
B. It reduces selection bias and catches errors
C. यह समीक्षा करने के लिए अध्ययनों की संख्या कम कर देता है
D. It allows reviewers to skip full-text review

बिना मूल के संख्या एक संख्या नहीं है।

मॉड्यूल 5: निष्कर्षण

मॉड्यूल 5: निष्कर्षण (कमी)

बिना मूल के संख्या एक संख्या नहीं है।

यह एक कहानी है

संख्याएं जो कभी अस्तित्व में नहीं थीं।

🎯 Learning Objectives

  • उत्पत्ति क्षेत्रों के साथ एक मानकीकृत डेटा निष्कर्षण फॉर्म डिज़ाइन करें
  • Calculate effect sizes from various reported statistics (OR, RR, HR, SMD)
  • Implement dual-extraction with discrepancy resolution
  • डेटा निर्माण और कदाचार के लिए लाल झंडे की पहचान करें
  • Explain how the DECREASE fraud affected clinical guidelines

possible excess deaths in Europe

मनगढ़ंत नैदानिक परीक्षण पर आधारित दिशानिर्देशों से डेटा।

DECREASE परीक्षणों ने दुनिया भर में पेरिऑपरेटिव देखभाल को प्रभावित किया। डेटा का आविष्कार किया गया था।

Professor at Erasmus Medical Center, Rotterdam. Author of over 500 papers. Lead author of ESC guidelines on perioperative cardiac care.

500+
Publications
DECREASE
Trial series I-VI
ESC
Guideline chair

एक स्पष्टतः अप्राप्य स्रोत। जब तक किसी ने डेटा को नहीं देखा।

Trial Finding Impact
DECREASE-I (1999) 90% reduction in cardiac death Changed guidelines
DECREASE-IV (2009) Beta-blockers safe in low-risk Expanded recommendations

Effect sizes were implausibly large.

90% reduction? Almost nothing in medicine works that well.

1

Erasmus MC investigated after whistleblower complaints

2

मनगढ़ंत रोगी डेटा: Patients who didn't exist or weren't enrolled

3

No informed consent: Many "participants" never consented

4

Poldermans dismissed: From Erasmus MC in 2011

नुकसान का झरना

जब DECREASE को हटा दिया गया था मेटा-विश्लेषण...

Benefit → Harm
Direction reversed
27% ↑
Stroke risk increase

POISE परीक्षण (2008) ने नुकसान दिखाया था। इसे खारिज कर दिया गया क्योंकि यह DECREASE के साथ विरोधाभासी था।

1

Trust in authority: पॉल्डरमैन्स अपने स्वयं के साक्ष्य की समीक्षा करने वाले दिशानिर्देश लेखक थे

2

No data verification: किसी ने भी व्यक्तिगत रोगी डेटा नहीं मांगा

3

Publication prestige: Published in top journals, assumed valid

4

Implausible effects accepted: 90% reductions should raise suspicion

1

Dual Extraction

Two extractors independently - catches transcription errors and forces scrutiny

2

Record Provenance

Table, page, paragraph - every number traceable to source

3

Verify Against Registry

ClinicalTrials.gov परिणाम बनाम प्रकाशन - विसंगतियां लाल झंडे हैं

4

Request IPD

Individual patient data reveals what aggregate summaries hide

निष्कर्षण के दौरान, आप रिपोर्ट किए गए डेटा से प्रभाव आकार की गणना करते हैं:

BINARY OUTCOMES

Odds Ratio, Risk Ratio, Risk Difference from 2x2 tables

CONTINUOUS OUTCOMES

माध्य अंतर, साधन और एसडी से मानकीकृत माध्य अंतर

हमेशा सबसे विश्वसनीय स्रोत से निकालें।

Prefer: ITT results > per-protocol > subgroups

!

Implausible effect sizes: 80-90% reductions should prompt scrutiny

!

Baseline imbalances: वे समूह जो "बहुत पूर्णतः" मेल खाते हैं

!

Round numbers: "Exactly 50" or "exactly 100" patients per arm

!

Registry discrepancies: प्रकाशित एन पंजीकृत एन से भिन्न है

Researcher

अध्ययन रिपोर्ट के परिणाम अलग-अलग मेट्रिक्स में होते हैं। उन्हें पूल करने के लिए, आपको अक्सर रूपांतरणों की आवश्यकता होती है:

FromToFormula
SMD (d)log-ORlog-OR = d × π / √3
log-ORSMD (d)d = log-OR × √3 / π
Correlation (r)Fisher zz = 0.5 × ln((1+r)/(1−r))
ORRRRR = OR / (1 − P₀ + P₀ × OR)
ORNNTNNT = 1 / (P₀ − OR×P₀ / (1−P₀+OR×P₀))

P₀ = नियंत्रण समूह में आधारभूत जोखिम। ये सूत्र अनुमानित स्थितियाँ मानते हैं; बोरेंस्टीन एट अल देखें। (अध्याय 7) सटीक व्युत्पत्तियों के लिए।

Researcher

Many trials report time-to-event outcomes using hazard ratios (HR). Pooling HRs in meta-analysis requires special handling:

1

लॉग (एचआर) + एसई विधि

परीक्षण से लॉग (एचआर) और उसके एसई निकालें। यदि रिपोर्ट नहीं की गई है, तो सीआई से एसई प्राप्त करें: एसई = (एलएन(ऊपरी) - एलएन(निचला)) / (2 × 1.96)। मानक व्युत्क्रम-विचरण विधियों का उपयोग करके पूल करें।

2

जब एचआर की रिपोर्ट नहीं की जाती है

कपलान-मेयर वक्रों से आईपीडी का पुनर्निर्माण करने के लिए तरीके मौजूद हैं (गयोट एट अल. 2012) या पी-वैल्यू और इवेंट काउंट्स से एचआर का अनुमान लगाने के लिए (परमार एट अल. 1998)। उपलब्ध होने पर हमेशा सीधे रिपोर्ट किए गए समायोजित एचआर को प्राथमिकता दें।

HR < 1 favors treatment; HR > 1 favors control. Do not convert HRs to ORs or RRs—they measure fundamentally different quantities.

कहानी: बोल्ड कोलाइड स्कैंडल

यदि आपके द्वारा निकाला गया डेटा कभी वास्तविक नहीं था तो क्या होगा?

REAL DATA

जोआचिम बोल्ड एनेस्थीसिया द्रव प्रबंधन में सबसे विपुल शोधकर्ता थे। ऊपर उनके 180 प्रकाशन वापस ले लिये गये - चिकित्सा इतिहास में सबसे बड़े वापसी मामलों में से एक। उनके मनगढ़ंत डेटा से पता चला कि हाइड्रॉक्सीएथाइल स्टार्च (एचईएस) सुरक्षित था। मेटा-विश्लेषण जिसमें उनका अध्ययन शामिल था, ने निष्कर्ष निकाला कि एचईएस हानिरहित था। जब बोल्ड्ट की पढ़ाई हटा दी गई, एकत्रित प्रभाव उलट गया: HES increased kidney injury by 59% (RR 1.59, 95% CI 1.26-2.00) and mortality by ~9% (RR 1.09). An estimated thousands of patients received a harmful fluid based on fabricated evidence.

द एक्सट्रैक्टर्स विजिलेंस: 2010
आप द्रव पुनर्जीवन मेटा-विश्लेषण के लिए डेटा निकाल रहे हैं। बोल्ड्ट का अध्ययन साहित्य (90+ पेपर) पर हावी है। एक व्हिसिलब्लोअर ने चिंता बढ़ा दी है. आप क्या करते हैं?
PATH A: Extract as Published
Trust peer-reviewed publications. Extract Boldt's data like any other.
Your meta-analysis shows HES is safe. Guidelines recommend it.
OUTCOME: Thousands receive a nephrotoxic fluid
PATH B: Verify Provenance
नैतिक अनुमोदनों की क्रॉस-चेक करें, स्रोत डेटा का अनुरोध करें, संदिग्ध अध्ययनों को छोड़कर संवेदनशीलता विश्लेषण करें
Discover missing ethics approvals. Flag studies. Re-analyze without them.
OUTCOME: True signal emerges — HES causes harm
THE REVELATION
उद्गम नौकरशाही नहीं है. यह साक्ष्य और कल्पना के बीच का अंतर है। प्रत्येक निकाले गए नंबर को सत्यापन योग्य रोगी डेटा के साथ एक नैतिकता-अनुमोदित अध्ययन का पता लगाना चाहिए। बिना उद्गम के, बिना स्वामी वाला नंबर हथियार बन सकता है।

आपके मेटा-विश्लेषण में प्रत्येक संख्या

must trace back to a verifiable source.

बिना मूल के संख्या एक संख्या नहीं है।

Fraudulent data can kill as surely as fraudulent drugs.

1. क्या हुआ जब DECREASE परीक्षण डेटा को बीटा-ब्लॉकर मेटा-विश्लेषण से हटा दिया गया?

A. The benefit became even larger
B. No change in conclusions
C. The direction reversed to show potential harm
D. नतीजे बेनतीजा रहे

2. Why should dual extraction be standard practice?

A. It catches transcription errors and forces scrutiny
B. It makes extraction faster
C. यह अधिक अध्ययन खोजने में मदद करता है
D. It reduces the amount of work needed

बिना मूल के संख्या एक संख्या नहीं है।

मॉड्यूल 6: पूर्वाग्रह

मॉड्यूल 6: पूर्वाग्रह (एप्रोटीनिन/बार्ट)

तरीके मरीज़ों को हमारे आत्मविश्वास से बचाते हैं।

यह एक कहानी है

वह पूर्वाग्रह जिसे हम नहीं देख सकते।

🎯 Learning Objectives

  • Apply Risk of Bias 2.0 (RoB 2) to randomized trials
  • गैर-यादृच्छिक अध्ययन के लिए रॉबिन्स-I लागू करें
  • Assess all five RoB 2 domains (randomization, deviations, missing data, measurement, selection)
  • Distinguish confounding by indication from true treatment effects
  • Explain how BART revealed hidden harms of aprotinin

बाज़ार में वर्षों

सर्जिकल रक्तस्राव को कम करने के लिए एप्रोटीनिन स्वर्ण मानक था।

फिर किसी ने आरसीटी चलाया। सच्चाई अलग थी.

1

Sicker patients got aprotinin: Surgeons used it in complex, high-risk cases

2

Survivors bias: Dead patients can't report complications

3

Publication bias: नकारात्मक अध्ययन प्रकाशित नहीं किये गये

अवलोकन संबंधी अध्ययन रोगी के आधारभूत जोखिम से दवा के प्रभाव को अलग नहीं कर सके।

Blood Conservation Using Antifibrinolytics in a Randomized Trial

OutcomeAprotininAlternatives
30-day mortality6.0%3.9%
Relative Risk1.53 (53% increased death)
Trial Stopped Early for Harm
नवंबर 2007 को बाज़ार से वापस ले लिया गया
🔍

जांच: पूर्वाग्रह का आकलन करें

आप अवलोकन संबंधी अध्ययनों की समीक्षा कर रहे हैं। पूर्वाग्रहपूर्ण सोच का जोखिम लागू करें:

QuestionObservationalBART (RCT)
Random allocation?❌ Surgeon choice✓ Yes
Baseline comparable?❌ Sicker got drug✓ Balanced
Blinding?❌ Open label✓ Double-blind

Confounding by indication: सर्जनों ने सबसे बीमार रोगियों को एप्रोटीनिन दिया। जब वे उत्तरजीविता पूर्वाग्रह को माप रहे थे, तो अवलोकन संबंधी अध्ययनों ने दवा को जीवित रहने के लिए जिम्मेदार ठहराया।

D1

Randomization Process

D2

इच्छित हस्तक्षेपों से विचलन

D3

अनुपलब्ध परिणाम डेटा

D4

परिणाम का मापन

D5

रिपोर्ट किए गए परिणाम का चयन

जब आरसीटी अनुपलब्ध हो, तो रॉबिन्स-I (हस्तक्षेप के गैर-यादृच्छिक अध्ययन में पूर्वाग्रह का जोखिम) का उपयोग करें

1

Confounding

Baseline differences between groups

2

Selection of Participants

Exclusions related to intervention

3

Classification of Interventions

Misclassification of exposure status

4

इच्छित हस्तक्षेपों से विचलन

Co-interventions, contamination

5

Missing Data

Differential loss to follow-up

6

Measurement of Outcomes

Ascertainment bias

7

Selection of Reported Result

Selective reporting

Ratings: Low / Moderate / Serious / Critical / No information

कहानी: एप्रोटीनिन बार्ट परीक्षण

क्या होता है जब 64 अध्ययन सहमत होते हैं - और वे सभी गलत होते हैं?

REAL DATA

एप्रोटीनिन का उपयोग हृदय शल्य चिकित्सा में रक्तस्राव को कम करने के लिए किया जाता था 20 years. 64 small randomized trials सुझाव दिया कि यह सुरक्षित और प्रभावी था। मेटा-विश्लेषण से लाभ की पुष्टि हुई। फिर BART trial (2008) randomized 2,331 patients: aprotinin vs. tranexamic acid vs. aminocaproic acid. Result: aprotinin increased mortality by 53% (आरआर 1.53, 95% सीआई 1.06-2.22)। मुकदमा था नुकसान के लिए जल्दी रुक गए. बायर ने महीनों के भीतर बाजार से एप्रोटीनिन वापस ले लिया।

सर्जन का साक्ष्य: 2006
आप एक कार्डियक सर्जन हैं जो एंटीफाइब्रिनोलिटिक का चयन कर रहे हैं। 64 छोटे परीक्षण एप्रोटीनिन के पक्ष में हैं, लेकिन कोई भी मृत्यु दर का पता लगाने में सक्षम नहीं था। एक बड़ा आरसीटी (BART) नामांकन कर रहा है। क्या आप इंतज़ार करते हैं?
पथ ए: मेटा-विश्लेषण पर भरोसा करें
64 trials can't all be wrong. Continue prescribing aprotinin.
छोटे परीक्षणों में रक्तस्राव को मापा गया, मृत्यु को नहीं। किसी के पास मृत्यु दर के लिए पर्याप्त शक्ति नहीं थी। मेटा-विश्लेषण ने कमज़ोर सरोगेट परिणामों को एकत्रित किया।
OUTCOME: Excess deaths in cardiac surgery patients
PATH B: Assess Risk of Bias First
RoB के साथ सभी 64 परीक्षणों को रेट करें। ध्यान दें कि वे छोटे हैं, सरोगेट परिणामों का उपयोग करते हैं, और उनमें उच्च क्षरण होता है। पर्याप्त रूप से संचालित आरसीटी की प्रतीक्षा करें।
BART reveals the truth. Switch to safer alternatives.
OUTCOME: Lives saved by demanding adequately powered evidence
THE REVELATION
साक्ष्य की मात्रा गुणवत्ता के बराबर नहीं होती। ग़लत नतीजे मापने वाले चौसठ कमज़ोर परीक्षण, मृत्यु दर मापने वाले पर्याप्त रूप से संचालित परीक्षण से ज़्यादा महत्वपूर्ण नहीं हैं। पूर्वाग्रह मूल्यांकन का जोखिम एक औपचारिकता नहीं है - यह रोगियों और छोटे, सरोगेट-संचालित साक्ष्य से भ्रामक निष्कर्षों के बीच ढाल है।

Sixty-four small trials measured bleeding, not death.

One adequately powered trial revealed 53% increased mortality.

साक्ष्य की मात्रा गुणवत्ता और शक्ति का स्थान नहीं ले सकती।

1. Why did 64 small trials miss aprotinin's harm?

A. Underpowered for mortality; used surrogate outcomes
B. Confounding by indication
C. Outcome measured incorrectly
D. Follow-up too short

तरीके मरीज़ों को हमारे आत्मविश्वास से बचाते हैं।

मॉड्यूल 7: संश्लेषण

मॉड्यूल 7: संश्लेषण (मैग्नीशियम/आईएसआईएस-4)

विषमता एक संदेश है, शोर नहीं।

मैग्नीशियम विवाद: 1991-1995

When pooling leads us astray.

🎯 Learning Objectives

  • Calculate pooled effect sizes using fixed-effect and random-effects models
  • Choose between DerSimonian-Laird and HKSJ estimators appropriately
  • Interpret forest plots including weights, confidence intervals, and diamonds
  • Explain why small-study effects can mislead meta-analyses
  • सिद्धांत लागू करें: "विषमता एक संदेश है, शोर नहीं"

"आप आशा और साक्ष्य के चौराहे पर खड़े हैं..."

Heart disease kills more people worldwide than any other cause. In 1991, a new hope emerges: Could something as simple and cheap as intravenous magnesium save lives after myocardial infarction?

जैविक तर्क सही था:

Magnesium stabilizes cardiac membranes, prevents arrhythmias, and vasodilates coronary arteries.

Leicester Intravenous Magnesium Intervention Trial, 1992

2,316
Patients enrolled
24%
Mortality reduction
p = 0.04
Statistically significant

A cheap, safe intervention that could save 250,000 lives per year globally.

चिकित्सा समुदाय विद्युतीकृत था।

Researchers pooled seven randomized trials of IV magnesium in MI:

Trial Year N Odds Ratio
Morton 19841984400.10
Rasmussen 198619862730.35
Smith 198619864000.48
Abraham 19871987940.87
Shechter 199019901030.27
Ceremuzynski 19891989480.22
LIMIT-219922,3160.74
🔍

Investigation Exercise: The Meta-Analyst's Dilemma

आप 1993 में कोक्रेन समीक्षक हैं। आपको एमआई के लिए मैग्नीशियम पर साक्ष्य संश्लेषित करने के लिए कहा गया है। सात परीक्षणों का डेटा आपके सामने है।

क्या आप इस वन भूखंड में पैटर्न देखते हैं?

Pooled OR = 0.44 (95% CI: 0.27–0.71)
55% mortality reduction! Publish in the Lancet?

लेकिन रुकिए... क्या आपने परीक्षण आकारों के बारे में कुछ नोटिस किया है?

What should have given us pause?

1

Small sample sizes: Six of seven trials had <500 patients

2

Extreme effects: OR of 0.10 (90% reduction) is implausible for any drug

3

All positive: नकारात्मक परीक्षण कहाँ थे? फ़ाइल ड्रॉअर समस्या...

4

Funnel asymmetry: Small trials showed much larger effects than larger ones

🔍

फ़नल प्लॉट टेस्ट

पूल करने से पहले, हमें प्रकाशन पूर्वाग्रह की जाँच करनी चाहिए। आइए फ़नल प्लॉट की जाँच करें।

"और फिर सच सामने आया..."

The Fourth International Study of Infarct Survival (ISIS-4) enrolled 58,050 patients across 1,086 hospitals in 31 countries.

58,050
Patients
2,216
Deaths in Mg group
2,103
Deaths in placebo
OR = 1.06 (95% CI: 1.00–1.12)
No benefit. If anything, a trend toward harm.
📊

पहले और बाद में: पूरी तस्वीर

देखिए क्या होता है जब हम अपने वन भूखंड में मेगा-ट्रायल जोड़ते हैं...

BEFORE ISIS-4

7 small trials (N = 3,274)

OR = 0.44

Strong benefit signal

AFTER ISIS-4

8 trials (N = 61,324)

OR = 1.02

No effect

1

Publication Bias

Small negative trials were never published—they sat in file drawers

2

Small-Study Effects

Smaller trials tend to show larger effects due to methodological weaknesses

3

Random High Bias

संयोग से, कुछ छोटे परीक्षण चरम परिणाम देते हैं - और वे प्रकाशित हो जाते हैं

4

Random-Effects Amplification

Random-effects models give more weight to small trials, amplifying bias

Which model should you choose?

FIXED EFFECT MODEL

Assumes one true effect. Weights studies by inverse variance (precision). Large trials dominate.

Magnesium result: OR = 0.96 (p = 0.52)

RANDOM EFFECTS MODEL

Assumes distribution of effects. Gives more weight to small trials. Wider confidence intervals.

Magnesium result: OR = 0.59 (p = 0.01)

⚠️ मॉडल विकल्प ने निष्कर्ष निर्धारित किया!

यादृच्छिक प्रभाव पूर्वाग्रह को ठीक नहीं करता है; छोटे-अध्ययन प्रभावों के साथ, यह वजन को छोटे परीक्षणों की ओर स्थानांतरित कर सकता है और निष्कर्ष बदल सकता है।

1. एकत्रित अनुमान पर भरोसा करने से पहले प्रकाशन पूर्वाग्रह की जाँच करें। फ़नल प्लॉट और एगर का परीक्षण आपके उपकरण हैं।

2. Be wary of small-study effects. If only small trials show benefit, wait for a large, well-conducted trial.

3. Model choice matters. यादृच्छिक प्रभाव पक्षपातपूर्ण साक्ष्य को बढ़ा सकते हैं। दोनों मॉडलों पर विचार करें और निहितार्थों को समझें।

4. One large trial can overturn many small ones. यही कारण है कि ISIS-4 जैसे मेगा-परीक्षण इतने मूल्यवान हैं।

Researcher

सभी RCT मानक समानांतर-समूह डिज़ाइन का उपयोग नहीं करते हैं। परिणामों को पूल करते समय दो सामान्य विकल्पों को विशेष देखभाल की आवश्यकता होती है:

1

Cluster-Randomized Trials

समूहों (अस्पतालों, स्कूलों) को यादृच्छिक करें, व्यक्तियों को नहीं। design effect = 1 + (m−1) × ICC प्रभावी नमूना आकार को कम कर देता है। पूलिंग से पहले एन को डिज़ाइन प्रभाव से विभाजित करें, या परीक्षण से समायोजित एसई का उपयोग करें। क्लस्टरिंग को अनदेखा करने से कृत्रिम रूप से संकीर्ण सीआई उत्पन्न होते हैं।

2

Crossover Trials

प्रत्येक रोगी को दोनों उपचार प्राप्त होते हैं। युग्मित डिज़ाइन विचरण को कम करता है, लेकिन सही ढंग से पूल करने के लिए आपको within-patient correlation (या युग्मित विश्लेषण SE) की आवश्यकता होती है। समानांतर-समूह एसई का उपयोग रूढ़िवादी है; गलत एन डबल-काउंट वाले मरीजों का उपयोग करना।

विस्तृत सूत्रों और काम के उदाहरणों के लिए कोक्रेन हैंडबुक v6.4, अध्याय 23 देखें।

कहानी: प्रारंभिक सर्फेक्टेंट रिवर्सल

क्या होगा यदि आप अध्ययनों को संयोजित करने का तरीका यह निर्धारित करते हैं कि कोई उपचार जीवन रक्षक दिखता है या नहीं बेकार?

REAL DATA

समयपूर्व शिशुओं के लिए प्रारंभिक सर्फेक्टेंट को 6 small trials showing reduced mortality (RR 0.84). A fixed-effect meta-analysis confirmed benefit (p=0.04). But a random-effects model showed no significance (p=0.12) — the confidence interval crossed 1.0. Later, SUPPORT (2010) and VON (2012), two large pragmatic trials with ~2,000 neonates combined, found no benefit प्रारंभिक बनाम बाद के सर्फेक्टेंट द्वारा समर्थित किया गया था। छोटे परीक्षणों और गलत मॉडल के आधार पर नैदानिक ​​​​अभ्यास को बदल दिया गया था।

नियोनेटोलॉजिस्ट का मॉडल विकल्प: 2005
आप प्रारंभिक सर्फेक्टेंट की कोक्रेन समीक्षा अपडेट कर रहे हैं। छह छोटे परीक्षण एक निश्चित-प्रभाव मॉडल के साथ लाभ दिखाते हैं। यादृच्छिक-प्रभाव मॉडल महत्वहीन है। आप किसकी रिपोर्ट करते हैं?
PATH A: Report Fixed-Effect Only
Fixed-effect is significant. Report the positive result. Change practice.
NICUs adopt early surfactant. Later trials show no benefit. Practice reverses.
OUTCOME: Years of unnecessary intubation of premature infants
PATH B: Report Both Models
FE और RE परिणाम दिखाएं। ध्वजांकित करें कि महत्व मॉडल की पसंद पर निर्भर करता है। बड़े परीक्षणों के लिए कॉल करें।
Honest uncertainty. Large trials prioritized. True answer emerges faster.
OUTCOME: Premature babies spared unnecessary intervention
THE REVELATION
जब कोई निष्कर्ष इस आधार पर बदलता है कि आप निश्चित-प्रभाव या यादृच्छिक-प्रभाव का उपयोग करते हैं, तो निष्कर्ष नाजुक होता है। दोनों की रिपोर्ट करें. अनिश्चितता को स्वीकार करें. और याद रखें: छोटे परीक्षणों से एक नाजुक परिणाम अभ्यास को बदलने का आदेश नहीं है।

1. मैग्नीशियम मेटा-विश्लेषण ने वह लाभ क्यों दिखाया जो ISIS-4 को नहीं मिला?

A. ISIS-4 पद्धति त्रुटिपूर्ण थी
B. Calculation error in meta-analysis
C. Publication bias in small trials
D. LIMIT-2 कमजोर थी

2. What warning sign should have alerted reviewers to potential bias?

A. Asymmetric funnel plot (small trials showing larger effects)
B. Low heterogeneity (I² = 0%)
C. Strong biological plausibility
D. Too few trials to analyze

3. When publication bias is suspected, which model may amplify the bias?

A. Fixed effect model
B. Random effects model
C. Bayesian model
D. Network meta-analysis

Small trials can show false signals.

Large trials anchor the truth.

विषमता एक संदेश है, शोर नहीं।

विषमता एक संदेश है, शोर नहीं।

मॉड्यूल 8: विषमता

मॉड्यूल 8: विषमता (समझौता)

विषमता एक संदेश है, शोर नहीं।

ACCORD: 2008

जब औसत सच्चाई को छुपाता है।

🎯 Learning Objectives

  • I², τ², और भविष्यवाणी अंतराल की गणना और व्याख्या करें
  • Apply ICEMAN criteria to assess subgroup credibility
  • Distinguish between clinical, methodological, and statistical heterogeneity
  • Conduct and interpret leave-one-out sensitivity analyses
  • Explain how ACCORD revealed differential effects across subgroups

"आप सबसे चौंकाने वाले परीक्षण समाप्ति में से एक को देखने वाले हैं इतिहास..."

दशकों से, मधुमेह समुदाय का एक मार्गदर्शक सिद्धांत था: lower blood sugar is better। ऐतिहासिक डीसीसीटी (1993) और यूकेपीडीएस (1998) ने दिखाया कि गहन ग्लूकोज नियंत्रण से सूक्ष्म संवहनी जटिलताओं - अंधापन, गुर्दे की विफलता, तंत्रिका क्षति कम हो गई।

तार्किक एक्सट्रपलेशन:

If controlling glucose prevents complications, shouldn't intensive control prevent cardiovascular disease too?

The definitive test of intensive glucose control

10,251
Type 2 diabetics
HbA1c <6%
Intensive target
HbA1c 7-7.9%
Standard target

सभी रोगियों में उच्च हृदय जोखिम के साथ टाइप 2 मधुमेह था - या तो स्थापित हृदय रोग या कई जोखिम कारक। परीक्षण 5.6 वर्षों के लिए डिज़ाइन किया गया था।

February 6, 2008

डेटा सुरक्षा निगरानी बोर्ड एक आपातकालीन बैठक बुलाता है।

After 3.5 years, they make an unprecedented decision:

परीक्षण रोकें।

Outcome Intensive Standard HR (95% CI)
Primary CV endpoint 352 events 371 events 0.90 (0.78–1.04)
All-cause mortality 257 deaths 203 deaths 1.22 (1.01–1.46)
Severe hypoglycemia 10.5% 3.5% 3.0× higher
22% increase in mortality
54 excess deaths in the intensive arm
🔍

Investigation Exercise: The Clinician's Dilemma

आप 500 मधुमेह रोगियों के साथ एक एंडोक्रिनोलॉजिस्ट हैं। ACCORD परिणाम प्रकाशित किए गए हैं। आप अपने मरीज़ों को क्या कहते हैं जो HbA1c <6% के लिए प्रयास कर रहे हैं?

क्या गहन नियंत्रण सभी के लिए हानिकारक है? या केवल कुछ के लिए?

उपसमूह विश्लेषण से पता चला:

SubgroupIntensive HRInterpretation
No prior CVD1.00 (0.76–1.32)No effect
Prior CVD1.45 (1.15–1.84)Significant harm
Baseline HbA1c <8%1.02 (0.75–1.40)No effect
Baseline HbA1c ≥8%1.29 (1.03–1.60)Harm

The average effect masked critical heterogeneity!

स्थापित सीवीडी या खराब बेसलाइन नियंत्रण वाले रोगियों के लिए, गहन चिकित्सा हानिकारक थी।

जब अध्ययन (या उपसमूह) अलग-अलग प्रभाव दिखाते हैं, हमें इस भिन्नता को मापना चाहिए।

I² = 0–25%: कम विविधता। प्रभाव सभी अध्ययनों में सुसंगत हैं।

I² = 25–50%: Moderate. Look for sources of variation.

I² = 50–75%: Substantial. Consider whether pooling is appropriate.

I² = 75–100%: Considerable. A single pooled estimate may mislead.

लेकिन I² अकेले आपको यह नहीं बताता कि क्या करना है - यह संकेत देता है कि आपको आगे की जांच करने की आवश्यकता है।

जबकि I² आपको विषमता के कारण भिन्नता का अनुपात बताता है, τ² आपको परिमाण बताता है।

I² (percentage)

"कुल भिन्नता का कौन सा अंश अध्ययनों के बीच वास्तविक अंतर के कारण है?"

Scale: 0% to 100%

τ² (absolute)

"अध्ययनों के बीच वास्तविक प्रभाव कितने भिन्न होते हैं?"

Same scale as the effect measure

Use τ² to calculate prediction intervals

एक पूर्वानुमान अंतराल उन प्रभावों की सीमा दिखाता है जिनकी आप एक नए अध्ययन में अपेक्षा करते हैं - अक्सर आत्मविश्वास से कहीं अधिक व्यापक अंतराल।

📊

The Prediction Interval: What ACCORD Really Tells Us

Consider a meta-analysis of intensive glucose control across multiple trials...

Confidence Interval

HR 1.10 (0.95–1.27)

"औसत प्रभाव का हमारा सबसे अच्छा अनुमान"

Prediction Interval

HR 1.10 (0.70–1.73)

"The range of effects in a new setting"

भविष्यवाणी अंतराल लाभ और हानि दोनों को फैलाता है!

In some settings, intensive control might help. In others, it could kill.

Subgroup Credibility Criteria (adapted from ICEMAN, Schandelmaier 2020 & Sun 2012)

1

क्या उपसमूह विश्लेषण पूर्व-निर्दिष्ट था?

पोस्ट-हॉक उपसमूह डेटा के प्रति संवेदनशील होते हैं ड्रेजिंग

2

Is there a plausible biological rationale?

तंत्र स्पष्ट और डेटा से स्वतंत्र होना चाहिए

3

Is the effect consistent across related outcomes?

यदि मृत्यु दर के लिए नुकसान दिखाई देता है, तो क्या एमआई, स्ट्रोक के लिए समान नुकसान है?

4

Is there independent replication?

क्या अन्य अध्ययनों में उपसमूह प्रभाव की पुष्टि की गई है?

CriterionAssessmentScore
Pre-specified? हां-पूर्व सीवीडी में था प्रोटोकॉल
Biological rationale? Yes—hypoglycemia more dangerous with CVD
Consistent outcomes? Yes—CV mortality and all-cause mortality aligned
Independent replication? Partially—ADVANCE, VADT showed similar patterns ~

ICEMAN Rating: High Credibility

The differential harm in high-risk patients appears genuine.

बिना सीवीडी वाले रोगियों के लिए: Moderate glucose control (HbA1c ~7%) remains the goal. Intensive control may reduce microvascular complications.

स्थापित सीवीडी वाले रोगियों के लिए: Avoid intensive targets. Hypoglycemia is dangerous for damaged hearts.

बुजुर्ग रोगियों के लिए: Relaxed targets. Quality of life matters. Tight control causes falls, confusion, and excess mortality.

"One size fits all" treatment is not patient-centered medicine.

When heterogeneity is high, meta-regression can identify study-level covariates that explain variation.

THE QUESTION

क्या अध्ययन के साथ प्रभाव का आकार व्यवस्थित रूप से भिन्न होता है विशेषताएँ?

Covariates
Year, dose, duration, baseline risk, study quality
Output
Regression coefficient (slope), R², residual heterogeneity

Caution

मेटा-रिग्रेशन के लिए प्रति सहसंयोजक ≥10 अध्ययन की आवश्यकता होती है। कुछ अध्ययनों के साथ, यह केवल खोजपूर्ण है। पारिस्थितिक भ्रांति: अध्ययन स्तर के संबंध व्यक्तियों पर लागू नहीं हो सकते हैं।

Example: In ACCORD, meta-regression might test if treatment effect varies by baseline HbA1c, showing harm concentrated in patients with very high levels.

कहानी: स्प्रिंट रक्तचाप क्रांति

What number saves lives? Who decides?

REAL DATA

दशकों से, लक्ष्य था: रक्तचाप का इलाज करें <140 mmHg systolic. Then came SPRINT (2015): 9,361 high-risk patients randomized to intensive (<120) vs standard (<140) targets. Intensive treatment reduced CV events by 25% and death by 27%. Trial stopped early for benefit. Guidelines changed worldwide.

Before SPRINT: The Guidelines Committee
आप 2014 में रक्तचाप दिशानिर्देश निर्धारित कर रहे हैं। लक्ष्य वर्षों से <140 रहा है। क्या आपको बेहतर साक्ष्य की प्रतीक्षा करनी चाहिए?
PATH A: Maintain Status Quo
Keep <140 target (established practice, minimal controversy)
Guidelines unchanged. Physicians continue treating to <140.
OUTCOME: Miss opportunity to prevent deaths
PATH B: Fund the Definitive Trial
लक्ष्य अपडेट करने से पहले SPRINT परिणामों की प्रतीक्षा करें
SPRINT demonstrates benefit. Update target to <120 for high-risk patients.
OUTCOME: Estimated 100,000+ lives saved globally
JNC 7 (2003): <140
Years of uncertainty
SPRINT (2015): <उच्च जोखिम के लिए 120
THE REVELATION
"देखभाल का मानक" तय नहीं है। यह तब बदल जाता है जब परीक्षण धारणाओं को चुनौती देते हैं। एक दशक तक, मरीज़ों का उपचार कम किया गया होगा क्योंकि किसी ने भी स्पष्ट प्रश्न का परीक्षण नहीं किया।

1. ACCORD परीक्षण जल्दी क्यों रोक दिया गया?

A. Intensive control showed clear cardiovascular benefit
B. Intensive control increased mortality
C. नामांकन बहुत धीमा था
D. Budget ran out

2. What does a prediction interval tell us that a confidence interval doesn't?

A. The true effect is more precisely estimated
B. नमूना आकार पर्याप्त है
C. प्रभावों की सीमा जो हम एक नए अध्ययन में उम्मीद करेंगे
D. गणितीय सूत्र उपयोग किया गया

3. According to ICEMAN, which factor is MOST important for subgroup credibility?

A. उपसमूह परिकल्पना का पूर्व-विनिर्देश
B. Large sample size in the subgroup
C. Statistically significant p-value
D. Multiple outcomes showing same direction

जब अध्ययन असहमत हों,

असहमति को सुनें।

विषमता एक संदेश है, शोर नहीं।

साक्ष्य का अभाव अनुपस्थिति का साक्ष्य नहीं है।

मॉड्यूल 9: द हिडन स्टडीज

मॉड्यूल 9: द हिडन स्टडीज (रीबॉक्सेटिन)

साक्ष्य का अभाव अनुपस्थिति का साक्ष्य नहीं है।

Reboxetine: 2010

74% जिन्होंने कभी प्रकाश नहीं देखा।

🎯 Learning Objectives

  • Interpret funnel plots for asymmetry detection
  • एगर का परीक्षण लागू करें और प्रकाशन पूर्वाग्रह के लिए अन्य सांख्यिकीय परीक्षण
  • पूर्वाग्रह समायोजन के लिए ट्रिम-एंड-फिल विधि लागू करें
  • Critically appraise the limitations of publication bias tests
  • सिद्धांत लागू करें: "साक्ष्य की अनुपस्थिति अनुपस्थिति का प्रमाण नहीं है"

"A new hope for depression patients who cannot tolerate SSRIs..."

रेबॉक्सेटिन (एड्रोनैक्स) एक नया एंटीडिप्रेसेंट था - एक चयनात्मक नॉरपेनेफ्रिन रीपटेक अवरोधक (एनआरआई)। एसएसआरआई के विपरीत, इसने एक अलग न्यूरोट्रांसमीटर प्रणाली को लक्षित किया। उन रोगियों के लिए जो फ्लुओक्सेटीन या सेराट्रलाइन को बर्दाश्त नहीं कर सके या विफल हो गए, इसने एक नई तंत्र की पेशकश की।

1997
EU approval
50+
Countries approved
Millions
Prescriptions written

What doctors could find in medical journals:

ComparisonPublished TrialsPublished Result
Reboxetine vs Placebo 3 trials (n=507) Significantly better (SMD = 0.56)
Reboxetine vs SSRIs 4 trials (n=628) Equivalent or better

प्रकाशित साहित्य ने एक स्पष्ट कहानी बताई:

Reboxetine works. Patients benefit. Prescribe with confidence.

लेकिन उन परीक्षणों के बारे में क्या जो आप नहीं कर सके देखें?

In 2010, German researchers at IQWiG made a request to the European Medicines Agency...

They demanded access to all परीक्षण डेटा-प्रकाशित और अप्रकाशित।

What they found changed everything.

Eyding et al., BMJ 2010

ComparisonPublished OnlyALL DATA
Reboxetine vs Placebo SMD 0.56 (benefit) SMD 0.10 (no benefit)
Patients in analysis 507 (14%) 2,731 (100%)
Reboxetine vs SSRIs Equivalent निचला (नुकसान के लिए आरआर 1.23)
Patients in analysis 628 (26%) 2,411 (100%)
74% रोगी डेटा कभी नहीं था प्रकाशित
छिपे हुए परीक्षणों से कोई लाभ नहीं हुआ और हानि अधिक हुई
🔍

Investigation Exercise: The File Drawer

आप 2008 में एक व्यवस्थित समीक्षक हैं। आप सभी रीबॉक्सेटीन परीक्षणों के लिए पबमेड, एम्बेस और कोक्रेन लाइब्रेरी खोजते हैं। आपको लाभ दिखाने वाले 7 प्रकाशित परीक्षण मिले।

क्या आप इस साक्ष्य पर भरोसा कर सकते हैं?

⚠️ फ़नल अत्यधिक असममित है!

सभी प्रकाशित अध्ययन एक तरफ हैं। अशक्त और नकारात्मक परीक्षण कहां हैं?

1

Funnel Plot

Plot effect size vs. standard error. A symmetric funnel suggests no bias; asymmetry raises alarms.

2

Egger's Regression Test

Regress effect/SE on 1/SE. A non-zero intercept (P < 0.10) suggests small-study effects. Note: inflated false-positive rate with binary outcomes; use Peters' test instead.

3

Peters' Test

For binary outcomes, regresses log OR on inverse of total sample size. Less prone to false positives.

4

Trim-and-Fill

फ़नल को सममित बनाने के लिए "लापता" अध्ययनों को लागू करता है, फिर एकत्रित प्रभाव की पुनर्गणना करता है।

📊

इंटरएक्टिव: ट्रिम-एंड-फिल विश्लेषण

आइए रीबॉक्सेटीन डेटा पर ट्रिम-एंड-फिल लागू करें और देखें कि समायोजित अनुमान क्या होगा...

Published Only

7 trials

SMD = 0.56

Significant benefit

Trim-and-Fill

7 + 5 imputed = 12 trials

SMD = 0.23

Reduced, still nominally significant

But even trim-and-fill underestimated the problem!

सभी डेटा के साथ वास्तविक प्रभाव SMD = 0.10 (अनिवार्य रूप से शून्य) था।
Trim-and-fill is conservative—it doesn't fully correct for selective publication.

प्रकाशन पूर्वाग्रह का पता लगाने के तरीके अपूर्ण हैं। वास्तविक समाधान है prospective registration.

ClinicalTrials.gov
US registry (2000)
WHO ICTRP
Global portal
PROSPERO
Review registration

परीक्षणों की खोज करते समय, हमेशा रजिस्ट्रियों की जांच करें। registered परीक्षणों की संख्या की तुलना संख्या publishedसे करें। अंतर आपका चेतावनी संकेत है।

Since 2005, ICMJE requires trial registration as a condition of publication.

"All trials registered. All results reported."

रेबॉक्सेटिन घोटाले ने, अन्य दवाओं में इसी तरह के मामलों के साथ, एक वैश्विक आंदोलन को उत्प्रेरित किया:

2013: ईएमए क्लिनिकल डेटा नीति

European Medicines Agency commits to publishing clinical study reports

2016: FDA Amendments Act enforcement

Mandatory results reporting on ClinicalTrials.gov within 12 months

AllTrials Coalition

Over 90,000 supporters, 700+ organizations demanding transparency

!

Germany's IQWiG recommended against reboxetine for depression

!

ब्रिटेन के NICE ने इसे डाउनग्रेड करके "अनुशंसित नहीं" कर दिया

!

FDA ने 2001 में रीबॉक्सेटीन को अस्वीकार कर दिया था (उनके पास अप्रकाशित डेटा तक पहुंच थी)

एक दशक से अधिक समय तक, मरीजों को इससे बेहतर कोई दवा नहीं मिली प्लेसबो।

क्योंकि केवल सकारात्मक परीक्षण प्रकाशित हुए थे।

कहानी: पैरॉक्सिटाइन अध्ययन 329 धोखा

क्या होगा यदि प्रकाशित निष्कर्ष वास्तविक डेटा के विपरीत है?

REAL DATA

ग्लैक्सोस्मिथक्लाइन अध्ययन 329 में पेरॉक्सेटिन का परीक्षण किया गया adolescent depression. प्रकाशित पेपर (2001) ने निष्कर्ष निकाला कि पैरॉक्सिटिन था "generally well tolerated and effective." वास्तविक डेटा: पैरॉक्सिटाइन failed on all 8 pre-specified outcomes. When re-analyzed (RIAT 2015), suicidal/self-harm events: पेरॉक्सेटिन समूह में 23 बनाम प्लेसीबो पर 5. प्रकाशित पेपर ने महत्व बढ़ाने के लिए पोस्ट-हॉक परिणामों को फिर से परिभाषित किया। 2015 में, एक RIAT (अदृश्य और परित्यक्त परीक्षणों को पुनर्स्थापित करना) का उपयोग करके पुनः विश्लेषण किया गया मूल नैदानिक ​​अध्ययन रिपोर्ट निष्कर्ष निकाला गया: पेरॉक्सेटिन था neither safe nor effective for adolescents.

द प्रिस्क्राइबर्स पज़ल: 2003
आप एक बाल मनोचिकित्सक हैं. अध्ययन 329 - एकमात्र बड़ा परीक्षण - कहता है कि पैरॉक्सिटिन किशोरों में काम करता है। लेकिन एफडीए ने किशोरों के लिए इसे मंजूरी नहीं दी है। एक अभिभावक आपसे इसे लिखने के लिए कहता है। आप क्या करते हैं?
पथ ए: प्रकाशन पर भरोसा करें
A peer-reviewed JAACAP paper says it works. Prescribe off-label.
Millions of prescriptions worldwide. Suicidal events in adolescents.
OUTCOME: FDA issues black box warning for SSRIs in youth (2004)
PATH B: Check the Trial Registry
मूल समापन बिंदुओं के लिए क्लिनिकल ट्रायल्स.जीओवी खोजें। ध्यान दें कि प्रकाशित परिणाम पंजीकृत प्रोटोकॉल से मेल नहीं खाते हैं।
लाल झंडा: परिणाम परिवर्तन का पता चला। आप दवा रोक दें. मरीज़ सुरक्षित है.
OUTCOME: Publication bias identified before harm
THE REVELATION
प्रकाशन पूर्वाग्रह केवल पढ़ाई छूट जाने के बारे में नहीं है। यह प्रकाशित अध्ययनों में गायब सत्य के बारे में है। परिणाम स्विचिंग, भूत-लेखन और चयनात्मक रिपोर्टिंग एक असफल परीक्षण को एक विपणन उपकरण में बदल सकती है। हमेशा प्रकाशित परिणामों की तुलना ट्रायल रजिस्ट्री प्रोटोकॉल से करें।

1. प्रकाशित साहित्य से रिबॉक्सेटिन परीक्षण डेटा का कितना प्रतिशत छिपाया गया था?

A. 25%
B. 50%
C. 74%
D. 90%

2. Why can trim-and-fill underestimate the correction needed?

A. It assumes effects are normally distributed
B. यह केवल समरूपता प्राप्त करने के लिए अध्ययन का आरोप लगाता है, जो वास्तविकता को पूरी तरह से प्रतिबिंबित नहीं कर सकता है
C. इसके लिए कम से कम 20 अध्ययनों की आवश्यकता है
D. यह केवल बहुत बड़े अध्ययनों के साथ काम करता है

3. What is the best prospective defense against publication bias?

A. Funnel plots in all meta-analyses
B. Egger's test before pooling
C. Prospective trial registration
D. More medical journals

जो आप नहीं देख सकते

may be more important than what you can.

साक्ष्य का अभाव अनुपस्थिति का साक्ष्य नहीं है।

Certainty must be earned, not assumed.

मॉड्यूल 10: निश्चितता

मॉड्यूल 10: निश्चितता (प्रारंभिक सर्फेक्टेंट)

Certainty must be earned, not assumed.

Early Surfactant: 2012

जब उच्च गुणवत्ता वाले साक्ष्य विकसित होते हैं।

🎯 Learning Objectives

  • साक्ष्य की निश्चितता का आकलन करने के लिए संपूर्ण ग्रेड ढांचा लागू करें
  • Evaluate all five downgrade factors (RoB, inconsistency, indirectness, imprecision, publication bias)
  • Identify when to upgrade for large effect, dose-response, or confounding
  • Construct Summary of Findings tables with absolute effect estimates
  • सिद्धांत लागू करें: "निश्चितता अर्जित की जानी चाहिए, ग्रहण नहीं की जानी चाहिए"

"A revolution in neonatal care..."

रेस्पिरेटरी डिस्ट्रेस सिंड्रोम (आरडीएस) समय से पहले शिशुओं में मृत्यु का प्रमुख कारण था। बहिर्जात का विकास surfactant- वह पदार्थ जो एल्वियोली को टूटने से बचाता है - नवजात चिकित्सा में महान प्रगतियों में से एक था।

प्रश्न यह बन गया: हमें सर्फेक्टेंट कब देना चाहिए?

Prophylactically (to all high-risk infants) or selectively (only after RDS develops)?

Multiple RCTs conducted before the era of routine CPAP

OutcomeProphylactic vs SelectiveCertainty
Neonatal mortality RR 0.73 (favors prophylactic) High
BPD or death RR 0.84 (favors prophylactic) High
Recommendation: Give surfactant prophylactically
Guidelines worldwide adopted this approach

लेकिन नवजात देखभाल की दुनिया बदल रही थी...

A new technology emerged: Continuous Positive Airway Pressure (CPAP)

Non-invasive support that could help preterm lungs without intubation.

क्या पुराने साक्ष्य अब भी लागू होंगे?

New trials conducted in the CPAP era

OutcomeOld TrialsNew Trials
BPD or death RR 0.84 (favors prophylactic) RR 1.12 (favors selective)
यांत्रिक वेंटिलेशन की आवश्यकता रोगनिरोधी के साथ कम रोगनिरोधी के साथ उच्चतर!
Complete Reversal
In the CPAP era, prophylactic surfactant causes more harm
🔍

Investigation: Why Did Evidence Evolve?

आप एक नियोनेटोलॉजिस्ट हैं. एक सहकर्मी पूछता है: "यादृच्छिक परीक्षण एक-दूसरे का खंडन कैसे कर सकते हैं?"

क्या मूल साक्ष्य गलत थे?

1

Indirectness Changed

Old trials: No CPAP available. New trials: CPAP standard of care.

2

तुलनित्र में सुधार हुआ

Selective surfactant + CPAP is better than prophylactic intubation.

3

Context Matters

एक युग के साक्ष्य दूसरे युग पर लागू नहीं हो सकते।

This is why GRADE assesses Indirectness!

High-quality evidence can become inapplicable when context changes.

Grading of Recommendations, Assessment, Development and Evaluations

ग्रेड प्रश्न का उत्तर देता है: हम इस अनुमान को लेकर कितने आश्वस्त हैं?

⊕⊕⊕⊕ HIGH: Very confident. True effect is close to the estimate.

⊕⊕⊕◯ MODERATE: Moderately confident. True effect likely close, but may differ substantially.

⊕⊕◯◯ LOW: Limited confidence. True effect may differ substantially.

⊕◯◯◯ VERY LOW: Very little confidence. True effect likely substantially different.

आरसीटी साक्ष्य उच्च से शुरू होता है। इसे निम्न के लिए डाउनग्रेड किया जा सकता है:

1

Risk of Bias

Flawed randomization, lack of blinding, incomplete follow-up, selective reporting

2

Inconsistency

Unexplained heterogeneity across studies (large I², non-overlapping CIs)

3

Indirectness

जनसंख्या में अंतर, हस्तक्षेप, तुलनित्र, या प्रश्न से परिणाम

4

Imprecision

Wide confidence intervals, small sample size, few events

5

Publication Bias

Asymmetric funnel plot, missing registered trials, sponsor influence

Each factor can downgrade by one or two levels

High → Moderate → Low → Very Low

Example: पूर्वाग्रह (↓1) और गंभीर अप्रत्यक्षता के उच्च जोखिम के साथ आरसीटी का एक मेटा-विश्लेषण (उच्च से शुरू होता है) (↓1) रेटिंग दी जाएगी LOW.

📊

Interactive: Apply GRADE to Surfactant

आइए पुराने बनाम नए परीक्षणों का उपयोग करके रोगनिरोधी सर्फेक्टेंट के लिए साक्ष्य की निश्चितता का मूल्यांकन करें।

OLD TRIALS (Pre-CPAP)

Starting: HIGH (RCTs)

Risk of Bias: Low (−0)

Inconsistency: None (−0)

Indirectness: Serious (−1)

Different standard of care today

Final: ⊕⊕⊕◯ MODERATE

NEW TRIALS (CPAP Era)

Starting: HIGH (RCTs)

Risk of Bias: Low (−0)

Inconsistency: None (−0)

Indirectness: None (−0)

Matches current practice

Final: ⊕⊕⊕⊕ HIGH

अवलोकन संबंधी साक्ष्य कम से शुरू होते हैं। इसे इसके लिए अपग्रेड किया जा सकता है:

+1

Large Magnitude of Effect

RR >2 या <0.5 बिना किसी संभावित भ्रम के

+1

Dose-Response Gradient

Higher exposure = larger effect in a consistent pattern

+1

Residual Confounding

All plausible confounders would reduce the effect (strengthens causal inference)

GRADE requires transparent language about confidence:

HIGH: "Prophylactic surfactant reduces mortality..."

MODERATE: "Prophylactic surfactant probably reduces mortality..."

LOW: "Prophylactic surfactant may reduce mortality..."

VERY LOW: "We are uncertain whether prophylactic surfactant reduces mortality..."

यह भाषा सुनिश्चित करती है कि चिकित्सक साक्ष्य की ताकत को समझें।

कहानी: समय से पहले बच्चे को ऑक्सीजन विरोधाभास

Can too much of a lifesaver become a killer?

REAL DATA

1940s-50s: High oxygen concentrations saved premature babies from respiratory failure. Then came an epidemic of blindness—retrolental fibroplasia (now called ROP). Doctors reduced oxygen dramatically. Blindness dropped. But then: increased deaths and brain damage से हाइपोक्सिया। आवश्यक इष्टतम ऑक्सीजन स्तर decades of trials to find. Recent SUPPORT/BOOST II trials finally defined the therapeutic window: SpO2 91-95%.

नियोनेटोलॉजिस्ट की दुविधा: 1955
आप एक नियोनेटोलॉजिस्ट हैं। उच्च ऑक्सीजन पर समय से पहले जन्मे बच्चे अंधे हो रहे हैं। आप क्या करते हैं?
PATH A: Dramatic Reduction
Drastically reduce oxygen to prevent blindness
Blindness rates drop. But some babies die or suffer brain damage from hypoxia.
OUTCOME: Trading one harm for another
पथ बी: व्यवस्थित अध्ययन
सावधानीपूर्वक ऑक्सीजन का अनुमापन करें, खुराक-प्रतिक्रिया संबंध का अध्ययन करें
Takes decades but eventually identifies the optimal range.
OUTCOME: Optimize both survival and vision
1940s: High O2 saves lives
1950s: Blindness epidemic
1960-70 के दशक: कम O2 से मौतें
2010s: SUPPORT/BOOST define optimal range
THE REVELATION
प्रत्येक हस्तक्षेप में एक चिकित्सीय खिड़की होती है। इसे खोजने के लिए माप की आवश्यकता है, अनुमान की नहीं। साक्ष्य द्वारा संतुलन को परिभाषित करने से पहले पेंडुलम 60 वर्षों तक घूमता रहा।

1. 2003 और 2012 के बीच सर्फैक्टेंट की सिफारिश उलट क्यों गई?

A. मूल परीक्षण फर्जी थे
B. CPAP changed the comparator (indirectness)
C. Not enough patients in original trials
D. परिणाम अलग तरीके से मापा गया था

2। निम्नलिखित में से कौन सा ग्रेड डाउनग्रेड कारक नहीं है?

A. Risk of bias
B. Imprecision
C. Publication bias
D. Large magnitude of effect

3. कम निश्चितता वाले साक्ष्य के लिए किस भाषा का उपयोग किया जाना चाहिए?

A. "हस्तक्षेप कम हो जाता है..."
B. "हस्तक्षेप शायद कम हो जाता है..."
C. "हस्तक्षेप कम हो सकता है..."
D. "हम अनिश्चित हैं क्या..."

एक संख्या पर्याप्त नहीं है।

आपको बताना होगा कि आप कितने निश्चित हैं।

Certainty must be earned, not assumed.

तरीके मरीज़ों को हमारे आत्मविश्वास से बचाते हैं।

मॉड्यूल 11: द लिविंग रिव्यू

मॉड्यूल 11: द लिविंग रिव्यू (कोविड-19)

तरीके मरीज़ों को हमारे आत्मविश्वास से बचाते हैं।

COVID-19 Hydroxychloroquine: 2020

जब तात्कालिकता साक्ष्य से मिलती है।

🎯 Learning Objectives

  • यह निर्धारित करने के लिए परीक्षण अनुक्रमिक विश्लेषण लागू करें कि साक्ष्य पर्याप्त है
  • एक जीवित व्यवस्थित समीक्षा डिजाइन और बनाए रखें
  • Establish update triggers and futility/harm boundaries
  • Manage multiplicity and alpha-spending in sequential analyses
  • Explain how rapid evidence synthesis evolved during COVID-19

"वायरस हमारी तुलना में तेजी से फैलता है समझ..."

कोविड-19 हजारों लोगों की जान ले रहा था। आईसीयू ओवरफ्लो हो गए. न कोई टीका था, न कोई इलाज. फिर आशा की एक किरण: hydroxychloroquine (HCQ)—an old malaria drug—showed antiviral activity in lab studies.

March 20
गौट्रेट अध्ययन (फ्रांस)
36 pts
Non-randomized
Viral
Clearance improved

गौट्रेट अध्ययन के कुछ हफ्तों के भीतर:

!

March 28: FDA issues Emergency Use Authorization for HCQ

!

April 4: India bans HCQ export (hoarding fears)

!

Global: Shortages affect lupus and rheumatoid arthritis patients

Millions received HCQ based on a 36-patient observational study

What could go wrong?

🔍

जांच: गौट्रेट अध्ययन

आप एक ईबीएम विशेषज्ञ हैं जिन्हें फ्रेंच एचसीक्यू अध्ययन का मूल्यांकन करने के लिए कहा गया है। डिज़ाइन की जांच करें...

IssueImpact
Non-randomizedSelection bias—who got HCQ?
6 patients excluded3 went to ICU, 1 died, 1 withdrew, 1 had nausea
Surrogate outcomeViral load, not clinical outcomes
विभिन्न अस्पताल से नियंत्रणDifferent care, different testing
No blindingExpectation bias in lab testing

यह अध्ययन आरओबी 2.0 पर पूर्वाग्रह के उच्च जोखिम का आकलन करेगा

GRADE certainty: VERY LOW. Yet it changed global policy.

1

Immortal Time Bias

Patients must survive long enough to receive treatment. Survivors are compared to non-survivors.

2

Confounding by Indication

Sicker patients may get different treatments. Healthier patients received HCQ early.

3

Healthy User Effect

Patients who seek treatment tend to be healthier overall.

4

Outcome Reporting

सकारात्मक परिणामों वाले अध्ययन तेजी से प्रकाशित हुए।

Large, rigorous trials completed at remarkable speed

TrialNResult
RECOVERY (UK) 4,716 No benefit on mortality (RR 1.09)
WHO SOLIDARITY 954 No benefit (RR 1.19)
ORCHID (US) 479 व्यर्थता के लिए रुका
HCQ provided no benefit—and may have caused harm
June 15, 2020: FDA revokes Emergency Use Authorization
📊

समयरेखा: अवलोकन बनाम आरसीटी साक्ष्य

March-May 2020

Observational: ~20 studies

Suggest benefit

Pooled OR ~0.65

June-July 2020

RCTs: RECOVERY, SOLIDARITY

Show no benefit/harm

Pooled RR ~1.10

3 महीने में "वादा करने वाले" से "अप्रभावी" तक

यही कारण है कि हमें उभरते साक्ष्यों को ट्रैक करने के लिए यादृच्छिकीकरण और जीवंत समीक्षाओं की आवश्यकता है।

तेजी से विकसित हो रहे साक्ष्य के लिए एक नया दृष्टिकोण:

1

Continuous Surveillance

नए सबूतों के लिए साप्ताहिक या दैनिक रूप से साहित्य खोजें

2

Cumulative Meta-Analysis

Update pooled estimates as each new trial reports

3

परीक्षण अनुक्रमिक विश्लेषण (TSA)

Determine when sufficient information has accumulated to conclude

4

Transparent Versioning

Track every change, maintain full audit trail

When have we learned enough?

टीएसए मेटा-विश्लेषण के लिए सीमाओं को रोकना लागू करता है - एकल परीक्षण में अंतरिम विश्लेषण के समान। इसका हिसाब है required information size (RIS) needed to detect or exclude a clinically meaningful effect.

RIS
Required sample size
α-spending
Controls type I error
Boundaries
Benefit / Harm / Futility

कोविड में एचसीक्यू के लिए, टीएसए ने दिखाया कि जून 2020 तक निरर्थकता सीमा पार कर ली गई थी।

1. Observational studies can mislead spectacularly जब पूर्वाग्रह प्रचलित हो. यहां तक ​​कि एक ही दिशा की ओर इशारा करने वाले कई अध्ययन भी गलत हो सकते हैं।

2. RCTs can be conducted quickly when the will exists. RECOVERY enrolled 5,000+ patients in weeks.

3. सजीव समीक्षाएँ आवश्यक हैं for evolving topics. Fixed-point-in-time reviews become obsolete instantly.

4. Political pressure doesn't change biology. दबाव में होने पर भी कठोर तरीके मरीजों की रक्षा करते हैं।

कहानी: छलांग मूंगफली एलर्जी क्रांति

यदि रोकथाम ही कारण हो तो क्या होगा?

REAL DATA

For decades, pediatric guidelines recommended: avoid peanuts in infancy to prevent allergy. Meanwhile, peanut allergy rates tripled 1997 से 2008 तक. फिर आया LEAP (2015): 640 high-risk infants randomized to early peanut introduction vs. avoidance. Result: Early introduction reduced peanut allergy by 81% (1.9% बनाम 13.7%)। रोकथाम की रणनीति महामारी का कारण बन रही थी।

द एलर्जिस्ट्स क्रॉसरोड्स: 2010
आप बाल रोग विशेषज्ञ हैं. परहेज दिशानिर्देशों के बावजूद मूंगफली एलर्जी बढ़ रही है। क्या आप हठधर्मिता पर सवाल उठाते हैं?
PATH A: Follow Guidelines
Continue recommending peanut avoidance in high-risk infants
Guidelines are "evidence-based." Safe to follow consensus.
OUTCOME: Peanut allergies continue to rise
पथ बी: हठधर्मिता पर सवाल उठाएं
Design a trial to test if early introduction might be protective
LEAP trial reveals the truth. Guidelines reverse worldwide.
OUTCOME: Prevent an epidemic
2000: AAP recommends avoidance
2008: Allergy rates triple
2015: लीप ने सबूतों को उलट दिया
2017: Guidelines flip to early introduction
THE REVELATION
"सबसे पहले, कोई नुकसान न करें" के लिए साक्ष्य की आवश्यकता है। धारणाएँ, यहाँ तक कि नेक इरादे वाली भी, बड़े पैमाने पर नुकसान पहुँचा सकती हैं। प्रतिरक्षा प्रणाली को सहनशीलता विकसित करने के लिए जोखिम की आवश्यकता थी - बचाव ने संवेदनशीलता पैदा की।

1. गौट्रेट हाइड्रोक्सीक्लोरोक्वीन अध्ययन में मुख्य दोष क्या था?

A. Too few patients
B. No blinding
C. Excluding patients who deteriorated
D. Too short follow-up

2. What does Trial Sequential Analysis help determine?

A. Which studies have high risk of bias
B. When enough evidence has accumulated
C. विविधता की डिग्री
D. Which treatment is best

3. अवलोकन संबंधी कोविड अध्ययनों में एचसीक्यू से लाभ क्यों दिखा जबकि आरसीटी से लाभ नहीं हुआ?

A. RCTs enrolled sicker patients
B. RCTs used different outcomes
C. अवलोकन संबंधी अध्ययनों में पूर्वाग्रह
D. अवलोकन संबंधी अध्ययनों में बेहतर डेटा था

Speed cannot replace rigor.

But rigor can be fast.

Living reviews balance both.

प्रत्येक संकेत सत्य नहीं है।

मॉड्यूल 12: उन्नत तरीके

मॉड्यूल 12: उन्नत तरीके

प्रत्येक संकेत सत्य नहीं है।

Advanced Methods

Beyond pairwise meta-analysis.

🎯 Learning Objectives

  • Interpret network meta-analysis geometry and SUCRA rankings
  • Apply bivariate models for diagnostic test accuracy meta-analysis
  • Conduct dose-response meta-analysis with flexible splines
  • Understand when individual patient data (IPD) meta-analysis is needed
  • प्रत्येक उन्नत पद्धति की मान्यताओं और सीमाओं को पहचानें

"कभी-कभी प्रश्न ए बनाम बी से भी अधिक जटिल होता है..."

आपके द्वारा सीखी गई विधियाँ नींव बनाती हैं। लेकिन नैदानिक ​​वास्तविकता अक्सर अधिक मांग करती है: Which of 10 antidepressants is best? What's the optimal dose of statin? Does this test accurately diagnose early cancer?

यह मॉड्यूल चार उन्नत तरीकों का परिचय देता है - प्रत्येक अलग-अलग जटिल प्रश्नों का उत्तर देता है।

When you have many treatments but few head-to-head trials

NMA combines direct evidence (A vs B) with indirect evidence (A vs C, B vs C → inferred A vs B) to compare multiple treatments simultaneously.

SUCRA
Ranking probabilities, not effect size
Consistency
Direct = Indirect?
Networks
Visualize evidence
🔍

NMA Example: Antidepressants

The landmark Cipriani 2018 NMA compared 21 antidepressants using 522 trials.

The Challenge

21 drugs, but not every pair tested head-to-head

Many vs. placebo, few vs. each other

The Solution

NMA पूरे नेटवर्क में प्रत्यक्ष और अप्रत्यक्ष साक्ष्य को जोड़ता है

प्रभावकारिता और स्वीकार्यता के लिए सभी को 21वां स्थान दिया गया है

परिणाम: कुछ दवाओं को प्रभावकारिता के लिए उच्च स्थान दिया गया है, अन्य को स्वीकार्यता के लिए।

कोई भी एक दवा सार्वभौमिक रूप से "सर्वश्रेष्ठ" नहीं है; विश्वसनीय अंतराल, परिवर्तनशीलता और क्लिनिकल ट्रेड-ऑफ के साथ रैंकिंग की व्याख्या करें।

1

Transitivity

Effect modifiers should be similarly distributed across comparisons; otherwise indirect comparisons may be biased

2

Consistency

प्रत्यक्ष और अप्रत्यक्ष साक्ष्य सहमत (परीक्षण योग्य)

3

Connected Network

All treatments linked through at least one common comparator

When assumptions fail, NMA can mislead

हमेशा परिवर्तनशीलता का आकलन करें और असंगतता का परीक्षण करें।

इष्टतम खुराक ढूँढना

Uses the Greenland-Longnecker method खुराक और प्रभाव के बीच गैर-रैखिक संबंधों को मॉडल करने के लिए प्रतिबंधित क्यूबिक स्प्लिन के साथ।

1

Non-linear patterns

J-shaped (alcohol & mortality), U-shaped (vitamin D), threshold (aspirin)

2

Clinical relevance

सर्वोत्तम लाभ-हानि संतुलन के साथ खुराक ढूंढें, न कि केवल "अधिक बेहतर है"

उपसमूह के लिए स्वर्ण मानक विश्लेषण

Instead of published summary data, obtain परीक्षणकर्ताओं से कच्चा रोगी-स्तर डेटा । सटीक उपसमूह विश्लेषण, समय-दर-घटना मॉडलिंग और मानकीकृत परिभाषाओं को सक्षम करता है।

One-Stage
Single hierarchical model (not mega-trial)
Two-Stage
Analyze, then pool
80%+ target
डेटा उपलब्धता लक्ष्य

प्रारंभिक स्तन कैंसर परीक्षणकर्ताओं के सहयोगी समूह ने 1980 के दशक में आईपीडी एमए का बीड़ा उठाया।

जब "हस्तक्षेप" एक है परीक्षण

DTA meta-analysis synthesizes sensitivity (सच्ची सकारात्मक दर) और specificity (true negative rate)—two correlated outcomes requiring bivariate models.

1

Bivariate/HSROC Model

संवेदनशीलता और विशिष्टता के बीच सहसंबंध के लिए खाते

2

SROC Curve

95% आत्मविश्वास और भविष्यवाणी क्षेत्रों के साथ सारांश आरओसी वक्र

3

QUADAS-2

Quality Assessment of Diagnostic Accuracy Studies

QuestionMethod
Does A beat B?Pairwise MA
Which of many treatments is best?Network MA (NMA)
इष्टतम खुराक क्या है?Dose-Response MA
Who benefits most? (subgroups)IPD MA
यह परीक्षण कितना सटीक है?DTA MA
समय के साथ प्रभाव कैसे विकसित होता है?Survival/Time-to-Event MA

विधि को प्रश्न से मेल खाना चाहिए। कभी भी किसी प्रश्न को गलत तरीके से न थोपें।

कहानी: सेप्सिस सागा में स्टेरॉयड

Three large trials. Three different answers. What do you believe?

REAL DATA

CORTICUS (2008): 499 patients. Hydrocortisone in septic shock. No mortality benefit. ADRENAL (2018): 3,658 patients. Hydrocortisone. No mortality benefit. APROCCHSS (2018): 1,241 patients. Hydrocortisone + fludrocortisone. Mortality reduced (43% vs 49.1%, p=0.03). Same class of intervention. Different protocols. Different results.

दिशानिर्देश लेखक की चुनौती
आप सेप्सिस दिशानिर्देश लिख रहे हैं। तीन प्रमुख परीक्षण असहमत हैं। आप कैसे अनुशंसा करते हैं?
PATH A: Simple Average
Pool all three trials. Overall effect uncertain. Conclude "evidence unclear."
Guidelines say steroids are optional. No strong recommendation.
OUTCOME: Clinicians left without clear guidance
PATH B: Investigate Heterogeneity
Analyze why APROCCHSS differed (fludrocortisone, longer duration, different population)
पहचानें कि प्रभावी प्रोटोकॉल अप्रभावी प्रोटोकॉल से भिन्न है।
OUTCOME: Recommend the specific effective protocol
THE REVELATION
परस्पर विरोधी परीक्षण विफलताएं नहीं हैं। वे इस बात के मानचित्र हैं कि उपचार कहाँ काम करता है और कहाँ नहीं। परीक्षणों के बीच अंतर - खुराक, अवधि, सह-हस्तक्षेप, जनसंख्या - समझने की कुंजी है।

1. जोड़ीवार की तुलना में नेटवर्क मेटा-विश्लेषण का मुख्य लाभ क्या है?

A. इसमें डेटा निष्कर्षण की आवश्यकता नहीं है
B. It compares treatments not directly tested against each other
C. यह पूर्वाग्रह मूल्यांकन के जोखिम की आवश्यकता को समाप्त करता है
D. It produces better forest plots

2. Why does DTA meta-analysis require bivariate models?

A. To handle more than two studies
B. प्रकाशन पूर्वाग्रह के लिए समायोजन करने के लिए
C. संवेदनशीलता और विशिष्टता हैं सहसंबद्ध
D. To generate forest plots

3. What does the "consistency" assumption in NMA require?

A. All studies must be high quality
B. प्रत्यक्ष और अप्रत्यक्ष साक्ष्य सहमत होने चाहिए
C. Sample sizes must be similar
D. No missing studies
Methodologist

यह पाठ्यक्रम पूर्ण व्यवस्थित समीक्षा वर्कफ़्लो को कवर करता है। गहराई से जानने के लिए, साथी पाठ्यक्रमों का अन्वेषण करें:

DTA Course
Bivariate/HSROC, SROC curves, QUADAS-2
Risk of Bias Mastery
RoB 2, ROBINS-I/E, domain-level assessment
GRADE Certainty
Full SoF tables, GRADE-CERQual
IPD Meta-Analysis
One-stage/two-stage, mixed-effects models
Publication Bias Detective
Copas, PET-PEESE, p-curve, selection models
Umbrella Reviews
AMSTAR 2, ROBIS, overlap correction
Prognostic Reviews
CHARMS, PROBAST, c-statistic pooling
Living Reviews + Rapid Reviews
TSA, update triggers, abbreviated methods

Module 12 Complete

"विधि को प्रश्न से मेल खाना चाहिए। उन्नत विधियाँ उन्नत प्रश्नों का उत्तर देती हैं - लेकिन बुनियादी बातें कभी नहीं बदलती हैं।"

आपने मुख्य वर्कफ़्लो में महारत हासिल कर ली है। अगले दस मॉड्यूल सीमा का पता लगाते हैं: बायेसियन अनुमान, नेटवर्क मेटा-विश्लेषण, व्यक्तिगत रोगी डेटा, खुराक-प्रतिक्रिया मॉडलिंग, मजबूती और नाजुकता, इक्विटी, एआई-सहायता संश्लेषण, गुणात्मक साक्ष्य, बहुभिन्नरूपी तरीके, और प्रतिलिपि प्रस्तुत करने योग्यता।

प्रत्येक संकेत सत्य नहीं है।

मॉड्यूल 13: बायेसियन मोड़

============================================================ मॉड्यूल 13: बायेसियन मोड़ (भगदड़ मंच परीक्षण) ==============================================================

प्रत्येक संकेत सत्य नहीं है।

मॉड्यूल 13: बायेसियन मोड़

🎯 Learning Objectives

  • फ़्रेंक्टिस्ट और बायेसियन अनुमान के बीच अंतर स्पष्ट करें
  • Interpret prior distributions, likelihoods, and posterior distributions
  • Distinguish credible intervals from confidence intervals
  • Understand when Bayesian meta-analysis offers advantages
  • Recognize how prior choice affects conclusions
कहानी की शुरुआत: भगदड़

In 2005, a trial began

that would never truly end.

प्रोस्टेट कैंसर के लिए भगदड़ परीक्षण में मल्टी-आर्म, मल्टी-स्टेज (MAMS) प्लेटफ़ॉर्म डिज़ाइन का उपयोग किया गया। साक्ष्य एकत्रित होने पर हथियार जोड़े या गिराए जा सकते हैं। हालाँकि इसके आँकड़े बारंबारवादी थे, अनुकूली दर्शन ने बायेसियन भावना को मूर्त रूप दिया: डेटा जमा होने पर निर्णयों को अद्यतन करना।

In frequentist statistics, probability means long-run frequency। 95% सीआई का मतलब यह नहीं है कि "95% संभावना है कि वास्तविक प्रभाव अंदर है।" इसका अर्थ है: यदि हम अध्ययन को अनंत बार दोहराते हैं, तो 95% अंतरालों में सत्य होगा।

p-value
P(डेटा | H₀), नहीं P(H₀ | डेटा)
95% CI
कवरेज संपत्ति, विश्वास नहीं
Fixed
सही पैरामीटर तय है

In Bayesian statistics, probability represents degree of belief. We start with a prior (डेटा से पहले हम क्या मानते हैं), likelihood (डेटा हमें क्या बताता है) के साथ अपडेट करें, और प्राप्त करें a posterior (updated belief).

1

Prior × Likelihood = Posterior

बेयस प्रमेय: P(θ|data) ∝ P(data|θ) × P(θ)

2

Credible Intervals

95% विश्वसनीय अंतराल संभावित रूप से व्याख्या योग्य, निर्दिष्ट मॉडल पर सशर्त और पूर्व है।

Researcher
1

Non-informative (Vague)

सामान्य(0, 10000) या एकसमान। डेटा को हावी होने दें. लगातार परिणामों की नकल करता है।

2

Weakly Informative

Normal(0, 1) for log-OR. Regularizes extreme estimates while remaining flexible.

3

Informative

Based on previous evidence. Powerful but controversial. Must be pre-specified.

4

Half-Cauchy for τ

Recommended for heterogeneity. Half-Cauchy(0, 0.5) allows large τ but concentrates near zero.

Researcher

Most Bayesian models cannot be solved analytically. We use Markov Chain Monte Carlo (MCMC) पीछे से नमूने खींचने के लिए। उपकरण: JAGS, स्टेन, brms (R), PyMC (पायथन).

Chains
Multiple independent chains (typically 4)
Convergence: R̂ < 1.01 (strict; older texts use < 1.1)
ESS
बल्क-ESS > 400 साधन के लिए; टेल-ईएसएस > सीआई के लिए 400
Methodologist

Instead of choosing between fixed-effect and random-effects models, Bayesian model averaging (बीएमए) प्रत्येक मॉडल को उसकी पिछली संभावना के आधार पर महत्व देता है। यह अंतिम अनुमान में मॉडल अनिश्चितता के लिए जिम्मेदार है।

BF

Bayes Factors

BF₁₀ > 10 = H₁ के लिए मजबूत सबूत। BF₁₀ < 1/10 = H₀ के लिए मजबूत सबूत।

इंटरएक्टिव टूल प्लेसहोल्डर

यह देखने के लिए पूर्व शक्ति को समायोजित करें कि यह पीछे के हिस्से को कैसे प्रभावित करता है। देखें कि कैसे अधिक डेटा पूर्व को अभिभूत कर देता है।



स्टैम्पेड कहानी

स्टैम्पेड को 2005 में उन्नत प्रोस्टेट कैंसर के उपचार की तुलना करने वाली 5 अनुसंधान शाखाओं के साथ लॉन्च किया गया था। 2016 तक इसमें एबिराटेरोन शामिल किया गया था और मृत्यु में 37% की कमी देखी गई थी (HR 0.63, 95% CI 0.52–0.76)।

प्लेटफ़ॉर्म डिज़ाइन बायेसियन अनुकूली सोच का प्रतीक है: अंतरिम विश्लेषण हाथ चयन का मार्गदर्शन करता है, जैसे ही उपचार उभरता है, नए हथियार प्रवेश कर सकते हैं, और व्यर्थ हथियार जल्दी गिर जाते हैं - रोगियों को अप्रभावी होने से बचाया जाता है उपचार।

भगदड़ ने 100 से अधिक केंद्रों में 10,000 से अधिक रोगियों को नामांकित किया और प्रोस्टेट कैंसर देखभाल को मौलिक रूप से बदल दिया। बायेसियन मानसिकता साक्ष्यों को एकत्रित करने और वास्तविक समय में निर्णयों को सूचित करने देती है।

Frequentist vs Bayesian Meta-Analysis
बायेसियन तब चुनें जब: (1) आपके पास वास्तविक पूर्व जानकारी हो, (2) आपको संभाव्य कथनों की आवश्यकता हो ("80% संभावना प्रभाव > 0"), (3) कुछ अध्ययन फ़्रीक्वेंटिस्ट संपत्तियों को अविश्वसनीय बनाते हैं, या (4) आप मॉडल औसत करना चाहते हैं।
Bayesian with weakly informative prior
A common practical default. Regularizes extreme estimates without forcing strong prior conclusions.
बायेसियन के साथ जानकारीपूर्ण पूर्व
केवल तभी जब पूर्व साक्ष्य मजबूत और पूर्व-निर्दिष्ट हो। संवेदनशीलता विश्लेषण अवश्य करें।
Stay frequentist
Simpler, well-understood. Preferred when k is large and no prior information.

Remember Module 1?

CAST Through a Bayesian Lens

यदि CAST के बायेसियन विश्लेषण में बुनियादी विज्ञान (एंटीरियथमिक्स पीवीसी को दबाता है) से पहले की जानकारी का उपयोग किया गया होता, तो पिछला हिस्सा अभी भी नुकसान की ओर दृढ़ता से स्थानांतरित हो गया होता। पर्याप्त डेटा के साथ, एक मजबूत पूर्व भी संभावना को जन्म देता है। सबक: बायेसियन विधियां खराब प्राथमिकताओं से रक्षा नहीं करतीं - लेकिन वे धारणाएं बनाती हैं transparent.

Q1. What does a 95% Bayesian credible interval mean?

A. 95% of repeated experiments would produce intervals containing the true value
B. 95% संभावना है कि सही पैरामीटर इस अंतराल के भीतर है
C. The interval has a 95% chance of being correct
D. भविष्य का 95% डेटा इस सीमा में आएगा

Q2. अध्ययन के बीच विविधता के लिए अनुशंसित पूर्व क्या है (τ)?

A. Uniform(0, 100)
B. Normal(0, 1)
C. Half-Cauchy(0, 0.5)
D. Fixed at 0.5

Module 13 Complete

"बायेसियन मोड़ गणित के बारे में नहीं है। यह ईमानदारी के बारे में है - जो हमारी धारणाओं को दृश्यमान बनाता है।"

प्रत्येक संकेत सत्य नहीं है।

मॉड्यूल 14: नेटवर्क

=========================================================== मॉड्यूल 14: नेटवर्क (सिप्रियानी 2018 - 21 अवसादरोधी) ==============================================================

तरीके मरीज़ों को हमारे आत्मविश्वास से बचाते हैं।

मॉड्यूल 14: नेटवर्क

🎯 Learning Objectives

  • Explain why pairwise comparisons are insufficient when many treatments exist
  • Interpret network geometry (nodes, edges, thickness)
  • अवसाद के साथ परिवर्तनशीलता, स्थिरता और अप्रत्यक्ष साक्ष्य की भूमिका को समझें
  • Interpret SUCRA rankings and league tables
  • Recognize when NMA assumptions are violated

A clinician faces a patient

। कौन सी दवा?

आमतौर पर 21 एंटीडिप्रेसेंट निर्धारित हैं। अधिकांश आमने-सामने परीक्षणों की तुलना केवल 2 या 3 से की जाती है। सिप्रियानी एट अल। (2018, लैंसेट) ने 522 परीक्षणों और 116,477 रोगियों को एक ही नेटवर्क में जोड़ा।

1

Direct Evidence

Trials directly comparing A vs B give the most reliable estimate.

2

Indirect Evidence

यदि A बनाम C और B बनाम C मौजूद हैं, तो हम A बनाम B का अनुमान लगा सकते हैं। यह "सकर्मक" है धारणा।

3

Mixed Evidence

NMA combines both, weighted by precision, to rank all treatments simultaneously.

प्रत्येक नोड एक उपचार है। किनारे की मोटाई उन दो उपचारों की तुलना करने वाले अध्ययनों की संख्या का प्रतिनिधित्व करती है।

Researcher

Transitivity: अप्रत्यक्ष अनुमान (सामान्य तुलनित्र के माध्यम से) प्रत्यक्ष अनुमान के करीब होना चाहिए। इसके लिए आवश्यक है कि प्रभाव संशोधक समान रूप से तुलनाओं में वितरित किए जाएं।

Consistency: प्रत्यक्ष और अप्रत्यक्ष साक्ष्य की तुलना करने वाला सांख्यिकीय परीक्षण। वैश्विक (डिज़ाइन-दर-उपचार इंटरैक्शन) और स्थानीय (नोड-विभाजन) परीक्षण असंगतता लूप की पहचान करने में मदद करते हैं।

Researcher
SUCRA
संचयी रैंकिंग के अंतर्गत सतह। उच्च मान बेहतर रैंकिंग संभावना को दर्शाते हैं, श्रेष्ठता की गारंटी नहीं।
P-score
संभाव्यता सारांशों की रैंकिंग के लिए फ़्रीक्वेंटिस्ट एनालॉग। प्रभाव के आकार और अनिश्चितता के साथ व्याख्या करें।

Caution: Ranking is seductive but misleading when differences between treatments are small or uncertain. Always report credible/confidence intervals alongside ranks.

Methodologist

When interventions are complex (e.g., behavioral + pharmacological), component NMA decomposes multi-component treatments to estimate the individual contribution of each component. Uses additive models: effect(A+B) = effect(A) + effect(B) + interaction.

सिप्रियानी नेटवर्क

2018 लैंसेट विश्लेषण में पाया गया कि सभी 21 एंटीडिप्रेसेंट प्लेसीबो से अधिक प्रभावी थे। प्रभावकारिता के लिए एमिट्रिप्टिलाइन, मिर्ताज़ापाइन और वेनलाफैक्सिन को सर्वोच्च स्थान दिया गया है। एगोमेलेटिन, फ्लुओक्सेटीन और एस्सिटालोप्राम को स्वीकार्यता (सबसे कम ड्रॉपआउट) के लिए सर्वोच्च स्थान दिया गया है।

कोई भी एक दवा सभी परिणामों पर "जीत" नहीं पाई। नेटवर्क ने जोड़ीवार विश्लेषण के लिए अदृश्य व्यापार-बंदों का खुलासा किया।

NMA Feasibility Check
आपके पास 6 अलग-अलग स्टैटिन की तुलना करने वाली 15 आरसीटी हैं। कुछ जोड़ियों के पास प्रत्यक्ष प्रमाण होता है, अन्य के पास नहीं।
Check transitivity, then fit NMA
सत्यापित करें कि रोगी आबादी और अध्ययन डिज़ाइन तुलनाओं में पर्याप्त रूप से समान हैं।
अप्रत्यक्ष साक्ष्यों को नजरअंदाज करें
सांख्यिकीय शक्ति खो देता है और साक्ष्य आधार में अंतराल छोड़ देता है।
Pool all into one pairwise comparison
साक्ष्य की संरचना का उल्लंघन करता है. स्टैटिन अलग-अलग दवाएं हैं।

Q1. एनएमए में अप्रत्यक्ष साक्ष्य के वैध होने के लिए क्या धारणा होनी चाहिए?

A. Transitivity — effect modifiers are balanced across comparisons
B. Homogeneity — I² must be below 25%
C. All studies must have similar sample sizes
D. सभी अध्ययन डबल-ब्लाइंड होने चाहिए

Module 14 Complete

"नेटवर्क देखता है कि जोड़ीवार तुलना क्या नहीं कर सकती: उपचार की पसंद का संपूर्ण परिदृश्य।"

प्रत्येक संकेत सत्य नहीं है।

मॉड्यूल 15: व्यक्ति

============================================================= मॉड्यूल 15: व्यक्तिगत (ईबीसीटीसीजी - आईपीडी मेटा-विश्लेषण) ===============================================

What was hidden in plain sight?

मॉड्यूल 15: व्यक्ति

🎯 Learning Objectives

  • Explain why aggregate data can mask treatment–covariate interactions
  • Distinguish one-stage from two-stage IPD models
  • Recognize ecological bias in aggregate meta-analysis
  • Understand the practical challenges of IPD collection
  • Interpret treatment–covariate interaction plots

For decades, breast cancer trials

प्रकाशित सारांश. मरीज़ नहीं.

अर्ली ब्रेस्ट कैंसर ट्रायलिस्ट्स कोलैबोरेटिव ग्रुप (ईबीसीटीसीजी) ने सैकड़ों परीक्षणों में 100,000 से अधिक महिलाओं के व्यक्तिगत रिकॉर्ड एकत्र किए। उनके आईपीडी मेटा-विश्लेषण से पता चला है कि टेमोक्सीफेन के लाभ एस्ट्रोजेन रिसेप्टर स्थिति पर बहुत अधिक निर्भर करते हैं - समग्र डेटा में कुछ अदृश्य।

टेमोक्सीफेन के प्रत्येक प्रकाशित परीक्षण ने एक समग्र परिणाम की सूचना दी। सैकड़ों अध्ययनों में, टैमोक्सीफेन मामूली लाभ प्रदान करता हुआ दिखाई दिया। लेकिन "मामूली लाभ" एक औसत था जिसने एक गहरा सच छुपाया।

हिडन सबग्रुप स्प्लिट

RR 0.59
ER-positive subgroup: 41% reduction in recurrence
RR 0.97
ER-negative subgroup: essentially no benefit at all

समग्र रूप से एकत्रित प्रभाव - प्रतिक्रियाशील और गैर-प्रतिक्रियाशील रोगियों का मिश्रण - एक सांख्यिकीय कल्पना थी। एक "मामूली" औसत जिसमें एक समूह के लिए लाभ को बढ़ा-चढ़ाकर बताया गया और दूसरे समूह के लिए ऐसे लाभ को निहित किया गया जहां कोई मौजूद नहीं था।

AD
Aggregate: published effect + CI only
IPD
Individual: raw patient-level records

आईपीडी अनुमति देता है: (1) सुसंगत परिणाम परिभाषाएँ, (2) रोगी विशेषताओं द्वारा उपसमूह विश्लेषण, (3) समय-दर-घटना मॉडलिंग, (4) पारिस्थितिक पूर्वाग्रह की जाँच। यह है gold standard for exploring treatment effect modification.

Researcher
1

Two-Stage

Analyze each study separately, then combine estimates (like standard MA). Simple but loses information.

2

One-Stage

सभी रोगी डेटा पर एक साथ एकल मिश्रित-प्रभाव मॉडल फिट करें। बातचीत और दुर्लभ घटनाओं के लिए अधिक शक्तिशाली।

Key: दोनों को अध्ययन क्लस्टरिंग का हिसाब देना चाहिए। कभी भी आईपीडी को ऐसे एकत्रित न करें जैसे कि वह एक मेगा-ट्रायल से हो - यह उलझन पैदा करता है (सिम्पसन का विरोधाभास)।

Methodologist

A meta-regression using study-level mean age might show older patients benefit more. But this could be ecological bias-अध्ययन-स्तर का जुड़ाव रोगी-स्तर की सच्चाई को प्रतिबिंबित नहीं करता है। केवल आईपीडी ही अलग हो सकता है within-study from between-study effects.

जब संपूर्ण अपने भागों के बारे में झूठ बोलता है

सिम्पसन का विरोधाभास: एक प्रवृत्ति जो समग्र डेटा में दिखाई देती है वह तब उलट जाती है जब डेटा को एक जटिल चर द्वारा समूहीकृत किया जाता है।

व्यवहार में विरोधाभास

A mega-trial analysis found Treatment X beneficial overall. But प्रत्येक अध्ययन के भीतर, यह हानिकारक था. कैसे? अध्ययनों के बीच आधारभूत जोखिम में अंतर ने एक भ्रम पैदा किया - बीमार आबादी को अधिक उपचार प्राप्त हुआ, जिससे कुल लाभ बढ़ गया।

Cates (2002, BMJ) ने दिखाया कि क्लस्टरिंग को ध्यान में रखे बिना अध्ययनों में पूलिंग प्रभाव की स्पष्ट दिशा को उलट सकती है।

यही कारण है कि आईपीडी वन-स्टेज मॉडल में अध्ययन को क्लस्टरिंग वैरिएबल के रूप में शामिल किया गया है - ताकि अध्ययन के बीच की उलझन को उपचार प्रभाव के रूप में छिपाने से रोका जा सके।

ईबीसीटीसीजी विरासत

ईबीसीटीसीजी के आईपीडी मेटा-विश्लेषण ने 40 वर्षों के लिए स्तन कैंसर के उपचार को परिभाषित किया है। उनके 2005 के टेमोक्सीफेन बनाम बिना उपचार के विश्लेषण से ईआर-पॉजिटिव ट्यूमर (आरआर 0.59) में स्पष्ट लाभ दिखा, लेकिन ईआर-नेगेटिव ट्यूमर (आरआर 0.97) में कोई लाभ नहीं हुआ।

आईपीडी के बिना, समग्र समग्र प्रभाव दोनों समूहों में एकत्रित हो गया होगा - लाभ को कम करना और संभावित रूप से ईआर-पॉजिटिव रोगियों को उनके लाभ के परिमाण से वंचित करना।

Do you suspect treatment–covariate interactions?
Yes →

क्या आप >80% परीक्षणों से आईपीडी प्राप्त कर सकते हैं?

Yes → One-stage IPD meta-analysis with interaction terms
No → दो-चरण: शेष के लिए उपलब्ध आईपीडी + समुच्चय का अनुरोध करें
No →

Is ecological bias a concern?

Yes → IPD preferred even without interactions
No → Aggregate data meta-analysis may suffice

ईबीसीटीसीजी ने 40 वर्षों में सैकड़ों परीक्षणों से डेटा एकत्र किया। अधिकांश आईपीडी मेटा-विश्लेषणों में 5-20 परीक्षण शामिल होते हैं। फैसला सवाल पर निर्भर करता है, महत्वाकांक्षा पर नहीं.

Methodologist

मॉड्यूल 3 याद है? एचआरटी अवलोकन संबंधी अध्ययनों में फायदेमंद लेकिन आरसीटी में हानिकारक दिखाई दिया। वही समुच्चय छिपा हुआ था: समग्र लाभ ने उपसमूह हानि को छिपा दिया।

महिला स्वास्थ्य पहल के आईपीडी विश्लेषण से बाद में पता चला timing mattered-रजोनिवृत्ति के 10 साल के भीतर एचआरटी शुरू करने वाली महिलाओं में बाद में शुरू करने वाली महिलाओं की तुलना में अलग परिणाम थे। प्रकाशित समग्र सारांशों में "समय परिकल्पना" अदृश्य थी।

पाठ की पुनरावृत्ति होती है: समग्र डेटा महत्वपूर्ण उपचार-सहसंयोजक अंतःक्रियाओं को अस्पष्ट कर सकता है। चाहे वह स्तन कैंसर में ईआर स्थिति हो या एचआरटी में समय, व्यक्तिगत स्तर के डेटा से पता चलता है कि सारांश क्या छिपाते हैं।

Q1. समग्र-डेटा मेटा-विश्लेषण पर आईपीडी का प्राथमिक लाभ क्या है?

A. इसमें हमेशा अधिक अध्ययन शामिल होते हैं
B. यह सस्ता और तेज़ है
C. It can explore treatment–covariate interactions without ecological bias
D. यह यादृच्छिक-प्रभाव वाले मॉडल की आवश्यकता को समाप्त करता है

Module 15 Complete

"प्रत्येक एकत्रित अनुमान के पीछे ऐसे व्यक्ति होते हैं जिनकी कहानियाँ समग्र रूप से नहीं बताई जा सकतीं।"

विषमता एक संदेश है, शोर नहीं।

मॉड्यूल 16: खुराक

============================================================= मॉड्यूल 16: खुराक (अल्कोहल जे-वक्र / स्टॉकवेल 2016) ===============================================

विषमता एक संदेश है, शोर नहीं।

मॉड्यूल 16: खुराक

🎯 Learning Objectives

  • Explain why simple pairwise comparisons miss dose–response relationships
  • Distinguish linear, quadratic, and spline dose–response models
  • Interpret restricted cubic splines with knots
  • Identify threshold effects and J/U-shaped curves
  • Understand model comparison with AIC/BIC

दशकों से, मध्यम शराब पीना

हृदय की रक्षा करता हुआ दिखाई दिया।

"जे-आकार का वक्र" दर्शाता है कि शराब न पीने वालों में मध्यम शराब पीने वालों की तुलना में हृदय संबंधी मृत्यु दर अधिक थी। लेकिन स्टॉकवेल एट अल. (2016) ने प्रदर्शित किया कि जे-वक्र पूर्व शराब पीने वालों (जिन्होंने बीमारी के कारण छोड़ दिया था) को "परहेज करने वालों" के रूप में गलत वर्गीकृत करने की एक कला थी।

2010 तक, 100 से अधिक अवलोकन अध्ययनों ने जे-वक्र की पुष्टि की थी। मेडिकल पाठ्यपुस्तकों ने इसे सिखाया। हृदय रोग विशेषज्ञों ने इसका हवाला दिया। वाइन उद्योग के पैरवीकारों ने इसके आसपास सम्मेलनों को वित्त पोषित किया।

100+
जे-वक्र की पुष्टि करने वाले अवलोकन संबंधी अध्ययन
15–25%
Lower cardiovascular mortality in moderate drinkers vs abstainers

सबूत जबरदस्त लग रहे थे. लेकिन क्या होगा अगर तुलनात्मक समूह- "परहेज करने वाले"- दूषित हो गए?

बीमार छोड़ने वाला

A Hidden Confounder

The Problem

People who stop drinking often do so because they are already ill-जिगर रोग, दवा परस्पर क्रिया, कैंसर निदान। अधिकांश अध्ययनों में इन "पूर्व शराब पीने वालों" को "परहेज करने वालों" के रूप में वर्गीकृत किया गया था।

The Effect: The reference group (abstainers) appeared less healthy- इसलिए नहीं कि संयम हानिकारक था, बल्कि इसलिए कि बीमार लोग इसमें शामिल हो गए थे।

When Stockwell et al. (2016, J Stud Alcohol Drugs) removed former drinkers and applied appropriate study-quality corrections: जे-वक्र गायब हो गया. सुरक्षात्मक प्रभाव एक प्रेत था.

Standard meta-analysis asks: "Does treatment X work?" Dose–response meta-analysis asks: "At what dose क्या उपचार एक्स सबसे अच्छा काम करता है?" यह कई अध्ययनों में खुराक स्तर और परिणाम के बीच संबंध को मॉडल करता है।

Linear
Simplest: log(RR) = β × dose
Spline
Flexible: piecewise polynomials with knots
Fractional
Polynomial: dose^p1 + dose^p2
Researcher

RCS place knots पूर्व-निर्दिष्ट खुराक बिंदुओं पर और उनके बीच चिकनी बहुपद फिट करें। आमतौर पर खुराक वितरण की मात्रा पर 3-5 गांठें। सीमा गांठों से परे रैखिक. गैर-रैखिकता के लिए परीक्षण स्पलाइन मॉडल की तुलना एक सरल रैखिक मॉडल से करते हैं।

AIC

Model Comparison

एआईसी/बीआईसी रैखिक बनाम स्पलाइन फिट की तुलना करता है। निचला = बेहतर. रैखिकता से विचलन का भी परीक्षण करें (स्पलाइन शर्तों के लिए पी-वैल्यू)।

रैखिक बनाम द्विघात बनाम तख़्ता फिट की तुलना करें। देखें कि विभिन्न धारणाओं के साथ मॉडल का आकार कैसे बदलता है।

अल्कोहल जे-कर्व का खंडन

स्टॉकवेल के 2016 के पुन: विश्लेषण में पाया गया कि जब पूर्व शराब पीने वालों को "परहेज करने वाले" संदर्भ समूह से सही ढंग से बाहर रखा गया था, तो मध्यम शराब पीने का सुरक्षात्मक प्रभाव गायब हो गया। जे-वक्र बीमार-छोड़ने वाले पूर्वाग्रह से प्रेरित था।

खुराक-प्रतिक्रिया मेटा-विश्लेषण से सच्चाई सामने आई: वक्र का आकार गंभीर रूप से इस बात पर निर्भर करता है कि आप "शून्य खुराक" को कैसे परिभाषित करते हैं। गलत संदर्भ श्रेणी ने एक काल्पनिक लाभ पैदा किया।

The phantom J-curve influenced alcohol guidelines worldwide:

UK

NHS Guidance (until 2016)

आधिकारिक मार्गदर्शन में कहा गया, "मध्यम मात्रा में शराब पीने से हृदय की रक्षा हो सकती है"। स्टॉकवेल के सुधार के बाद, यूके ने सीमा को संशोधित कर 14 यूनिट/सप्ताह कर दिया all शराब पीने वाले (पहले पुरुषों के लिए 21)। किसी भी राशि को "सुरक्षित" घोषित नहीं किया गया।

US

Dietary Guidelines Advisory Committee

2015 तक जे-वक्र अध्ययनों का हवाला दिया गया था। 2020 समिति ने संदर्भ-समूह पूर्वाग्रह को स्वीकार करते हुए पुरुषों के लिए सीमा को 1 पेय/दिन तक कम करने की सिफारिश की।

AU

Australian Guidelines

Safe drinking limits were delayed by industry-funded J-curve research promoting “cardioprotective” moderate intake.

क्या आपके पास ≥3 एक्सपोज़र स्तर हैं (सिर्फ एक्सपोज़्ड बनाम अनएक्सपोज़्ड नहीं)?
Yes →

क्या रिश्ता संभवतः गैर-रैखिक है?

Yes → Restricted cubic splines (3–5 knots). Compare AIC with linear model.
No → Linear dose-response meta-regression may suffice
No →

Standard pairwise meta-analysis (no dose-response possible with only two levels)

Warning: हमेशा जाँचें—क्या आपकी संदर्भ श्रेणी साफ़ है? जे-वक्र पाठ: एक दूषित संदर्भ समूह प्रेत गैर-रैखिकता बनाता है।

Q1. What makes restricted cubic splines useful in dose–response meta-analysis?

A. They always produce a straight line
B. They flexibly capture non-linear dose–response curves
C. वे आवश्यक अध्ययनों की संख्या कम कर देते हैं
D. They simplify the model to fewer parameters

Module 16 Complete

"खुराक जहर बनाती है। और वक्र के आकार से पता चलता है कि जहर असली है या नहीं।"

साक्ष्य का अभाव अनुपस्थिति का साक्ष्य नहीं है।

मॉड्यूल 17: नाजुकता

============================================================= मॉड्यूल 17: नाजुकता (ओसेल्टामिविर / जेफरसन 2014) ===============================================

साक्ष्य का अभाव अनुपस्थिति का साक्ष्य नहीं है।

मॉड्यूल 17: नाजुकता

🎯 Learning Objectives

  • नाजुकता सूचकांक की गणना और व्याख्या करें
  • प्रभावशाली अध्ययन और उप-प्रभावों की पहचान करने के लिए GOSH प्लॉट का उपयोग करें
  • Interpret contour-enhanced funnel plots
  • प्रकाशन पूर्वाग्रह के लिए कोपास चयन मॉडल और PET-PEESE लागू करें
  • Understand how sensitivity analyses strengthen meta-analytic conclusions

Governments stockpiled billions

उन साक्ष्यों के आधार पर जिन्हें वे नहीं देख सके।

H1N1 के बाद, सरकारों ने ओसेल्टामिविर (टैमीफ्लू) भंडार पर अरबों खर्च किए। कोक्रेन टीम (जेफरसन एट अल. 2014) ने अप्रकाशित डेटा तक पहुंचने के लिए वर्षों तक संघर्ष किया। जब आख़िरकार उन्होंने ऐसा किया, तो जटिलताओं को रोकने के सबूत लुप्त हो गए।

नाजुकता सूचकांक पूछता है: "How many patients would need to change outcome to flip a statistically significant result to non-significant?" यह पी > 0.05 तक कम घटनाओं के साथ समूह में घटनाओं को पुनरावृत्त रूप से जोड़ता है (गैर-घटनाओं को घटनाओं में परिवर्तित करता है)।

FI = 1
Extremely fragile. One patient flip changes conclusion.
FI > 8
Reasonably robust. Less sensitive to individual outcomes.

Enter a 2×2 table to calculate the fragility index. Watch events shift until significance flips.

Events
Total N
Treatment
Control
Researcher

अध्ययन विविधता का ग्राफिकल अवलोकन (जीओएसएच) मेटा-विश्लेषण मॉडल को अध्ययन के सभी संभावित उपसमूहों में फिट करता है। प्रत्येक बिंदु एक उपसमूह के लिए पूलित प्रभाव बनाम I² प्लॉट करता है। क्लस्टर अलग-अलग उपसमूहों का सुझाव देते हैं; बाहरी बादल एक अध्ययन से विविधता लाने का सुझाव देते हैं।

के अध्ययन के लिए, 2 हैंk−1 subsets. For k > 15, random sampling is used.

Researcher

Standard funnel plots show effect size vs standard error. Contour-enhanced संस्करण p <0.01, p <0.05, और p <0.10 के लिए छायांकित क्षेत्र जोड़ते हैं। यदि लापता अध्ययन गैर-महत्वपूर्ण क्षेत्रों में आते हैं, तो प्रकाशन पूर्वाग्रह की संभावना है। यदि वे महत्वपूर्ण क्षेत्रों में आते हैं, तो अन्य कारण (उदाहरण के लिए, अध्ययन की गुणवत्ता) विषमता की व्याख्या कर सकते हैं।

Methodologist
1

Copas Selection Model

किसी अध्ययन के प्रकाशित होने की संभावना को उसके एसई और प्रभाव आकार के आधार पर मॉडल करता है। वास्तविक प्रभाव और चयन तंत्र का संयुक्त रूप से अनुमान लगाता है।

2

PET-PEESE

Precision-Effect Test (PET): regress effects on SE. If intercept = 0, no true effect. PEESE uses SE² for better performance when a true effect exists.

ओसेल्टामिविर सागा

मूल रोश-वित्त पोषित मेटा-विश्लेषण (कैसर 2003) ने दिखाया कि ओसेल्टामिविर ने इन्फ्लूएंजा जटिलताओं को 67% तक कम कर दिया। लेकिन 10 में से 8 परीक्षण कभी प्रकाशित नहीं हुए थे। कोक्रेन द्वारा नैदानिक ​​अध्ययन रिपोर्ट प्राप्त करने के बाद, जटिलताओं के लिए लाभ घटकर 11% रह गया।

नाजुकता सिर्फ सांख्यिकीय नहीं थी - यह सूचनात्मक थी। साक्ष्य आधार में ही अधिकांश डेटा गायब था।

आपने फ्रैगिलिटी इंडेक्स की गणना की। संख्या का क्या मतलब है?
FI ≤ 3

Highly fragile. कुछ अलग-अलग घटनाएँ निष्कर्ष को उलट देंगी। अत्यंत सावधानी से व्याख्या करें.

FI 4–8

Moderately fragile. छोटी-छोटी गड़बड़ियों के प्रति संवेदनशील. क्या ऐसे अप्रकाशित परीक्षण हैं जो इसे बदल सकते हैं?

FI > 8

Relatively robust. But remember: fragility is only one dimension. Publication bias can undermine even robust results.

Walsh et al. (2014, J Clin Epidemiol) पाया गया कि शीर्ष पत्रिकाओं में प्रकाशित 399 आरसीटी में, औसत नाजुकता सूचकांक सिर्फ 8 था। 25% से अधिक में एफआई ≤ 3 था। नैदानिक ​​​​अभ्यास को प्रभावित करने वाले ऐतिहासिक परीक्षण अक्सर एक सांख्यिकीय धागे से लटके हुए थे।

Methodologist

ओसेल्टामिविर गाथा का खुलासा हुआ three types of fragility-और फ्रैगिलिटी इंडेक्स केवल पहले को ही पकड़ता है।

1

Statistical Fragility (FI)

कितनी घटनाएँ पी-वैल्यू को फ़्लिप करती हैं? फ्रैगिलिटी इंडेक्स इसी को मापता है। यह व्यक्तिगत रोगी परिणामों के प्रति संवेदनशीलता की मात्रा निर्धारित करता है।

2

Informational Fragility

कितने सबूत छुपे हैं? रोश ओसेल्टामिविर के दस में से आठ परीक्षण अप्रकाशित थे। साक्ष्य का आधार संरचनात्मक रूप से अधूरा था।

3

Analytical Fragility

स्वतंत्रता की कितनी शोधकर्ता डिग्री निष्कर्ष को बदल सकती हैं? विभिन्न परिणाम परिभाषाएँ, विश्लेषण जनसंख्या, या सांख्यिकीय विधियाँ।

मॉड्यूल 10 (पैरॉक्सिटाइन) पर कॉलबैक: विभिन्न परिणाम परिभाषाओं के साथ पुनः विश्लेषण ने निष्कर्ष को पूरी तरह से उलट दिया। वह विश्लेषणात्मक कमज़ोरी थी - FI की गणना कभी नहीं की गई क्योंकि समापन बिंदु स्वयं विवादित था। संपूर्ण मजबूती मूल्यांकन सभी तीन आयामों की जांच करता है।

Q1. एक परीक्षण में प्रति हाथ 200 मरीज़, उपचार में 12 घटनाएँ, नियंत्रण में 25 घटनाएँ हैं (पी=0.03)। नाजुकता सूचकांक 3 है। इसका क्या मतलब है?

A. प्रभाव का आकार बिल्कुल 3 है
B. Changing just 3 patient outcomes would flip the result to non-significant
C. 3 पुष्टिकरण अध्ययनों के साथ परिणाम बहुत मजबूत है
D. अध्ययन के लिए कम से कम 3 रोगियों की आवश्यकता है

Module 17 Complete

"वह संख्या जो तोड़ने के हर प्रयास के बाद भी जीवित रहती है, वही भरोसे लायक संख्या है।"

प्रत्येक संकेत सत्य नहीं है।

मॉड्यूल 18: इक्विटी

============================================================= मॉड्यूल 18: इक्विटी (स्प्रिंट बहिष्करण / प्रगति-प्लस) ===============================================

Certainty must be earned, not assumed.

मॉड्यूल 18: इक्विटी

🎯 Learning Objectives

  • Identify how trial exclusion criteria create evidence gaps
  • साक्ष्य में समानता का आकलन करने के लिए प्रोग्रेस-प्लस ढांचे को लागू करें
  • Use PRISMA-Equity reporting guidelines
  • Understand transportability: when trial findings fail in practice
  • Design equity-sensitive search and synthesis strategies

SPRINT proved tight blood pressure control

saves lives. But whose lives?

ऐतिहासिक स्प्रिंट परीक्षण में मधुमेह, पूर्व स्ट्रोक और हृदय विफलता वाले रोगियों को शामिल नहीं किया गया। अमेरिका के 75% से अधिक उच्च रक्तचाप से ग्रस्त रोगी योग्य नहीं होंगे। सबूत मजबूत थे लेकिन प्रयोज्यता संकीर्ण थी।

स्लाइड ए: लुप्त बहुमत

स्प्रिंट ने 9,361 रोगियों को नामांकित किया और साबित किया कि गहन रक्तचाप नियंत्रण (लक्ष्य <120 mmHg) ने हृदय संबंधी घटनाओं को 25% (एचआर 0.75, 95% सीआई 0.64-0.89) कम कर दिया। लेकिन समावेशन मानदंड एक अलग कहानी बताते हैं।

किसे बाहर रखा गया:

  • Diabetes - अमेरिका के 35% वयस्क उच्च रक्तचाप से पीड़ित हैं
  • Prior stroke - उच्च रक्तचाप से ग्रस्त आबादी का 8%
  • Symptomatic heart failure — 6% of hypertensive adults
  • Expected survival <3 years - सबसे कमज़ोर मरीज़
  • Nursing home residents — excluded entirely
  • GFR <20 mL/min — advanced kidney disease

परिणाम: उच्च रक्तचाप वाले 75% से अधिक अमेरिकी वयस्क योग्य नहीं होंगे। सबूत पुख्ता थे. लेकिन किसके लिए?

स्लाइड बी: साक्ष्य का भूगोल

साक्ष्य कहाँ से आता है

78%

of cardiovascular mega-trial participants came from high-income countries (2000–2020).

6%

from sub-Saharan Africa — where cardiovascular disease is rising fastest.

पॉलीपिल परीक्षण: 5 में से 4 औसत बीएमआई <25 वाली आबादी में आयोजित किए गए। अमेरिका का मतलब बीएमआई 30 है। दवा चयापचय, सहरुग्णता पैटर्न, स्वास्थ्य देखभाल पहुंच और आनुवंशिक भिन्नता सभी आबादी में भिन्न होती है। Efficacy in one population does not guarantee effectiveness in another.

संदर्भ: बहुराष्ट्रीय परीक्षण और प्रगति-प्लस अंतर

P
Place of residence
R
Race / ethnicity
O
Occupation
G
Gender / sex
R
Religion
E
Education
S
SES (socioeconomic)
S
Social capital

Plus: Age, disability, sexual orientation, other vulnerable groups.

Researcher

PRISMA-Equity समीक्षा में समानता को कैसे संबोधित किया गया, इसकी रिपोर्टिंग की आवश्यकता के लिए PRISMA का विस्तार किया गया: जनसंख्या विशेषताएँ, नुकसान के आधार पर उपसमूह विश्लेषण, और वंचित आबादी के लिए प्रयोज्यता का आकलन।

Transportability: परीक्षण प्रभावकारिता वास्तविक दुनिया की प्रभावशीलता के बराबर नहीं है। लक्ष्य जनसंख्या वितरण से मिलान करने के लिए परीक्षण डेटा को फिर से वजन करने के तरीके मौजूद हैं।

स्लाइड सी: परिवहन योग्यता प्रश्न
Researcher

Transportability = क्या परीक्षण जनसंख्या X के परिणाम लक्षित जनसंख्या Y पर लागू किए जा सकते हैं? यह कोई दार्शनिक प्रश्न नहीं है—इसके औपचारिक तरीके हैं।

1

Inverse Probability of Participation Weighting (IPPW)

Re-weights trial participants so they resemble the target population on key covariates.

2

Generalizability Index

यह मात्रा निर्धारित करता है कि अवलोकन की गई विशेषताओं पर परीक्षण नमूना लक्ष्य आबादी के कितना समान है।

Stuart et al. (2015, Stat Med): जब SPRINT परिणामों को अमेरिका की उच्च रक्तचाप से ग्रस्त आबादी से मेल खाने के लिए पुनः भारित किया गया, तो अनुमानित लाभ कम हो गया - HR 0.82 (बनाम परीक्षण में 0.75)। उपचार अभी भी काम करता है. लेकिन जनसंख्या बदलने पर परिमाण बदल जाता है।

स्प्रिंट और लापता बहुमत

स्प्रिंट 9,361 रोगियों पर एक अच्छी तरह से डिज़ाइन किया गया परीक्षण था। इसकी खोज (गहन बनाम मानक बीपी नियंत्रण के लिए एचआर 0.75) ने दुनिया भर में दिशानिर्देश बदल दिए। लेकिन बाद के विश्लेषणों से पता चला कि परीक्षण आबादी की तरह उपसमूह में लाभ सबसे मजबूत था - और बहिष्कृत समूहों के लिए अनिश्चित था।

साक्ष्य संश्लेषण में समानता का अर्थ केवल यह पूछना नहीं है कि "क्या यह काम करता है?" लेकिन "यह किसके लिए काम करता है?"

ROOT: क्या आपकी समीक्षा के साक्ष्य आपके लक्ष्य के समान आबादी से आते हैं?

YES → Good. But check: Are subgroups (age, sex, ethnicity, SES) reported separately?

  • Yes: Use subgroup effects for population-specific recommendations
  • No: Flag as limitation — equity gap in reporting

NO → Does PROGRESS-Plus analysis reveal differential effects?

  • Yes: Population-specific recommendations needed. Consider transportability re-weighting.
  • No: Cautious generalization with explicit equity statement in discussion
स्लाइड ई: मॉड्यूल 3 पर कॉलबैक
Methodologist

Callback: The HRT Lesson Revisited

मॉड्यूल 3 याद है? एचआरटी कहानी ने यह दिखाया healthy-user bias एक हानिकारक उपचार को लाभकारी बना दिया। स्प्रिंट में विपरीत समस्या हो सकती है - "स्वस्थ स्वयंसेवक" प्रभाव एक प्रभावी उपचार प्रकट कर सकता है more effective than it would be in the real world.

प्रत्येक मेटा-विश्लेषण में पूछा जाना चाहिए: कौन शामिल था? किसे बाहर रखा गया? और क्या इससे कोई फर्क पड़ता है?

Q1. What does the PROGRESS-Plus framework help reviewers assess?

A. Statistical heterogeneity
B. Equity and applicability across disadvantaged populations
C. सम्मिलित अध्ययनों की आंतरिक वैधता
D. साक्ष्य की समग्र निश्चितता

Module 18 Complete

"जो साक्ष्य कमजोर लोगों को बाहर रखते हैं, वे उनकी सेवा करने का दावा नहीं कर सकते।"

प्रत्येक संकेत सत्य नहीं है।

मॉड्यूल 19: मशीन

============================================================= मॉड्यूल 19: मशीन (कोक्रेन कोविड स्क्रीनिंग) ===============================================

बिना मूल के संख्या एक संख्या नहीं है।

मॉड्यूल 19: मशीन

🎯 Learning Objectives

  • Describe how AI/ML is used in systematic review screening
  • Explain active learning and human-in-the-loop workflows
  • Assess automation validation: recall, workload savings, and risk
  • एल्गोरिथम स्क्रीनिंग की सीमाओं और पूर्वाग्रहों को पहचानें
  • साक्ष्य संश्लेषण में जिम्मेदार एआई उपयोग के लिए रूपरेखा लागू करें

When COVID-19 hit,

papers arrived faster than humans could read.

2021 तक, 300,000 से अधिक COVID पेपर मौजूद थे। कोक्रेन ने अपनी त्वरित समीक्षाओं के लिए ट्राइएज अध्ययन के लिए मशीन लर्निंग क्लासिफायर का उपयोग किया - 95% से अधिक रिकॉल बनाए रखते हुए स्क्रीनिंग कार्यभार को 70% तक कम किया।

By April 2020, 4,000 COVID preprints appeared every week.

PubMed indexed 500 new COVID articles per day.

Cochrane's screening queue hit 10,000 unreviewed titles.

🔍 असंभवता का गणित

A pair of reviewers screens ~200 titles per day.

At 500 new articles/day, they fell further behind with every hour.

जीवित समीक्षा जीने से पहले ही मर रही थी।

पहला प्रयास

यह विचार नया नहीं था. कोहेन एट अल. (2006, जामिया) ने पहली बार दिखाया कि मशीन लर्निंग स्क्रीनिंग वर्कलोड को 50% तक कम कर सकती है - रिकॉल में 5% से कम नुकसान के साथ।

📅
2006: Cohen et al. — SVM classifiers for drug class reviews. Proof of concept.
📅
2016: RobotReviewer (Marshall et al., JMLR) — ML for risk of bias assessment. Inter-rater reliability comparable to human reviewers.
📅
2021: ASReview (van de Schoot et al., Nature Machine Intelligence) — active learning that simulated 95% workload reduction.

लेकिन अनुकरण वास्तविकता नहीं है. कोविड बड़े पैमाने पर पहली सच्ची परीक्षा होगी।

1

Screening Prioritization

Active learning ranks citations by relevance. Reviewers screen the most likely relevant first.

2

डेटा निष्कर्षण सहायता

एनएलपी पीआईसीओ तत्व, परिणाम और नतीजे निकालता है। हमेशा मानव सत्यापन की आवश्यकता होती है।

3

Risk of Bias Assessment

ML classifiers predict RoB domains. Experimental—human judgment remains gold standard.

Researcher
Recall
>95% required. Missing 1 study can change conclusions.
WSS@95%
Work Saved over Sampling at 95% recall.
Stopping
When to stop screening? Consecutive irrelevant threshold.

मूलभूत तनाव: स्वचालन से समय की बचत होती है लेकिन त्रुटि का एक नया स्रोत सामने आता है। हमेशा टूल, संस्करण, प्रशिक्षण डेटा और रुकने के मानदंड की रिपोर्ट करें।

मान्यता संकट
🔍 मान्यता का विरोधाभास

यह जानने के लिए कि क्या मशीन किसी प्रासंगिक अध्ययन से चूक गई है, you need a human to screen everything.

But if humans screen everything, मशीन का उपयोग क्यों करें?

The solution: prospective holdout validation.

  • Random 10% sample screened by both human and machine
  • तुलना करें: क्या मशीन ने वह खो दिया जो मानव ने पाया?
  • If recall drops below 95%, retrain and expand human screening

विश्वास करें लेकिन सत्यापित कर लें। मशीन अपनी भूमिका अर्जित करती है—उसे यह विरासत में नहीं मिलती।

Cochrane's COVID Response

कोक्रेन ने लाखों रिकॉर्ड पर प्रशिक्षित मशीन लर्निंग क्लासिफायर का उपयोग करके COVID-19 अध्ययन रजिस्टर बनाया। सिस्टम ने मैन्युअल स्क्रीनिंग को हफ्तों से घटाकर दिनों में करते हुए 99% संवेदनशीलता हासिल की।

लेकिन मशीन एक उपकरण थी, प्रतिस्थापन नहीं। प्रत्येक शामिल अध्ययन को अभी भी मानव समीक्षकों द्वारा सत्यापित किया गया था। सबक: एआई समीक्षक को बढ़ाता है, प्रतिस्थापित नहीं करता।

वह अध्ययन जो लगभग नहीं मिला

जून 2020 में, रिकवरी परीक्षण ने अपने डेक्सामेथासोन परिणाम प्रकाशित किए-the first treatment proven to reduce COVID mortality (28-day mortality: 22.9% vs 25.7%, RR 0.83).

प्रीप्रिंट एक गैर-मानक शीर्षक के साथ medRxiv पर दिखाई दिया। महामारी के दौरान इस तरह के परिदृश्य बार-बार सामने आए: मौजूदा शब्दावली पर प्रशिक्षित एमएल क्लासिफायर, अपरिचित फ़्रेमिंग को निचले स्तर पर रखते थे।

कई जीवित समीक्षाओं में, मानव समीक्षकों ने ध्वजांकित शीर्षकों को स्कैन करते हुए प्रमुख दवाओं के नामों की पहचान की और उन अध्ययनों को आगे बढ़ाया जिन्हें वर्गीकरणकर्ताओं ने प्राथमिकता से हटा दिया था।

उन मनुष्यों के बिना, ऐतिहासिक उपचार निष्कर्षों को जीवित समीक्षा में प्रवेश करने के लिए हफ्तों इंतजार करना पड़ सकता था।

मशीन तेजी से पढ़ती है. मानव अधिक गहराई से पढ़ता है। न ही अकेले पर्याप्त है.

आपकी समीक्षा में 5,000 से अधिक शीर्षक प्रदर्शित होंगे?
Yes → Consider AI-assisted screening

Active learning prioritization. Dual-screen random 10% holdout. Stop when 3 consecutive batches yield 0 relevant studies.

Report: classifier type, training data, recall on holdout, stopping rule.

No → Manual screening is feasible

For <5,000 titles, dual human screening remains gold standard. AI adds complexity without proportionate benefit.

क्या यह जीवंत या त्वरित समीक्षा है?

If yes → AI is especially valuable. Continuous classifier retraining on new evidence. But: मशीन को कभी भी अंतिम समावेशन निर्णय न लेने दें।

पैटर्न दोहराता है
Methodologist

मॉड्यूल 6 याद है? पोल्डरमैन्स ने DECREASE डेटा तैयार किया जो एक दशक तक पेरीऑपरेटिव बीटा-ब्लॉकर दिशानिर्देशों का मार्गदर्शन करता था।

AI can now detect statistical anomalies automatically:

  • GRIM test: क्या रिपोर्ट किए गए साधन पूर्णांक नमूना आकार के अनुरूप हैं?
  • SPRITE: क्या रिपोर्ट किए गए सारांश आँकड़ों को प्रशंसनीय व्यक्तिगत डेटा से पुनर्निर्मित किया जा सकता है?
  • Statcheck: Do reported p-values match the test statistics?

इन उपकरणों में विसंगतियाँ पाई गईं hundreds of published papers—faster than any human auditor.

लेकिन मशीन झंडे गाड़ देती है. मानव न्याय करता है. पीछे हटने का निर्णय अत्यंत मानवीय रहता है।

Q1. व्यवस्थित समीक्षाओं में एआई-सहायता प्राप्त स्क्रीनिंग के लिए न्यूनतम स्वीकार्य रिकॉल क्या है?

A. 80%
B. 90%
C. >95%
D. 100%

Module 19 Complete

"मशीन तेजी से पढ़ती है। इंसान गहराई से पढ़ता है। साथ में, वे सत्य पढ़ते हैं।"

प्रत्येक संकेत सत्य नहीं है।

मॉड्यूल 20: गुणात्मक

============================================================= मॉड्यूल 20: गुणात्मक (बोहरेन 2015 - मातृत्व देखभाल) ===============================================

तरीके मरीज़ों को हमारे आत्मविश्वास से बचाते हैं।

मॉड्यूल 20: गुणात्मक

🎯 Learning Objectives

  • Explain why some questions require qualitative evidence synthesis
  • Describe meta-ethnography (Noblit & Hare) and thematic synthesis
  • Apply the CERQual framework to assess confidence in qualitative findings
  • Understand mixed-methods synthesis approaches
  • Recognize when qualitative evidence changes practice

WHO ने पूछा सवाल

कोई भी आरसीटी उत्तर नहीं दे सका।

दुनिया भर में महिलाओं को प्रसव के दौरान अपमान और दुर्व्यवहार का अनुभव क्यों होता है? बोहरेन एट अल. (2015) ने 34 देशों के 65 गुणात्मक अध्ययनों को दुर्व्यवहार के सात डोमेन के ढांचे में संश्लेषित किया।

स्लाइड ए: यादृच्छिकीकरण से परे एक प्रश्न

2014 में, WHO ने एक वैश्विक संकट से निपटने के लिए एक पैनल का गठन किया: महिलाओं को शारीरिक रूप से प्रताड़ित किया जा रहा था, मौखिक रूप से अपमानित किया जा रहा था, और प्रसव के दौरान देखभाल से इनकार किया जा रहा था। यह कोई दुर्लभ घटना नहीं थी - रिपोर्टें आईं 34 countries.

They needed to understand WHY. What drives disrespect and abuse in maternity care?

कोई भी आरसीटी इसका उत्तर नहीं दे सका। आप महिलाओं को अपमानजनक बनाम सम्मानजनक देखभाल में यादृच्छिक नहीं बना सकते। आप जन्म परिचारकों को अंधा नहीं कर सकते। आप "गरिमा" को लिकर्ट पैमाने पर नहीं माप सकते। साक्ष्य गुणात्मक होना चाहिए।

Developed by Noblit & Hare (1988), meta-ethnography translates संख्याओं को एकत्र करने के बजाय अध्ययनों में अवधारणाएँ। यह पहले-क्रम (प्रतिभागी उद्धरण) और दूसरे-क्रम (लेखक व्याख्या) डेटा से नई व्याख्यात्मक रूपरेखा (तीसरे क्रम की संरचनाएं) तैयार करता है।

Reciprocal
अध्ययन एक दूसरे की पुष्टि करते हैं
Refutational
अध्ययन एक-दूसरे का खंडन करते हैं
Line of
argument
अध्ययन एक नए सिद्धांत का निर्माण करता है

What Bohren Found: A Taxonomy of Mistreatment

1. Physical abuse

Hitting, pinching, slapping during labor

2. Sexual abuse

Inappropriate touching, non-consensual procedures

3. Verbal abuse

Shouting, threats, judgmental comments

4. Stigma & discrimination

Based on HIV status, ethnicity, age, poverty

5. Professional standards failure

Neglect, lack of informed consent

6. Poor rapport

Poor communication, dismissiveness

7. Health system conditions

Overcrowding, understaffing, lack of supplies

65 अध्ययन. 34 देश. भाषाओं, संस्कृतियों और प्रणालियों में समान पैटर्न दोहराए जाते हैं। ये कोई किस्सा नहीं था. यह संश्लेषित साक्ष्य था.

Researcher

CERQual assesses confidence in qualitative review findings across four components:

1

Methodological Limitations

योगदान अध्ययन की गुणवत्ता.

2

Coherence

डेटा कितनी अच्छी तरह खोज का समर्थन करता है।

3

Adequacy

डेटा की समृद्धि (सिर्फ अध्ययनों की संख्या नहीं)।

4

Relevance

समीक्षा प्रश्न के संदर्भ में प्रयोज्यता.

स्लाइड सी: साक्ष्य से कार्रवाई तक

Bohren's synthesis informed the WHO's 2018 Recommendations on Intrapartum Care for a Positive Childbirth Experience. Specific changes grounded in qualitative evidence:

Rec. 15
Companionship during labor
Rec. 1
Respectful maternity care
Rec. 3
Effective communication
Rec. 12
Emotional support

ये सिफ़ारिशें - गुणात्मक साक्ष्य पर आधारित - अब 194 WHO सदस्य देशों में मातृत्व देखभाल का मार्गदर्शन करती हैं। कोई भी वन भूखंड उन्हें उत्पन्न नहीं कर सकता था। कोई भी I² आँकड़ा उन्हें प्रकट नहीं कर सकता था।

Bohren's Framework of Mistreatment

2015 के गुणात्मक संश्लेषण ने सात डोमेन की पहचान की: शारीरिक शोषण, यौन शोषण, मौखिक दुर्व्यवहार, कलंक और भेदभाव, पेशेवर मानकों को पूरा करने में विफलता, खराब तालमेल और स्वास्थ्य प्रणाली की स्थिति। इस ढांचे ने अंतर्गर्भाशयी देखभाल (2018) पर डब्ल्यूएचओ की सिफारिशों की जानकारी दी।

कोई भी पी-वैल्यू प्रसव के दौरान थप्पड़ मारे जाने के अनुभव को नहीं पकड़ सकता। गुणात्मक संश्लेषण ने उस बात को आवाज़ दी जो संख्याएँ नहीं दे सकीं।

ROOT: क्या आपका शोध प्रश्न अनुभवों, धारणाओं, बाधाओं या सुविधाकर्ताओं के बारे में है?

YES → क्या आपका प्रश्न कैसे या क्यों के बारे में है, न कि केवल क्या के बारे में?

  • Yes: Qualitative evidence synthesis (meta-ethnography, thematic synthesis, or framework synthesis)
  • No: मिश्रित विधियों पर विचार करें: प्रभाव के लिए मात्रात्मक + तंत्र के लिए गुणात्मक

NO → क्या आपका प्रश्न प्रभावशीलता/प्रभावकारिता के बारे में है?

  • Yes: Quantitative meta-analysis
  • But: कार्यान्वयन बाधाओं की गुणात्मक समीक्षा के साथ पूरक (CERQual-मूल्यांकन)

Key insight: सबसे मजबूत व्यवस्थित समीक्षाएँ दोनों का उत्तर देती हैं: क्या यह काम करता है? (मात्रात्मक) और यह काम क्यों करता है या असफल क्यों होता है? (गुणात्मक)

Q1. What distinguishes meta-ethnography from quantitative meta-analysis?

A. इसमें केवल 3-5 अध्ययन शामिल हैं
B. It translates concepts across studies rather than pooling numbers
C. It does not require a systematic search
D. It is less rigorous than quantitative synthesis

Module 20 Complete

"हर चीज़ जो मायने रखती है उसे गिना नहीं जा सकता। हर चीज़ जो मायने रखती है वह मायने नहीं रखती।"

विषमता एक संदेश है, शोर नहीं।

मॉड्यूल 21: बहुभिन्नरूपी

============================================================= मॉड्यूल 21: मल्टीवेरिएट (सहसंबद्ध परिणाम / आरवीई) ===============================================

विषमता एक संदेश है, शोर नहीं।

मॉड्यूल 21: बहुभिन्नरूपी

🎯 Learning Objectives

  • पहचानें कि किसी अध्ययन के परिणाम कब सहसंबद्ध होते हैं
  • Explain multivariate random-effects models
  • Apply robust variance estimation (RVE) for dependent effect sizes
  • नेस्टेड डेटा के लिए तीन-स्तरीय मॉडल को समझें
  • Choose between multivariate approaches based on data structure

Cardiovascular trials report

मृत्यु दर, एमआई, स्ट्रोक, और बहुत कुछ।

ये परिणाम मरीजों के भीतर सहसंबद्ध हैं। जिस मरीज की मृत्यु हो जाती है, उसके पास एमआई एंडपॉइंट नहीं हो सकता है। मानक मेटा-विश्लेषण प्रत्येक परिणाम को स्वतंत्र रूप से मानता है - निर्भरता और संभावित रूप से दोहरी गिनती के साक्ष्य को अनदेखा करता है।

स्लाइड ए: सुविधा झूठ

कोई भी मानक मेटा-विश्लेषण पाठ्यपुस्तक खोलें। मॉडल मानते हैं कि प्रत्येक अध्ययन योगदान देता है one independent effect size. But reality is different.

एक एकल हृदय परीक्षण मृत्यु दर, रोधगलन, स्ट्रोक और पुनरोद्धार की रिपोर्ट करता है। एक एकल मनोचिकित्सा अध्ययन 3, 6 और 12 महीनों में अवसाद, चिंता और जीवन की गुणवत्ता की रिपोर्ट करता है।

30 trials
× 4 outcomes
= 120
effect sizes

Most analysts either: (a) treat all 120 as independent (inflating precision by a factor of √4), or (b) एक परिणाम चुनें और बाकी को त्याग दें। दोनों दृष्टिकोण ग़लत हैं.

In standard pairwise meta-analysis, each study contributes one effect size. But many studies report multiple outcomes, subgroups, timepoints, or arms—creating dependent प्रभाव आकार. इसे अनदेखा करने से सटीकता बढ़ जाती है और अनुमान विकृत हो जाता है।

RVE
Robust Variance Estimation. Sandwich estimator handles unknown correlation.
3-Level
Study → Outcome nesting modeled explicitly.
Researcher

RVE (Hedges, Tipton & Johnson, 2010) uses a sandwich-type अनुमानक जो आश्रित प्रभावों के बीच वास्तविक सहसंबंध की परवाह किए बिना वैध मानक त्रुटियां प्रदान करता है। अध्ययन के भीतर सहसंबंध को जानने या अनुमान लगाने की कोई आवश्यकता नहीं है। ≥20 अध्ययन के लिए सर्वोत्तम।

Small-sample correction: टिपटन और पुस्टेजोव्स्की (2015) ने आरवीई के लिए छोटे-नमूना सुधार (सीआर2) विकसित किए, जब समूहों की संख्या कम होती है तो स्वतंत्रता की सैटरथवेट डिग्री का उपयोग किया जाता है।

स्लाइड बी: गणितीय सत्य
Researcher

What Dependence Does to Your Confidence Intervals

यदि एक ही अध्ययन के 4 परिणामों में अध्ययन के भीतर सहसंबंध है ρ = 0.5:

Treating as independent

CI width = X

निर्भरता के लिए लेखांकन

CI width = 1.58X

आपका कॉन्फिडेंस इंटरवल होना चाहिए 58% wider. प्रत्येक मेटा-विश्लेषण जिसने इसे नजरअंदाज किया, उसने गलत सटीक परिणाम प्रकाशित किए।

RVE (Hedges, Tipton & Johnson, 2010): Uses a “sandwich” variance estimator that produces correct standard errors without needing to know the exact within-study correlation.

Researcher
1

Level 1: Sampling Variance

Measurement error within each effect size estimate.

2

Level 2: Within-Study Variance

एक ही अध्ययन में परिणाम और समय-बिंदु अलग-अलग होते हैं।

3

Level 3: Between-Study Variance

जनसंख्या, सेटिंग और तरीकों में अध्ययन एक दूसरे से भिन्न होते हैं।

Example: अवसाद के लिए मनोचिकित्सा के मेटा-विश्लेषण में (k=50 अध्ययन, 180 प्रभाव आकार), 35% भिन्नता का अध्ययन (अलग-अलग परिणाम) के भीतर था और 65% अध्ययन के बीच था (विभिन्न उपचार, आबादी)। इस विघटन से पता चलता है कि विविधता कितनी है within vs between studies.

Methodologist

जब प्रभाव निहित होते हैं (उदाहरण के लिए, अध्ययन के भीतर कई परिणाम, या अनुसंधान समूहों के भीतर अध्ययन), ए three-level model विभाजन में भिन्नता है: (1) नमूना भिन्नता (स्तर 1), (2) अध्ययन के भीतर भिन्नता (स्तर 2), और (3) अध्ययन के बीच भिन्नता (स्तर 3)। यह सभी स्तरों पर ताकत उधार लेते समय सही अनुमान बनाए रखता है।

हृदय संबंधी चुनौती

स्टैटिन के मेटा-विश्लेषण में 30 परीक्षण शामिल हो सकते हैं, प्रत्येक मृत्यु दर, एमआई, स्ट्रोक और पुनरोद्धार की रिपोर्टिंग करता है। यानी 30 समूहों से 120 प्रभाव आकार। उन्हें 120 स्वतंत्र अनुमानों के रूप में मानने से अध्ययन के भीतर सहसंबंध से संबंधित कारक द्वारा सटीकता बढ़ जाती है।

RVE or multivariate models handle this correctly—producing wider, honest confidence intervals.

ROOT: क्या आपके मेटा-विश्लेषण के प्रति अध्ययन कई प्रभाव हैं?

YES → क्या आप अध्ययन के भीतर सहसंबंधों को जानते हैं (या अनुमान लगा सकते हैं)?

  • Yes: Multivariate random-effects model (most efficient)
  • No: RVE with small-sample correction (robust to unknown correlations)

NO → Standard univariate random-effects model

Sub-question: क्या आपके एकाधिक प्रभाव विभिन्न परिणामों, समय बिंदुओं या उपसमूहों से हैं?

  • Different outcomes → Three-level model or RVE with clustering
  • Different timepoints → Network of timepoints with temporal correlation
  • Different subgroups → Consider if subgroups are meaningful or should be averaged

Q1. What problem does Robust Variance Estimation (RVE) solve?

A. Publication bias
B. एक ही अध्ययन से अनेक प्रभाव आकारों के बीच निर्भरता
C. Between-study heterogeneity
D. Small-study effects

Module 21 Complete

"जब परिणाम उलझे हुए हों, तो यह दिखावा करना कि वे स्वतंत्र हैं, सुविधा का झूठ है।"

बिना मूल के संख्या एक संख्या नहीं है।

मॉड्यूल 22: प्रमाण

============================================================= मॉड्यूल 22: प्रमाण (रेनहार्ट-रोगॉफ एक्सेल त्रुटि) ===============================================

बिना मूल के संख्या एक संख्या नहीं है।

मॉड्यूल 22: प्रमाण

🎯 Learning Objectives

  • Understand how computational errors propagate through policy
  • प्रतिलिपि प्रस्तुत करने योग्यता को परिभाषित करें और प्रतिकृति योग्यता से अंतर बताएं
  • साक्ष्य हैशिंग और सबूत रखने वाले नंबर लागू करें
  • Use reproducibility checklists for meta-analysis
  • पूर्व-पंजीकरण और खुले डेटा की भूमिका को पहचानें

A graduate student opened a spreadsheet

और पाया कि तपस्या युग का निर्माण एक त्रुटि पर हुआ था।

2010 में, रेनहार्ट और रोगॉफ़ ने दावा किया कि 90% से अधिक ऋण-से-जीडीपी अनुपात वाले देशों में नकारात्मक वृद्धि हुई है। इसने पूरे यूरोप में मितव्ययता नीतियों को प्रभावित किया। 2013 में, थॉमस हेरंडन को एक एक्सेल त्रुटि मिली जिसने 5 देशों को औसत से बाहर कर दिया। सही परिणाम: मामूली सकारात्मक वृद्धि, पतन नहीं।

Reproducible
Same data + same code = same result
Replicable
नया डेटा + समान विधियाँ = सुसंगत परिणाम

Reproducibility is the minimum standard. यदि अन्य लोग आपके रिपोर्ट किए गए डेटा से आपके एकत्रित अनुमान को पुन: प्रस्तुत नहीं कर सकते हैं, तो विश्लेषण सत्यापित नहीं किया जा सकता है। मेटा-विश्लेषण को साझा करना चाहिए: निकाले गए डेटा, विश्लेषण स्क्रिप्ट, सॉफ़्टवेयर संस्करण और यादृच्छिक बीज।

Researcher

Every number in a meta-analysis should carry its provenance: यह कहां से आया, इसे कैसे रूपांतरित किया गया, और किस कोड ने इसे निर्मित किया। Evidence hashing creates a cryptographic fingerprint of inputs so any change (accidental or deliberate) is detectable.

SHA

Input Hash

निकाले गए डेटा का SHA-256 हैश। यदि एक सेल बदलता है, तो हैश बदल जाता है। उद्गम श्रृंखला: डेटा → कोड → परिणाम → हैश।

मेटा-विश्लेषण की प्रतिलिपि प्रस्तुत करने योग्यता का आकलन करने के लिए प्रत्येक आइटम की जाँच करें। आपकी समीक्षा का स्कोर कैसा है?

एक्सेल त्रुटि जिसने अर्थव्यवस्थाएं बदल दीं

रेनहार्ट-रोगॉफ की "ऋण के समय में वृद्धि" को कांग्रेस की गवाही, यूरोपीय आयोग की रिपोर्ट और आईएमएफ नीति संक्षेप में उद्धृत किया गया था। एक्सेल त्रुटि (पंक्तियों 30-34 को औसत सूत्र से बाहर रखा गया था) का मतलब था कि पांच देश-ऑस्ट्रेलिया, ऑस्ट्रिया, बेल्जियम, कनाडा और डेनमार्क-बस गायब थे।

संशोधित औसत -0.1% से +2.2% हो गया। मितव्ययिता नीतियों ने लाखों लोगों को प्रभावित किया। पुनरुत्पादकता अकादमिक पूर्णतावाद नहीं है - यह आपदा के खिलाफ सुरक्षा है।

Remember Module 5?

DECREASE Through the Lens of Reproducibility

डॉन पोल्डरमैन्स द्वारा किए गए DECREASE परीक्षणों को मनगढ़ंत डेटा के लिए वापस ले लिया गया था। यदि सबूत देने वाली संख्याएँ मौजूद होतीं - हैश किए गए इनपुट, उद्गम श्रृंखलाएँ, सत्यापित गणनाएँ - तो निर्माण का पता लगाया जा सकता था before सबूतों ने मेटा-विश्लेषण में प्रवेश किया और सर्जिकल दिशानिर्देश बदल दिए।

Q1. रेनहार्ट-रोगॉफ़ त्रुटि क्या थी?

A. They used too small a sample
B. An Excel formula excluded 5 countries, reversing the conclusion
C. They studied the wrong time period
D. They used the wrong statistical test

Module 22 Complete

"उद्गम के बिना संख्या कोई संख्या नहीं है। पुनरुत्पादन के बिना विश्लेषण साक्ष्य नहीं है।"

Certainty must be earned, not assumed.

मॉड्यूल 23: आपका पहला मेटा-स्प्रिंट

मॉड्यूल 23: कैपस्टोन - आपका पहला मेटा-स्प्रिंट

Certainty must be earned, not assumed.

मॉड्यूल 23: आपका पहला मेटा-स्प्रिंट

🎯 Learning Objectives

  • 40-दिवसीय व्यवस्थित समीक्षा वर्कफ़्लो को समझें
  • Map the Seven Principles to real practice phases
  • Recognize Definition-of-Done (DoD) gates as quality checkpoints
  • Appreciate why structure prevents the failures you've studied
  • Graduate ready to conduct (not just understand) meta-analysis
यात्रा पूर्ण

आपने कहानियाँ सीख ली हैं।

अब तुम्हें मार्ग पर चलना होगा।

आपके द्वारा अध्ययन किए गए प्रत्येक साक्ष्य में उलटफेर टीमों के कारण हुआ knew तरीकों लेकिन नहीं किया follow them systematically.

मेटा-स्प्रिंट फ्रेमवर्क

5 चरण द्वारों के साथ 40-दिवसीय संरचित कार्यप्रवाह। प्रत्येक गेट एक डेफिनिशन-ऑफ-डन (डीओडी) चेकपॉइंट है जो गुणवत्ता सुनिश्चित होने तक आपको आगे बढ़ने से रोकता है।

40
Days to Completion
5
DoD Phase Gates
Day 34
Hard Freeze

Why 40 days? कठोरता के लिए काफी लंबा, गुंजाइश रेंगने से रोकने के लिए काफी छोटा। रोसिग्लिटाज़ोन कार्डियक सिग्नल वर्षों तक दबे रहे क्योंकि पारदर्शिता के लिए कोई समय सीमा नहीं थी।

पांच द्वार
A

DoD-A: Protocol Lock (Days 1-3)

PICOS defined, timepoint rules set, model choices pre-specified. No moving target.

B

DoD-B: Search Lock (Days 6-10)

All databases searched, grey literature checked, PRESS validated. No hidden studies.

C

DoD-C: Extraction Lock (Days 10-28)

Dual extraction, provenance linked, RoB assessed. No fabricated numbers.

D

डीओडी-डी: विश्लेषण लॉक (दिन 21-33)

Forest plots generated, sensitivity analyses run, heterogeneity explored. No cherry-picking.

E

DoD-E: Submission Lock (Days 33-40)

GRADE certainty rated, clinical summary written, manuscript finalized. No overconfidence.

Day 34 Freeze: दिन 34 के बाद कोई नया अध्ययन नहीं जोड़ा जा सकता है। यह "हथियारयुक्त स्कोप रेंगना" को रोकता है जिसने बीएमपी स्पाइन सर्जरी मेटा-विश्लेषण को प्रभावित किया है, जहां उद्योग अनुकूल अध्ययन "ढूंढता" रहा।

Every principle you learned maps to a specific phase gate:

DoD-A "हर संकेत सत्य नहीं होता"- पूर्व-निर्दिष्ट करें कि साक्ष्य के रूप में क्या गिना जाता है
DoD-B "What was hidden in plain sight?" — Search comprehensively
DoD-C "उत्पत्ति के बिना संख्या कोई संख्या नहीं है"- प्रत्येक डेटा बिंदु को लिंक करें
DoD-D "विषमता एक संदेश है, शोर नहीं" — Investigate, don't ignore
DoD-E "Certainty must be earned, not assumed" — GRADE everything

रेड-टीम सिद्धांत

आपकी ही टीम आपके काम में बाधा डालने की कोशिश करती है.

हर दिन, दो घूमने वाली टीम के सदस्य विरोधियों के रूप में डेटा गुणवत्ता की जांच करने में 12 मिनट बिताते हैं। इस तरह बोल्ड्ट की धोखाधड़ी पकड़ी गई - मैत्रीपूर्ण समीक्षा से नहीं, बल्कि संदेहपूर्ण जाँच से जिसने असंभव भर्ती दरों को देखा।

What happens when you discover a critical problem mid-sprint?

CondGO = Conditional Go

A bounded rescue protocol. You have exactly 72 hours केवल अनुमत क्रियाओं का उपयोग करके समस्या को ठीक करना। यदि आप इसे ठीक नहीं कर सकते, तो आपको समीक्षा रोक देनी चाहिए।

📖 अवंदिया पाठ: जीएसके ने 2000 में कार्डियोवैस्कुलर सिग्नल देखे लेकिन कोई अनिवार्य समय सीमा नहीं थी। उन्होंने 7 वर्षों तक "देखा और इंतजार किया"। हज़ारों लोगों को नुकसान पहुँचाया गया। CondGO मौजूद है क्योंकि "आखिरकार हम इससे निपटेंगे" लोगों को मारता है।

आपने इस पाठ्यक्रम की शुरुआत कहानियों से की।

आप इसे अभ्यास के लिए तैयार करके समाप्त करें।

मेटा-स्प्रिंट वर्कफ़्लो आपके द्वारा सीखी गई हर चीज़ को लेता है और इसे 40-दिवसीय प्रणाली में संरचित करता है जो आपके द्वारा अध्ययन की गई विफलताओं को रोकता है।

जब आप वास्तविक व्यवस्थित समीक्षा करने के लिए तैयार हों, तो मेटा-स्प्रिंट एप्लिकेशन खोलें। आपने यहाँ जो कहानियाँ सीखी हैं वे आपका मार्गदर्शन करेंगी—हर कदम पर अनुस्मारक के रूप में प्रकट होंगी।

कहानी: सीटीटी सहयोग - जब तरीके लाखों बचाते हैं

What does it look like when every principle is followed?

REAL DATA

कोलेस्ट्रॉल ट्रीटमेंट ट्रायलिस्ट्स (सीटीटी) सहयोग मेटा-विश्लेषण का स्वर्ण मानक है। उन्होंने प्राप्त किया 170,000+ प्रतिभागियों से व्यक्तिगत रोगी डेटा across 26 statin trials. Pre-specified protocol. IPD from all major trials. Standardized outcomes. Result: statins reduce major vascular events by 21% per mmol/L LDL reduction (RR 0.79, 95% CI 0.77-0.81), regardless of baseline risk. This finding, replicated across 15 वर्षों में 5 मेटा-विश्लेषण, has prevented an estimated millions of heart attacks and strokes worldwide.

सात सिद्धांत लागू
सीटीटी कहानी दिखाती है कि जब इस पाठ्यक्रम के प्रत्येक सिद्धांत का पालन किया जाता है तो क्या होता है। विकल्प पर विचार करें:
पथ ए: सिद्धांतों के बिना
No protocol. Published data only. No RoB. No heterogeneity investigation. No GRADE.
Conflicting small trials. Statin controversy persists. Millions untreated.
OUTCOME: Preventable cardiovascular deaths continue
पथ बी: सीटीटी मार्ग
पूर्व-पंजीकृत प्रोटोकॉल. सभी परीक्षणों से आई.पी.डी. मानकीकृत परिणाम. पारदर्शी तरीके. ग्रेड उच्च निश्चितता।
निश्चित उत्तर. वैश्विक दिशानिर्देश बदलते हैं। स्टैटिन उन लोगों के लिए निर्धारित हैं जिन्हें लाभ होता है।
OUTCOME: Millions of lives saved by rigorous evidence synthesis
THE REVELATION
इस पाठ्यक्रम में प्रत्येक सिद्धांत मौजूद है क्योंकि इसकी अनुपस्थिति से नुकसान हुआ है। सीटीटी सहयोग साबित करता है कि जब विधियां कठोर होती हैं, जब डेटा की उत्पत्ति होती है, जब पूर्वाग्रह का आकलन किया जाता है और निश्चितता अर्जित की जाती है - मेटा-विश्लेषण चिकित्सा में सबसे शक्तिशाली उपकरण बन जाता है। अब आप इन सिद्धांतों को अपनाएं। उनका उपयोग करें।

1. मेटा-स्प्रिंट में 34वें दिन "हार्ड फ़्रीज़" का उद्देश्य क्या है?

A. सहकर्मी समीक्षा के लिए समय देना
बी. देर से जोड़े गए अध्ययनों को परिणामों में हेरफेर करने से रोकने के लिए
C. To speed up publication
डी. जर्नल की समय सीमा के साथ समन्वय स्थापित करना

2. The CondGO protocol gives teams how long to fix critical problems?

A. 24 hours
B. 48 hours
C. 72 hours
D. 1 week

3. Red-team adversarial QA caught Joachim Boldt's fraud by noticing:

A. Impossible patient recruitment rates
B. p-hacking in statistical tests
C. Inconsistent effect sizes
D. Whistleblower testimony

जो कहानियाँ आपने सीखी हैं वे इतिहास नहीं हैं।

वे चेतावनियाँ हैं जो आपके भविष्य के काम की रक्षा करती हैं।

जब आप अपना पहला मेटा-विश्लेषण करते हैं, तो
remember CAST before you trust a signal,
remember Poldermans before you skip provenance,
फ़नल को अनदेखा करने से पहले रीबॉक्सेटीन याद रखें।

अब आप तैयार हैं। संरचना के साथ चलें. नम्रता से चलो. सात सिद्धांतों के साथ आगे बढ़ें।

प्रत्येक संकेत सत्य नहीं है।

मॉड्यूल 24: अंतिम परीक्षा

Certainty must be earned, not assumed.

Final Examination

मेटा-विश्लेषण सिद्धांतों में अपनी महारत का परीक्षण करें। प्रत्येक प्रश्न पाठ्यक्रम की एक मूल अवधारणा को संबोधित करता है।

Q1. एक शोधकर्ता "स्वास्थ्य पर व्यायाम के प्रभाव" का अध्ययन करना चाहता है। इस शोध प्रश्न के साथ प्राथमिक समस्या क्या है?

A. It lacks randomization
B. Sample size is too small
C. It is not answerable—lacks specific PICO elements
D. It lacks ethical approval

Q2. एक फ़नल प्लॉट निचले-बाएँ क्षेत्र में लापता अध्ययनों के साथ स्पष्ट विषमता दिखाता है। यह क्या सुझाव देता है?

A. Large studies have more precise estimates
B. छोटे नकारात्मक अध्ययनों के अप्रकाशित होने की संभावना है
C. The true effect is stronger than estimated
D. Random sampling error

Q3. एक मेटा-विश्लेषण रिपोर्ट I² = 85% और τ² = 0.42 है। सबसे उपयुक्त व्याख्या क्या है?

A. There is an 85% chance of a true effect
B. The effect size is very large
C. Substantial between-study variance exists; investigate sources
D. परिणाम चिकित्सकीय रूप से महत्वपूर्ण हैं

Q4. GRADE में, यादृच्छिक नियंत्रित परीक्षणों से साक्ष्य के एक समूह के लिए प्रारंभिक निश्चितता क्या है?

A. High
B. Moderate
C. Low
D. Very low

Q5. In RoB 2.0, which domain assesses whether outcome assessors knew the treatment allocation?

A. D1: Randomization process
B. D2: इच्छित हस्तक्षेप से विचलन
C. D3: लापता परिणाम डेटा
D. D4: परिणाम का मापन

Q6. CAST परीक्षण से पता चला कि अतालता को दबाने के बावजूद एंटीरैडमिक दवाओं ने मृत्यु दर में वृद्धि की। यह इसका एक उदाहरण है:

A. Random sampling error
B. Surrogate outcome failure
C. Confounding by indication
D. Reverse causation

Q7. When should a random-effects model be preferred over a fixed-effect model?

A. When sample sizes are large
B. जब परिणाम द्विआधारी होते हैं
C. When between-study heterogeneity is expected
D. When publication bias is suspected

Q8. According to ICEMAN criteria, which makes a subgroup analysis MORE credible?

A. Hypothesis specified a priori
B. Large number of subgroups tested
C. No biological rationale
D. Inconsistent effects across trials within subgroup

Q9. What assumption must be checked in network meta-analysis to ensure valid indirect comparisons?

A. All studies have equal sample sizes
B. सभी अध्ययन एक ही परिणाम को मापते हैं
C. Transitivity (consistency of effect modifiers)
D. Double-blinding in all trials

Q10. परीक्षण अनुक्रमिक विश्लेषण (टीएसए) में, निरर्थकता सीमा को पार करना क्या दर्शाता है?

A. उपचार का कारण बनता है नुकसान
B. आगे के अध्ययनों से कोई सार्थक प्रभाव दिखने की संभावना नहीं है
C. साक्ष्य लाभ के लिए निर्णायक है
D. मेटा-विश्लेषण कमज़ोर है

Part 1 Complete — continue to Part 2 (Advanced Modules)

भाग 2: उन्नत मॉड्यूल प्रश्न (Q11-Q25)

Questions 11–25 cover Modules 13–22 (Bayesian, NMA, IPD, Dose-Response, Fragility, Equity, AI, Qualitative, Multivariate, Reproducibility).

Q11. बायेसियन मेटा-विश्लेषण में, क्या होता है जब आप कई अध्ययनों के साथ एक अस्पष्ट पूर्व का उपयोग करते हैं?

A. पश्चवर्ती लगातार परिणाम से मेल खाता है
B. पूर्ववर्ती पश्च पर हावी होता है
C. The credible interval becomes infinitely wide
D. मॉडल विफल रहता है अभिसरण

Q12. सिप्रियानी के अवसादरोधी एनएमए में, किसी भी एक दवा को "विजेता" क्यों घोषित नहीं किया गया?

A. बहुत कम अध्ययन
B. Different drugs ranked best on different outcomes
C. कोई अप्रत्यक्ष साक्ष्य उपलब्ध नहीं था
D. SUCRA नहीं हो सका गणना की गई

Q13. आपको आईपीडी को कभी भी एक मेगा-ट्रायल से पूल क्यों नहीं करना चाहिए?

A. IPD always has fewer studies than aggregate
B. यह अध्ययन क्लस्टरिंग को नजरअंदाज करता है और उलझन का परिचय देता है
C. यह समय-दर-घटना डेटा को संभाल नहीं सकता है
D. Binary outcomes cannot be pooled

Q14. What caused the alcohol "J-curve" to disappear in Stockwell's reanalysis?

A. नए अध्ययन जोड़े गए जिनसे पता चला कि कोई लाभ
B. पूर्व शराब पीने वालों को सही ढंग से परहेज़कर्ता संदर्भ समूह से हटा दिया गया था
C. नमूने का आकार बढ़ाया गया था
D. गलतफहमियों के लिए बेहतर समायोजन

Q15. ओसेल्टामिविर गाथा में, अप्रकाशित तक पहुँचने पर कोक्रेन ने क्या खोजा नैदानिक अध्ययन रिपोर्ट?

A. दवा पूरी तरह से अप्रभावी थी
B. प्रभाव मूल रूप से जितना सोचा गया था उससे कहीं अधिक बड़ा था
C. जटिलताओं के लिए लाभ काफी हद तक गायब हो गया
D. Side effects were more common than reported

Q16. अमेरिका के कितने प्रतिशत उच्च रक्तचाप से ग्रस्त मरीज SPRINT परीक्षण के लिए योग्य नहीं होंगे?

A. About 25%
B. About 50%
C. Over 75%
D. Nearly 100%

Q17. Why is AI considered an "augmenter" rather than a "replacer" in systematic reviews?

A. AI is slower than human reviewers
B. AI has perfect recall
C. AI screens fast but cannot make human-level contextual judgments
D. AI is too expensive for most reviews

Q18. What does the "adequacy" component of CERQual assess?

A. अध्ययन की संख्या केवल
B. निष्कर्ष का समर्थन करने वाले डेटा की समृद्धि और मात्रा
C. अध्ययनों में निष्कर्षों की संगति
D. Generalizability to other populations

Q19. A meta-analysis includes 30 statin trials, each reporting 4 correlated outcomes (120 effect sizes). Which approach is correct?

A. Treat all 120 as independent effect sizes
B. Use RVE with small-sample correction
C. Pick only one outcome per study
D. प्रत्येक अध्ययन के भीतर 4 परिणामों का औसत

Q20. रेनहार्ट-रोगॉफ़ त्रुटि में, सही औसत वृद्धि दर क्या थी उच्च ऋण वाले देश?

A. −0.1% (same as claimed)
B. +2.2%
C. 0%
D. +5%

Passing Score: 15/20 across both parts

संबंधित मॉड्यूल पर वापस लौटकर किसी भी छूटे हुए प्रश्न की समीक्षा करें। प्रत्येक प्रश्न एक मूल अवधारणा का परीक्षण करता है।

प्रत्येक संकेत सत्य नहीं है।

तरीके मरीज़ों को हमारे आत्मविश्वास से बचाते हैं।

Congratulations

आपने साक्ष्य उत्क्रमण: एक मेटा-विश्लेषण पाठ्यक्रम पूरा कर लिया है।

आपका संश्लेषण सत्य से, आपकी पूलिंग ज्ञान से,
और आपके निष्कर्ष विनम्रता से निर्देशित हों।

सात सिद्धांत:

"हर संकेत सत्य नहीं होता।"

"तरीके मरीज़ों को हमारे आत्मविश्वास से बचाते हैं।"

"What was hidden in plain sight?"

"बिना उत्पत्ति के संख्या कोई संख्या नहीं है।"

"विषमता एक संदेश है, शोर नहीं।"

"साक्ष्य का अभाव अनुपस्थिति का प्रमाण नहीं है।"

"Certainty must be earned, not assumed."

"हमें सीधे रास्ते पर मार्गदर्शन करें..."