إمكانية الوصول: إعلانات قارئ الشاشة لتغييرات الشرائح
حاوية الشرائح
الوحدة 0: الافتتاحية

ليست كل إشارة حقيقة.

🎯 أهداف التعلم

  • تعريف التحليل التلوي وشرح دوره في تركيب الأدلة
  • تحديد متى لا ينبغي إجراء الدراسات مجمعة
  • وصف التسلسل الهرمي للأدلة وموقع المراجعات المنهجية
  • إدراك أن التحليل التلوي يمكن أن يكون مضللاً عندما يتم إجراؤه بشكل سيئ
  • تذكر المبادئ السبعة التي ترتكز عليها هذه الدورة

هذه الدورة موجودة لأن

كان الطب خاطئًا.

لا مرة واحدة. ليس نادرا. مرارا. بطرق قتلت المرضى الذين كانوا يثقون في صحة الأدلة.

طريقة إحصائية للجمع بين نتائج دراسات مستقلة متعددة تتناول نفس السؤال.

1976
المصطلح الذي صاغه جين جلاس
~50,000
يُنشر سنويًا
#1
التسلسل الهرمي للأدلة*

* عند إجرائه بشكل جيد. إن جودة السلوك لها أهمية أكبر من تصميم الدراسة وحده — كما تعترف GRADE.

1

زيادة القوة الإحصائية

قد تكون الدراسات الفردية أصغر من أن تتمكن من اكتشاف التأثيرات.

2

تحسين الدقة

فترات ثقة أضيق حول تقديرات التأثير.

3

حل الخلاف

عندما تتعارض الدراسات، يمكن للتجميع توضيح الإشارة.

4

استكشاف عدم التجانس

حدد سبب اختلاف التأثيرات عبر المجموعات السكانية أو الإعدادات.

لكن التحليل التلوي يمكنه ذلك أيضًا

مضلل

وعندما يتم القيام بذلك بشكل سيء، فإنه يؤدي إلى تضخيم التحيز بدلاً من الحقيقة.

1

تقيس الدراسات أشياء مختلفة بشكل أساسي (التفاح والبرتقال)

2

عدم التجانس الشديد الذي لا يمكن تفسيره

3

دراسة واحدة تهيمن على جميع الدراسات الأخرى (مشكلة الدراسة الضخمة)

4

تحتوي الدراسات على مخاطر عالية للتحيز لا يمكن تعديلها

التجميع هو امتياز وليس حق.

ويجب الدفاع عن قرار الدمج.

المراجعات المنهجية والتحليلات التلوية للتجارب المعشاة ذات الشواهد

التجارب المعشاة ذات الشواهد

دراسات الأتراب

دراسات الحالات والشواهد

سلسلة الحالات / رأي الخبراء

ويعتمد الموقع في التسلسل الهرمي على جودة المنهجية، وليس على نوع الدراسة وحده.

يتم تدريس هذه الدورة من خلال

عكس الأدلة.

تبدأ كل وحدة بقصة توضح كيف أخطأ الطب في فهم الأمور. ثم نتعلم الطريقة التي كانت ستمنع الضرر.

ستعود هذه العبارات طوال رحلتك:

1. "ليست كل إشارة هي الحقيقة."

2. "أساليب تحمي المرضى من ثقتنا."

3. "ما الذي كان مخفيا على مرأى من الجميع؟"

4. "الرقم بدون مصدر ليس رقمًا."

5. "التباين هو رسالة، وليس ضجيجا."

6. "غياب الدليل ليس دليلاً على الغياب"

7. "اليقين يجب أن يُكتسب، لا أن يُفترض."

1. لماذا لا ينبغي عليك في بعض الأحيان تجميع الدراسات في التحليل التلوي؟

A. التجميع دائمًا أفضل من الدراسات الفردية
B. عندما يكون عدم التجانس متطرفًا أو عندما تقيس الدراسات أشياء مختلفة
C. التجميع مناسب دائمًا للتجارب المعشاة ذات الشواهد
D. الأساليب الإحصائية تتعامل مع أي موقف

2. أين تقع المراجعات المنهجية للتجارب المعشاة ذات الشواهد في التسلسل الهرمي للأدلة؟

A. في الأعلى
B. نفس مستوى المضبوطة الفردية
C. أدناه دراسات الأتراب
D. نفس رأي الخبراء

ابدأ الرحلة.

الوحدة 1: السؤال

التنقل بين الشرائح الذي تم إنشاؤه بواسطة JS
الوحدة 1: السؤال (CAST)

ليست كل إشارة حقيقة.

هذه ليست قصة عن الخطأ.

إنها قصة عن اليقين.

🎯 أهداف التعلم

  • قم بصياغة سؤال PICO مركّز لإجراء مراجعة منهجية
  • التمييز بين النتائج البديلة والنتائج المهمة للمريض
  • اشرح لماذا لا تعتبر المعقولية البيولوجية وحدها دليلا كافيا
  • وصف تجربة CAST وآثارها على الطب المبني على الأدلة
  • تطبيق قاعدة: "ليس كل إشارة مضيئة هدى"

الوفيات الزائدة سنويا

من العلاج الذي يعتقد الجميع أنه نجح.

هذه هي قصة كيف آمنا، وكيف كنا مخطئين.

كان المرضى الذين يعانون من الـ PVC المتكرر بعد احتشاء عضلة القلب لديهم معدل وفيات أعلى بمقدار 2-5 مرات.

400,000+
الناجون من احتشاء عضلة القلب/السنة
~40%
مع PVC كبيرة
160,000
معرضون لخطر مرتفع

حاجة سريرية هائلة. هدف واضح.

تم تطوير أدوية مضادة لاضطراب النظم، ووافقت عليها إدارة الغذاء والدواء،
ووصفت لحوالي 200000 مريض سنويًا.

لا يظهر أي شرير في هذه القصة.

تصرف الجميع بناءً على أفضل الأدلة المتاحة.

الفرضية 1

تتنبأ مضادات اضطراب النظم القلبي بعد احتشاء عضلة القلب بالموت القلبي المفاجئ

الفرضية 2

الأدوية المضادة لاضطراب نظم القلب تقمع الـ PVCs

الفرضية 3

قمع الـ PVCs يجب أن يمنع الموت المفاجئ

كانت السلسلة منطقية. شعرت أن الاستنتاج لا مفر منه.

أخيرًا، سأل أحدهم: "هل قمع الـ PVCs ينقذ الأرواح بالفعل؟"

التصميم
عشوائية، مزدوجة التعمية، ومضبوطة بالعلاج الوهمي
سكان
مرضى ما بعد MI الذين يعانون من PVC بدون أعراض
تدخل
إنكاينيد، فليكاينيد، أو موريسيزين مقابل الدواء الوهمي
تشغيل
فقط المرضى الذين يعانون من تثبيط PVC بنسبة ≥80% بشكل عشوائي
نقطة النهاية الأولية
الوفاة أو السكتة القلبية مع الإنعاش
حجم العينة
1,498 مريضًا (أذرع إنكايينيد/فليكاينيد)

يقوم مجلس مراقبة سلامة البيانات بإيقاف التجربة مبكرًا.

حصيلة المخدرات (ن = 755) الدواء الوهمي (ن = 743)
الوفيات الناجمة عن عدم انتظام ضربات القلب 33 9
جميع الوفيات القلبية 43 16
إجمالي الوفيات 56 22
معدل الوفيات 7.4% 3.0%
الخطر النسبي للوفاة: 2.5
95% CI: 1.6 - 4.5 | p < 0.001

الأدوية التي كبحت عدم انتظام ضربات القلب بشكل مثالي زادت معدل الوفيات بنسبة 150٪.

التكلفة البشرية

قبل CAST، كان حوالي 200.000 أمريكي يتلقون هذه الأدوية سنويًا.

~9,000

الوفيات الزائدة سنويا - وربما أكثر

حرب فيتنام: حوالي 6,000 حالة وفاة في الولايات المتحدة سنويًا. • هذه الأدوية: حوالي 9,000+ حالة وفاة سنويًا

لكل رقم اسم لن نعرفه أبدًا.

انظر مرة أخرى.

الفرضية 1

تتنبأ مضادات اضطراب النظم القلبي بعد احتشاء عضلة القلب بالموت القلبي المفاجئ

الفرضية 2

الأدوية المضادة لاضطراب نظم القلب تقمع الـ PVCs

← القفزة
الفرضية 3

قمع الـ PVCs يجب أن يمنع الموت المفاجئ

لم يتم اختبار الافتراض القائل بأن قمع العلامة سيؤدي إلى إصلاح النتيجة.

1

كانت الـ PVCs علامة على الأنسجة التالفة، وليست سببًا للوفاة

2

كان للأدوية تأثيرات على عدم انتظام ضربات القلب، مما أدى إلى إيقاعات أكثر فتكًا

3

تحسن البديل بينما ساءت النتيجة - بديل منفصل

لم يكذب البديل. لقد طرحنا عليه السؤال الخطأ.

يحتوي كل سؤال سريري قابل للإجابة على أربعة مكونات:

ف - السكان
من هم المرضى؟ ما هي خصائصها؟
أنا - التدخل
ما هو العلاج أو التعرض الذي يتم تقييمه؟
ج - المقارنة
ما هو البديل؟ الدواء الوهمي؟ الرعاية القياسية؟
O - النتيجة
ما الذي يهم المرضى؟ نقاط النهاية الصعبة مقابل البدائل.
كاست بيكو
مرضى ما بعد MI الذين يعانون من PVC | مضادات اضطراب النظم | الدواء الوهمي | الوفيات
تمرين التحقيق CAST
🔍

تمرين التحقيق: الدليل قبل CAST

أنت طبيب قلب في عام 1988. نجا مريض من احتشاء عضلة القلب ولكنه يعاني من انقباضات قلبية متكررة. الأدب الرصدي واضح...

دراسةالمرضى الذين يعانون من PVCخطر الوفيات
لون (1977)مواد PVC عالية الجودةأعلى بمقدار 2.4 مرة
أكبر (1984)> 10 PVC/ساعةأعلى بمقدار 3.1 مرة
مخرجي (1984)PVC المعقدةأعلى بمقدار 4.8 مرة

الإشارة واضحة. الآلية معقولة. هل تصف مضادات اضطراب النظم؟

قبل: المنطق الرصدي

PVCs → ارتفاع معدل الوفيات

المخدرات قمع PVC

∴ الأدوية يجب أن تقلل من معدل الوفيات

بعد: CAST RCT (1989)

معدل الوفيات بسبب المخدرات: 7.4%

معدل الوفيات عند العلاج الوهمي: 3.0%

RR = 2.5 (زيادة بنسبة 150% في الوفيات)

تحسن البديل. مات المرضى. ولهذا السبب نسأل: "ما هي النتيجة المهمة؟"

1

المعقولية البيولوجية ليست دليلاً

الآلية المنطقية لا تضمن التأثير المتوقع.

2

نقاط النهاية البديلة يمكن أن تكون مضللة

إن تحسين العلامة الحيوية لا يثبت تحسنًا في النتائج.

3

توفر التجارب العشوائية أقوى الأدلة السببية

بيانات المراقبة وحدها نادرًا ما يحدد السببية للتدخلات بسبب الخلط.

4

الإجماع ليس دليلاً

200000 وصفة طبية، وموافقة إدارة الغذاء والدواء الأمريكية، والمبادئ التوجيهية كانت كلها خاطئة.

ولهذا السبب نقوم بالتحليل التلوي: لرؤية الحقائق الظاهرة الماضية.

القصة: بديل DES-II مأساة

ماذا لو كان السؤال الذي تطرحه يحدد من يعيش ومن يموت؟

البيانات الحقيقية

في عام 1989، عرف أطباء القلب أن يمكن تحقيق قمع PVC باستخدام الإنكايينيد والفليكاينيد. بدت نقطة النهاية البديلة مثالية: قامت الأدوية بقمع PVCs عن طريق 80%+. لكن CAST عشوائية 1,498 مريض للعقار النشط مقابل الدواء الوهمي. تم إيقاف التجربة مبكرًا: 56 حالة وفاة في مجموعة الدواء مقابل 22 في العلاج الوهمي. زادت الوفيات 2.5 ضعف. ما يقدر ~ 9000 حالة وفاة أمريكية زائدة سنويًا كانت تُعزى إلى هذه الأدوية.

اختيار طبيب القلب: 1987
يعاني مريض ما بعد احتشاء عضلة القلب من انقباضات متكررة في القلب. لديك أدوية تقمعها تمامًا. ماذا تفعل؟
المسار أ: علاج البديل
وصف الإنكاينيد — تختفي PVC، ويبدو مخطط كهربية القلب نظيفًا
تحسن المرقم الحيوي. تشعر بالثقة. يموت المريض.
النتيجة: ما يقدر بنحو 50.000+ حالة وفاة زائدة في جميع أنحاء الولايات المتحدة خلال سنوات الاستخدام
المسار ب: المطالبة بمحاكمة الوفيات
الإصرار: "أرني أن البقاء على قيد الحياة يتحسن، وليس فقط تخطيط القلب"
التجربة تكشف الضرر. يتم سحب الأدوية. يتم إنقاذ الأرواح.
النتيجة: سؤال PICO الصحيح يمنع وقوع كارثة
الرؤيا
لم يكن السؤال أبدًا "هل يمكننا قمع PVCs؟" كان السؤال "هل ينقذ قمع PVC الأرواح؟" نقطة النهاية البديلة أجابت على السؤال الخطأ. كان PICO الصحيح سيطالب بالوفاة كنتيجة منذ البداية.

ما يبدو مؤكدًا قد يكون خاطئًا.

ما يعتقده الجميع قد يكون كاذبا.

توجد طرق حتى لا يدفع المرضى ثمن ثقتنا.

ولهذا السبب أنت هنا.

اختبار الوحدة 1

1. ما هو الخطأ الأساسي في منطق عدم انتظام ضربات القلب؟

A. لم تكن التجارب عشوائية
B. كان من المفترض أن يؤدي علاج البديل (PVCs) إلى تحسين النتائج
C. كان حجم العينة صغيرًا جدًا
D. تم التعجيل بموافقة إدارة الغذاء والدواء

2. في PICO، ما الذي يرمز إليه الحرف "O" ولماذا يهم؟

A. الملاحظة - ما يراه الباحثون
B. الهدف - هدف البحث
C. النتيجة - ما يهم المرضى
D. التنظيم - هيكل الدراسة

ليست كل إشارة حقيقة.

الأساليب تحمي المرضى من ثقتنا.

الوحدة الثانية: البروتوكول (HRT)

ما الذي كان مخفيا على مرأى من الجميع؟

هذه قصة عن

الأدلة الرصدية.

🎯 أهداف التعلم

  • اشرح لماذا يمنع التسجيل المسبق للبروتوكول التحيز
  • تحديد العناصر الأساسية لتسجيل PROSPERO
  • تمييز تحيز المستخدم الصحي عن تأثيرات العلاج الحقيقية
  • وصف لماذا بالغت الدراسات الرصدية في تقدير فوائد العلاج التعويضي بالهرمونات
  • تطبيق المبدأ: "الطرق تحمي المرضى من ثقتنا الثقة"

الدراسات الرصدية

جميعها تظهر أن العلاج بالهرمونات البديلة يحمي النساء بعد انقطاع الطمث من أمراض القلب.

بدت الأدلة دامغة. بدا الاستنتاج مؤكدًا.

تمت متابعة 122,000 ممرضة لعقود من الزمن. كان لدى مستخدمي العلاج التعويضي بالهرمونات انخفاض في معدل الوفيات القلبية الوعائية بنسبة 40-50٪.

RR 0.56
وفيات القلب والأوعية الدموية
122,000
تمت متابعة النساء
20+ سنة
المتابعة

دراسة تاريخية. منهجية لا تشوبها شائبة. استنتاج خاطئ.

1

انحياز المستخدم الصحي: النساء اللاتي اخترن العلاج التعويضي بالهرمونات كن أكثر صحة وأكثر ثراء وتعليمًا

2

انحياز الامتثال: النساء اللاتي تناولن العلاج التعويضي بالهرمونات باستمرار اعتنين بأنفسهن بشكل أفضل أيضًا

3

انحياز واصف الوصف: أعطى الأطباء العلاج التعويضي بالهرمونات لنساء أكثر صحة مع عوامل خطر أقل

لم يكن العلاج يحميهن. لقد كانوا محميين بالفعل.

أكبر تجربة عشوائية أجريت على العلاج التعويضي بالهرمونات على الإطلاق.

التصميم
عشوائية، مزدوجة التعمية، ومضبوطة بالعلاج الوهمي
سكان
النساء بعد انقطاع الطمث الذين تتراوح أعمارهم بين 50-79
تدخل
هرمون الاستروجين + البروجستين مقابل الدواء الوهمي
حجم العينة
16,608 امرأة
نقطة النهاية الأولية
مرض القلب التاجي
المدة المخططة
8.5 سنة

توقفت التجربة مبكرًا بعد 5.2 سنة. الضرر أكثر من المنافع.

حصيلة نسبة الخطر الاتجاه
مرض القلب التاجي 1.29 HARM
السكتة الدماغية 1.41 HARM
سرطان الثدي 1.26 HARM
الانسداد الرئوي 2.13 HARM
الانعكاس الكامل
30 عامًا من الأدلة الرصدية انقلبت

الدرس

التحديد المسبق

بروتوكول مكتوب قبل بدء البحث يمنع الصيد ويمنع التحيز ويمنع تشويه الإدراك المتأخر.

القصة: فرضية توقيت الهرمونات

ماذا لو نجح العلاج - ولكن فقط بعض؟

البيانات الحقيقية

الذي أظهر أن العلاج التعويضي بالهرمونات يزيد من أحداث القلب والأوعية الدموية بشكل عام. لكن التحليلات اللاحقة كشفت عن نمط حرج: النساء اللاتي بدأن العلاج التعويضي بالهرمونات خلال 10 سنوات من انقطاع الطمث had قللن من خطر الإصابة بأمراض القلب والأوعية الدموية. النساء اللاتي يبدأن بعد مرور 20 عامًا على انقطاع الطمث had زيادة المخاطر. النتيجة الإجمالية الخالية/الضرر أخفت تأثير التوقيت.

معضلة المحلل
أنت تقوم بتحليل مجموعات WHI الفرعية. النتيجة الإجمالية تظهر الضرر. هل تبحث بشكل أعمق؟
المسار أ: التقرير بشكل عام فقط
استنتج أن العلاج التعويضي بالهرمونات ضار لجميع النساء بعد انقطاع الطمث
رسالة بسيطة. توصي الإرشادات بعدم استخدام العلاج التعويضي بالهرمونات بشكل عام.
النتيجة: رفض الفوائد المحتملة للنساء الأصغر سنًا بعد انقطاع الطمث
المسار ب: مجموعات فرعية محددة مسبقًا للتوقيت
التحليل حسب السنوات منذ انقطاع الطمث (معقول بيولوجيًا)
اكتشف "نافذة التوقيت" لبدء العلاج التعويضي بالهرمونات بشكل آمن.
النتيجة: تمكين التوصيات الشخصية
الرؤيا
يعد تحليل المجموعة الفرعية خطيرًا عند الصيد. إنه ضروري عندما يتنبأ علم الأحياء بتعديل التأثير. كانت فرضية التوقيت معقولة من الناحية البيولوجية، وكان ينبغي تحديدها مسبقًا.
1

سجل قبل البحث

PROSPERO: دولي السجل المحتمل للمراجعات المنهجية

2

اقفل قراراتك

PICO، استراتيجية البحث، النتائج، خطة التحليل - جميعها محددة مسبقًا

3

تعديلات الوثيقة

مسموح بالتغييرات ولكن يجب أن تكون شفافة ومبررة

4

منع الازدواجية

تحقق مما إذا كانت مراجعتك موجودة بالفعل من قبل البدء

1. لماذا أظهرت دراسة صحة الممرضات فائدة من العلاج التعويضي بالهرمونات لم تفعله WHI؟

A. كان لدى صحة الممرضات عدد قليل جدًا من المرضى
B. تحيز المستخدم الصحي في الدراسات الرصدية
C. كانت صحة الممرضات ذات متابعة أقصر
D. تم استخدام تركيبات هرمونية مختلفة

2. ما هو الغرض الأساسي من تسجيل PROSPERO؟

A. لتسجيل التجارب السريرية
B. لتسريع استكمال المراجعة
C. للتحديد المسبق للطرق ومنع التحيز
D. للحصول على تمويل للمراجعات

المواصفات المسبقة ليست كذلك البيروقراطية.

إنها حماية.

ضد ميلنا للعثور على ما نتوقعه.

الأساليب تحمي المرضى من ثقتنا.

ما الذي كان مخفيا على مرأى من الجميع؟

الوحدة 3: البحث

الوحدة 3: البحث (روزيجليتازون)

ما الذي كان مخفيا على مرأى من الجميع؟

هذه قصة عن

ما لم ينشروه.

🎯 أهداف التعلم

  • قم بتطوير استراتيجية بحث شاملة باستخدام إرشادات PRESS
  • ابحث في قواعد بيانات متعددة بما في ذلك مصادر الأدبيات الرمادية
  • تحديد سجلات التجارب وقواعد البيانات التنظيمية (ClinicalTrials.gov، FDA)
  • اشرح كيف كشفت قضية الروزيجليتازون عن أضرار خفية في القلب والأوعية الدموية
  • تطبيق المبدأ: "ما الذي كان مخفيًا على مرأى من الجميع؟"

المبيعات السنوية في الذروة

كان أفانديا (روزيجليتازون) واحدًا من أدوية مرض السكري الأكثر مبيعًا في العالم.

تبدو التجارب المنشورة مطمئنة. أما الكتب غير المنشورة فقد روت قصة مختلفة.

وأظهرت التجارب المنشورة أن روزيجليتازون خفض بشكل فعال نسبة HbA1c. نادرا ما تم الإبلاغ عن نتائج القلب والأوعية الدموية.

1999
موافقة ادارة الاغذية والعقاقير
6M+
المرضى الذين تم علاجهم
~0.7%
تخفيض HbA1c

بدا البديل جيدًا. ولكن ماذا عن الأحداث القلبية الوعائية الفعلية؟

د. حصل ستيفن نيسن على بيانات التجارب غير المنشورة من موقع الويب الخاص بشركة GSK.

لقد طُلب من GSK، بموجب تسوية قانونية، نشر نتائج التجارب السريرية عبر الإنترنت. قام نيسن وولسكي بتحليل 42 تجربة - لم يتم نشر العديد منها مطلقًا في المجلات.

كانت البيانات علنية من الناحية الفنية.

لم يقم أحد بالبحث عنه بشكل منهجي.

حصيلة نسبة الاحتمالات 95% CI
احتشاء عضلة القلب 1.43 1.03 - 1.98
وفاة السيرة الذاتية 1.64 0.98 - 2.74
43% زيادة في خطر الإصابة بالنوبات القلبية
p = 0.03 لاحتشاء عضلة القلب

نشرت في NEJM. دعت إدارة الغذاء والدواء الأمريكية إلى اجتماع للجنة الاستشارية الطارئة.

اللجنة الاستشارية لإدارة الغذاء والدواء: يوليو 2007

22-1
التصويت: خطر السيرة الذاتية موجود
20-3
استمر السوق مع التحذيرات

تم تقسيم اللجنة. ومنهم من أراد سحبها. ووصف البعض التحليل التلوي بأنه معيب.

لكن لا يمكن إخفاء الإشارة.

1

تحذير الصندوق الأسود تمت إضافته لمخاطر قصور القلب (2007)

2

قيود شديدة بشأن وصف الأدوية في الولايات المتحدة (2010)

3

منشور من السوق الأوروبية بالكامل (2010)

4

تتطلب إدارة الغذاء والدواء الآن تجارب نتائج القلب والأوعية الدموية لجميع أدوية مرض السكري

منشور
PubMed, Embase, CENTRAL, Web of Science
الأدب الرمادي
ملخصات المؤتمرات، والرسائل العلمية، والمستندات التنظيمية
سجلات التجارب
ClinicalTrials.gov, WHO ICTRP، EU CTR
التنظيمية
التقديمات المقدمة من إدارة الغذاء والدواء الأمريكية (FDA)، وEMA، ووزارة الصحة الكندية
بيانات الشركة
سجلات التجارب السريرية GSK، وPfizer، وRoche
البحث اليدوي
قوائم المراجع، ومؤلفو الاتصال، والخبراء

مراجعة النظراء لاستراتيجيات البحث الإلكتروني

1

ترجمة سؤال البحث

هل يعكس البحث PICO العناصر؟

2

عوامل التشغيل المنطقية والتقريبية

هل لا يتم استخدام AND أو OR بشكل صحيح؟

3

عناوين الموضوع

هل مصطلحات MeSH/Emtree مناسبة ومفصلة؟

4

الكلمات النصية

المرادفات، المتغيرات الإملائية، الاقتطاع؟

5

التهجئة وبناء الجملة وأرقام الأسطر

هل هناك أخطاء قد تؤدي إلى استرجاعها

6

الحدود والمرشحات

هل حدود التاريخ واللغة وتصميم الدراسة مناسبة؟

تعمل عمليات البحث التي يراجعها النظراء على تحسين استرجاع الدراسات الرئيسية بشكل كبير.

المبادئ التوجيهية الصحفية: McGowan et al., 2016

يجب تعديل نفس البحث لكل قاعدة بيانات:

مجلات

"داء السكري، النوع 2"[MeSH] OR "مرض السكري من النوع 2"[tiab]

إمباس

'مرض السكري غير المعتمد على الأنسولين'/exp OR 'مرض السكري من النوع 2':ti,ab

عناوين المواضيع، الحقل العلامات، والمشغلين تختلف بين قواعد البيانات.

القصة: شفافية تاميفلو الحملة

ماذا يحدث عندما تبحث - ولا تجد شيئًا؟

البيانات الحقيقية

الحكومات المخزونة 9 مليارات دولار للأوسيلتاميفير (تاميفلو) لعلاج جائحة الأنفلونزا. حاولت مؤسسة كوكرين مراجعة الأدلة. من 77 تجربة سريرية، التقارير الكاملة موجودة فقط 20. رفضت شركة Roche مشاركة البيانات الخاصة بـ 5 سنوات. عندما حصلت BMJ وCochrane أخيرًا على أكثر من 160.000 صفحة ومن خلال تقارير الدراسات السريرية، وجدوا أن عقار تاميفلو قلل الأعراض بنسبة أقل من يوم واحد، مع لا يوجد دليل منع دخول المستشفى أو المضاعفات.

معضلة المراجع: 2009
أنت تقوم بتحديث مراجعة كوكرين لعقار تاميفلو. تبدو التجارب المنشورة إيجابية. لكن 57 تجربة ليس لديها تقارير كاملة يمكن الوصول إليها. ماذا تفعل؟
المسار أ: تحليل ما تم نشره
استخدم 20 التجارب المتاحة. استنتج أن عقار تاميفلو فعال.
مراجعتك تدعم التخزين المستمر. تم إنفاق 9 مليارات دولار على أدلة ضعيفة.
النتيجة: إهدار المليارات، والفعالية الحقيقية غير معروفة
المسار ب: طلب البيانات الكاملة
ارفض النشر حتى تصبح جميع بيانات التجربة متاحة
حملة 5 سنوات. تم أخيرًا الحصول على أكثر من 160.000 صفحة. الحقيقة تظهر.
النتيجة: تغيرت سياسة الأدلة؛ تنشر EMA الآن جميع التقارير التجريبية
الرؤيا
تكون جودة البحث فقط بقدر ما يمكن العثور عليه. عندما يتم إخفاء الأدبيات الرمادية خلف جدران الشركات، فإن حتى البحث الأكثر شمولاً في PubMed سوف يغيب عن الحقيقة. لقد غيرت ملحمة تاميفلو السياسة العالمية: تنشر وكالة الأدوية الأوروبية الآن تقارير الدراسات السريرية لجميع الأدوية.

إذا بحثت شركة Nissen في PubMed فقط،

لكانت الإشارة مخفية.

البحث الشامل هو البقاء.

ما الذي كان مخفيا على مرأى من الجميع؟

1. ما نوع مصدر الأدلة الذي كشف عن إشارة القلب والأوعية الدموية للروزيجليتازون؟

A. المقالات الصحفية المنشورة
B. مكتبة كوكرين
C. سجل التجارب السريرية للشركة
D. وثائق موافقة إدارة الغذاء والدواء

2. ما الذي تعنيه كلمة PRESS؟

A. مراجعة المنشورات لمعايير البحث عن الأدلة
B. مراجعة النظراء لاستراتيجيات البحث الإلكتروني
C. بروتوكول الإبلاغ عن دراسات تركيب الأدلة
D. نظام البحث عن الأدلة البحثية الأولية

ما الذي كان مخفيا على مرأى من الجميع؟

الوحدة 4: الفحص

الوحدة النمطية 4: الفحص (Vioxx)

الرقم بدون مصدر ليس رقمًا.

هذه قصة عن

ما اختاروا الإبلاغ عنه.

🎯 أهداف التعلم

  • تطبيق مخطط تدفق PRISMA لتوثيق اختيار الدراسة
  • تنفيذ فحص المراجع المزدوج مع حل النزاعات
  • تحديد تقارير النتائج الانتقائية ومعالجة البيانات
  • حساب الموثوقية بين التقييمات (كابا كوهين)
  • تطبيق المبدأ: "الرقم بدون مصدر ليس رقمًا"

النوبات القلبية المنسوبة إلى Vioxx

دواء رائج. إشارة مخفية. كارثة يمكن الوقاية منها.

بين في عامي 1999 و2004، تناول الملايين هذا المسكن. لم يعد البعض إلى المنزل مطلقًا.

كان Rofecoxib (Vioxx) أحد مضادات الالتهاب غير الستيروئيدية الانتقائية لـ COX-2. تم تسويقه على أنه أكثر أمانًا للمعدة من مسكنات الألم التقليدية.

1999
موافقة ادارة الاغذية والعقاقير
$2.5B
ذروة المبيعات السنوية
80M+
الموصوف للمرضى

أبحاث نتائج الجهاز الهضمي فيوكس

التصميم
عشوائية، مزدوجة التعمية
مقارنة
فيوكس مقابل نابروكسين
سكان
التهاب المفاصل الروماتويدي
عينة
8076 مريضا
النتيجة الأولية
أحداث جي آي
تم النشر
NEJM، نوفمبر 2000
نتيجة جي آي فيوكس نابروكسين
أحداث الجهاز الهضمي المؤكدة 2.1 لكل 100 نقطة سنة 4.5 لكل 100 نقطة سنة
تخفيض أحداث الجهاز الهضمي أقل بنسبة 54%

هذا ما قيل للأطباء. هذا ما يعتقده المرضى.

نتيجة السيرة الذاتية فيوكس نابروكسين
احتشاء عضلة القلب 20 حدثا 4 أحداث
المخاطر النسبية أعلى بمقدار 5 مرات في مجموعة Vioxx
زيادة بمقدار 5 أضعاف في النوبات القلبية
تم ذكرها باختصار فقط، وتعزى إلى كون النابروكسين "واقي للقلب"
1

التلاعب بقطع البيانات: حدثت 3 نوبات قلبية إضافية بعد القطع المستخدم في المنشور

2

يلف: تم شرح إشارة السيرة الذاتية بعيدًا عن كون النابروكسين واقيًا للقلب (لا يوجد دليل)

3

تبديل النتائج: تم تحديد أحداث السيرة الذاتية مسبقًا ولكن لم يتم التأكيد عليها

4

المعرفة الداخلية: تُظهر رسائل البريد الإلكتروني لشركة Merck أنهم كانوا على علم بالإشارة

تجربة APPROVe (2004)

تجربة للوقاية من سلائل القولون والمستقيم - توقفت مبكرًا من أجل السلامة.

RR 1.92
أحداث السيرة الذاتية مقابل الدواء الوهمي
سبتمبر 2004
تم سحب Vioxx

بعد أربع سنوات من ظهور VIGOR لخطر 5x. أربع سنوات متأخرة جداً.

القصة: شجرة قرار Vioxx

هل فكرت في ذلك ماذا يحدث عندما تختبئ الإشارة في الضوضاء؟

البيانات الحقيقية

تمت الموافقة على Vioxx (rofecoxib) في 1999. By 2004، تشير التقديرات 88.000-140.000 نوبة قلبية زائدة and 30.000-40.000 حالة وفاة. أظهرت تجربة VIGOR الخاصة بشركة Merck 5x خطر على القلب والأوعية الدموية في عام 2000، ولكن تم رفضه باعتباره "تأثير النابروكسين الواقي للقلب".

الشوكة في الطريق
أنت أحد مراجعي إدارة الغذاء والدواء في عام 2001. تُظهر بيانات VIGOR خطر الإصابة بنوبة قلبية 5x مع Vioxx مقابل نابروكسين.
المسار أ: قبول الشرح
صدق فرضية ميرك: النابروكسين واقي للقلب
لا توجد دراسات سلامة إضافية مطلوبة. يبقى الدواء في السوق بأقصى سرعة.
النتيجة: أكثر من 40,000 حالة وفاة على مدى 4 سنوات
المسار ب: طلب الأدلة
تتطلب تجربة سلامة السيرة الذاتية المخصصة قبل مواصلة التسويق
تأخير أو تقييد التسويق حتى يتم التأكد من سلامة القلب والأوعية الدموية.
النتيجة: تم اكتشاف الإشارة مبكرًا، مما أدى إلى إنقاذ الأرواح
الرؤيا
كانت الإشارة موجودة في عام 2000. الخطأ تفسير تأخير العمل لمدة 4 سنوات. فرضية بديلة - تم قبولها بدون دليل - كلفت عشرات الآلاف من الأرواح.

يجب أن تكون كل خطوة من خطوات الفحص موثقة وشفافة.

تعريف
سجلات من قواعد البيانات + مصادر أخرى
الفحص
مراجعة العنوان/الملخص (تمت إزالة التكرارات)
الأهلية
تقييم النص الكامل (مع أسباب الاستبعاد)
متضمنة
دراسات في التركيب
1

يقلل من تحيز الاختيار

قد يفضل أحد المراجعين دون وعي دراسات معينة

2

يصيد الأخطاء

الإرهاق وسوء القراءة والأخطاء أمر لا مفر منه

3

القوى معايير صريحة

تكشف الخلافات الغموض في قواعد الإدماج

اتفاق نموذجي: κ = 0.6-0.8

يتم حل الخلافات عن طريق المناقشة أو المراجع الثالث

قبل فحص آلاف السجلات، يجب على المراجعين معايرة عينة مكونة من 50 إلى 100 سجل.

1

شاشة نفس المجموعة بشكل مستقل

2

مقارنة القرارات ومناقشة الخلافات

3

تحسين معايير الاشتمال حتى κ > 0.7

4

توثيق عملية المعايرة وأي تغييرات في القواعد

جديد في عام 2020
تقارير منفصلة عن قاعدة البيانات مقابل عمليات البحث في التسجيل
جديد في عام 2020
يجب الإبلاغ عن أدوات التشغيل الآلي
جديد في عام 2020
تم توثيق البحث عن الاقتباس بشكل منفصل
جديد في عام 2020
أسباب الاستبعاد في النص الكامل إلزامية

قامت PRISMA 2020 بمراجعة قائمة المراجعة بشكل جوهري مع إعداد تقارير موسعة حول طرق التوليف وتقييم اليقين وتسجيل البروتوكول.

إذا تم فحص بيانات القلب والأوعية الدموية الخاصة بـ Vioxx من قبل مراجعين مستقلين،

إذا كان مطلوبًا الإبلاغ عن جميع النتائج المحددة مسبقًا،

كان من الممكن منع 88000 نوبة قلبية.

الرقم بدون مصدر ليس رقمًا.

1. في تجربة VIGOR، ما هو الخطر النسبي لـ MI في مجموعة Vioxx مقارنةً بالنابروكسين؟

A. أعلى بمقدار 1.5 مرة
B. 2x أعلى
C. أعلى بمقدار 5 مرات
D. أعلى بـ 10 مرات

2. ما أهمية الفحص المزدوج (مراجعان مستقلان)؟

A. يجعل الفحص أسرع
B. فهو يقلل من التحيز في الاختيار ويكتشف الأخطاء
C. إنه يقلل من عدد الدراسات التي يجب مراجعتها
D. يسمح للمراجعين بتخطي مراجعة النص الكامل

الرقم بدون مصدر ليس رقمًا.

الوحدة 5: الاستخلاص

الوحدة 5: الاستخلاص (DECREASE)

الرقم بدون مصدر ليس رقمًا.

هذه قصة عن

الأرقام التي لم تكن موجودة من قبل.

🎯 أهداف التعلم

  • تصميم نموذج موحد لاستخراج البيانات مع حقول المصدر
  • حساب أحجام التأثير من مختلف الإحصاءات المبلغ عنها (OR، RR، HR، SMD)
  • تنفيذ الاستخراج المزدوج مع حل التناقض
  • تحديد العلامات الحمراء لتلفيق البيانات وسوء السلوك
  • اشرح كيف أثر الاحتيال في DECREASE على الإرشادات السريرية

الوفيات الزائدة المحتملة في أوروبا

من الإرشادات المستندة إلى التجارب السريرية الملفقة البيانات.

أثرت تجارب DECREASE على الرعاية المحيطة بالجراحة في جميع أنحاء العالم. تم اختراع البيانات.

أستاذ في مركز إيراسموس الطبي، روتردام. مؤلف أكثر من 500 ورقة. المؤلف الرئيسي للمبادئ التوجيهية ESC بشأن رعاية القلب المحيطة بالجراحة.

500+
المنشورات
ينقص
سلسلة المحاكمة من الأول إلى السادس
ESC
كرسي التوجيهي

يبدو أنه مصدر لا يرقى إليه الشك. حتى ينظر شخص ما إلى البيانات.

محاكمة العثور على تأثير
انخفاض-I (1999) انخفاض بنسبة 90% في حالات الوفاة القلبية المبادئ التوجيهية المتغيرة
التخفيض الرابع (2009) حاصرات بيتا آمنة في المخاطر المنخفضة توصيات موسعة

وكانت أحجام التأثير كبيرة بشكل غير معقول.

تخفيض 90%؟ لا يوجد شيء تقريبًا في الطب يعمل بشكل جيد.

1

تم التحقيق في Erasmus MC بعد شكاوى المبلغين عن المخالفات

2

بيانات المرضى الملفقة: المرضى الذين لم يكونوا موجودين أو لم يتم تسجيلهم

3

لا توجد موافقة مستنيرة: لم يوافق العديد من "المشاركين" أبدًا

4

تم طرد Poldermans: من Erasmus MC في عام 2011

سلسلة الضرر

عندما تمت إزالة DECREASE من التحليلات الوصفية...

المنفعة → الضرر
الاتجاه المعكوس
27% ↑
زيادة خطر السكتة الدماغية

لقد أظهرت تجربة POISE (2008) ضررًا. تم رفضه لأنه يتعارض مع DECREASE.

1

الثقة في السلطة: كان بولديرمانز مؤلف المبادئ التوجيهية الذي قام بمراجعة الأدلة الخاصة به

2

لا يوجد التحقق من البيانات: لم يطلب أحد بيانات المريض الفردية

3

مكانة النشر: منشور في أفضل المجلات، ويفترض أنه صالح

4

قبول التأثيرات غير المعقولة: يجب أن تثير التخفيضات بنسبة 90% الشكوك

1

الاستخراج المزدوج

مستخرجان بشكل مستقل - يكتشفان أخطاء النسخ ويفرضان التدقيق

2

مصدر السجل

جدول، صفحة، فقرة - كل رقم يمكن تتبعه إلى المصدر

3

التحقق من التسجيل

ClinicalTrials.gov النتائج مقابل النشر - التناقضات هي علامات حمراء

4

طلب IPD

تكشف بيانات المريض الفردية ما تخفيه الملخصات الإجمالية

أثناء الاستخراج، يمكنك حساب أحجام التأثير من البيانات المبلغ عنها:

النتائج الثنائية

نسبة الأرجحية، نسبة المخاطرة، فرق المخاطرة من جداول 2x2

نتائج مستمرة

الفرق المتوسط، الفرق المتوسط الموحد من الوسائل وSD

استخرج دائمًا من المصدر الأكثر موثوقية.

تفضل: نتائج ITT > لكل بروتوكول > المجموعات الفرعية

!

أحجام التأثير غير المعقول: يجب أن تؤدي التخفيضات بنسبة 80-90% إلى التدقيق

!

الاختلالات الأساسية: المجموعات التي تمت مطابقتها "بشكل مثالي جدًا"

!

أرقام الجولة: "بالضبط 50" أو "بالضبط 100" مريض لكل ذراع

!

تناقضات التسجيل: تختلف N المنشورة عن N المسجلة

الباحث

نتائج تقرير الدراسات في مقاييس مختلفة. لتجميعها، غالبًا ما تحتاج إلى تحويلات:

FromToصيغة
مصلحة الارصاد الجوية (د)سجل-أوسجل-OR = د × π / √3
سجل-أومصلحة الارصاد الجوية (د)د = سجل-OR × √3 / π
الارتباط (ص)فيشر زz = 0.5 × ln((1+r)/(1−r))
ORRRRR = OR / (1 − P₀ + P₀ × OR)
ORNNTNNT = 1 / (P₀ − OR×P₀ / (1−P₀+OR×P₀))

P₀ = خطر خط الأساس في مجموعة التحكم. تفترض هذه الصيغ شروطًا تقريبية؛ انظر بورنشتاين وآخرون. (الفصل 7) للاشتقاقات الدقيقة.

الباحث

أبلغت العديد من التجارب عن نتائج الوقت حتى الحدث باستخدام نسب الخطر (الموارد البشرية). يتطلب تجميع الموارد البشرية في التحليل التلوي معالجة خاصة:

1

السجل (HR) + طريقة SE

استخرج السجل (HR) وSE الخاص به من التجربة. إذا لم يتم الإبلاغ عنها، فاشتق SE من CI: SE = (ln(upper) - ln(lower)) / (2 × 1.96). التجمع باستخدام طرق التباين العكسي القياسية.

2

عندما لا يتم الإبلاغ عن الموارد البشرية

توجد طرق لإعادة بناء IPD من منحنيات كابلان-ماير (Guyot et al. 2012) أو تقدير الموارد البشرية من القيم p وأعداد الأحداث (Parmar et al. 1998). تفضل دائمًا معدل الموارد البشرية المعدل الذي تم الإبلاغ عنه مباشرة عندما يكون متاحًا.

HR <1 يفضل العلاج؛ الموارد البشرية > 1 تفضل التحكم. يفعل not تحويل الموارد البشرية إلى ORs أو RRs - فهي تقيس كميات مختلفة بشكل أساسي.

القصة: فضيحة بولدت الغروانية

ماذا لو لم تكن البيانات التي تستخرجها حقيقية على الإطلاق؟

البيانات الحقيقية

كان يواكيم بولدت هو الباحث الأكثر إنتاجًا في إدارة سوائل التخدير. تم سحب أكثر من 180 من منشوراته — وهي واحدة من أكبر حالات التراجع في التاريخ الطبي. وأظهرت بياناته الملفقة أن نشا هيدروكسي إيثيل (HES) آمن. خلصت التحليلات التلوية التي شملت دراساته إلى أن HES غير ضار. عندما تمت إزالة دراسات بولدت، انعكس التأثير المجمع: زاد HES إصابة الكلى بنسبة 59% (RR 1.59، 95٪ CI 1.26-2.00) و الوفيات بنسبة ~ 9٪ (RR 1.09). يقدر آلاف المرضى تلقى سائلاً ضاراً بناءً على أدلة ملفقة.

يقظة المستخرج: 2010
أنت تقوم باستخراج بيانات للتحليل التلوي لإنعاش السوائل. تهيمن دراسات بولدت على الأدبيات (أكثر من 90 ورقة). وقد أثار المبلغين عن المخالفات المخاوف. ماذا تفعل؟
المسار أ: استخراج كما تم نشره
ثق بالمنشورات التي يراجعها النظراء. استخرج بيانات بولدت مثل أي شيء آخر.
يظهر التحليل التلوي الخاص بك أن HES آمن. المبادئ التوجيهية توصي بذلك.
النتيجة: الآلاف يحصلون على سائل سام للكلى
المسار ب: التحقق من المصدر
التحقق من الموافقات الأخلاقية، وطلب بيانات المصدر، وإجراء تحليل الحساسية باستثناء الدراسات المشبوهة
اكتشف الموافقات الأخلاقية المفقودة. دراسات العلم. إعادة التحليل بدونهم.
النتيجة: ظهور إشارة حقيقية - يسبب HES ضررًا
الرؤيا
المصدر ليس بيروقراطية. وهذا هو الفرق بين الأدلة والخيال. يجب أن يتبع كل رقم مستخرج دراسة معتمدة من الناحية الأخلاقية، مع بيانات مريض يمكن التحقق منها. بدون مصدر، يمكن أن يصبح الرقم بدون مالك سلاحًا.

كل رقم في تحليلك التلوي

يجب أن يعود إلى مصدر يمكن التحقق منه.

الرقم بدون مصدر ليس رقمًا.

من الممكن أن تؤدي البيانات الاحتيالية إلى الوفاة تمامًا مثل الأدوية الاحتيالية.

1. ماذا حدث عندما تمت إزالة بيانات تجربة DECREASE من التحليلات الوصفية لحاصرات بيتا؟

A. أصبحت الفائدة أكبر
B. لا يوجد تغيير في الاستنتاجات
C. الاتجاه المعاكس لإظهار الضرر المحتمل
D. أصبحت النتائج غير حاسمة

2. لماذا يجب أن يكون الاستخراج المزدوج ممارسة قياسية؟

A. يرصد أخطاء النسخ ويفرض التدقيق
B. يجعل الاستخراج أسرع
C. إنها تساعد في العثور على المزيد من الدراسات
D. يقلل من مقدار العمل المطلوب

الرقم بدون مصدر ليس رقمًا.

الوحدة 6: التحيز

الوحدة 6: التحيز (Aprotinin/BART)

الأساليب تحمي المرضى من ثقتنا.

هذه قصة عن

التحيز الذي لا يمكننا رؤيته.

🎯 أهداف التعلم

  • تطبيق خطر التحيز 2.0 (RoB 2) على التجارب العشوائية
  • تطبيق ROBINS-I على الدراسات غير العشوائية
  • تقييم جميع مجالات RoB 2 الخمسة (العشوائية، والانحرافات، والبيانات المفقودة، والقياس، والاختيار)
  • التمييز بين الإرباك من خلال الإشارة من آثار العلاج الحقيقية
  • اشرح كيف كشف تحليل بارت عن الأضرار الخفية للأبروتينين

سنوات في السوق

كان الأبروتينين هو المعيار الذهبي لتقليل العمليات الجراحية نزيف.

ثم أجرى شخص ما تجربة معشاة ذات شواهد. الحقيقة كانت مختلفة.

1

حصل المرضى المرضى على أبروتينين: استخدمه الجراحون في الحالات المعقدة عالية الخطورة

2

انحياز الناجين: لا يمكن للمرضى المتوفين الإبلاغ عن المضاعفات

3

تحيز النشر: لم يتم نشر الدراسات السلبية

لم تتمكن الدراسات الرصدية من فصل تأثير الدواء عن المخاطر الأساسية للمريض.

الحفاظ على الدم باستخدام مضادات انحلال الفيبرين في تجربة عشوائية

حصيلةأبروتينينالبدائل
معدل الوفيات لمدة 30 يومًا6.0%3.9%
المخاطر النسبية1.53 (53% زيادة في الوفيات)
إيقاف التجربة مبكرًا بسبب الضرر
تم سحبها من السوق في نوفمبر 2007
تمرين التحقيق
🔍

التحقيق: تقييم التحيز

أنت تقوم بمراجعة الدراسات الرصدية. تطبيق خطر التفكير المتحيز:

سؤالرصديبارت (RCT)
تخصيص عشوائي؟❌ اختيار الجراح✓ نعم
يمكن مقارنة خط الأساس؟❌ تعاطي سيكر✓ متوازن
المسببة للعمى؟❌ التسمية المفتوحة✓ مزدوج التعمية

الخلط بالإشارة: أعطى الجراحون أبروتينين للمرضى الأكثر مرضًا. عزت الدراسات الرصدية البقاء على قيد الحياة إلى الدواء، عندما كانت تقيس تحيز البقاء على قيد الحياة.

D1

عملية التوزيع العشوائي

D2

الانحرافات عن التدخلات المقصودة

D3

بيانات النتائج المفقودة

D4

قياس النتيجة

D5

اختيار النتيجة المبلغ عنها

عندما لا تكون التجارب المعشاة ذات الشواهد متاحة، استخدم ROBINS-I (خطر التحيز في الدراسات غير العشوائية التدخلات)

1

مربك

الاختلافات الأساسية بين المجموعات

2

اختيار المشاركين

الاستثناءات ذات الصلة للتدخل

3

تصنيف التدخلات

سوء تصنيف حالة التعرض

4

الانحرافات عن التدخلات المقصودة

التدخلات المشتركة، التلوث

5

البيانات المفقودة

الخسارة التفاضلية للمتابعة

6

قياس النتائج

انحياز التأكد

7

اختيار النتيجة المبلغ عنها

تقارير انتقائية

التقييمات: منخفضة / متوسطة / خطيرة / حرجة / لا توجد معلومات

القصة: تجربة Aprotinin BART

ماذا يحدث عندما تتفق 64 دراسة - وكلها خاطئة؟

البيانات الحقيقية

تم استخدام الأبروتينين في جراحة القلب لتقليل النزيف لـ 20 سنة. 64 تجربة عشوائية صغيرة اقترح أنه آمن و فعالة. وأكدت التحليلات التلوية فائدة. ثم تجربة BART (2008) عشوائية 2331 مريضا: أبروتينين مقابل حمض الترانيكساميك مقابل حمض الأمينوكابرويك. النتيجة: زيادة الأبروتينين الوفيات بنسبة 53% (RR 1.53، 95% CI 1.06-2.22). تم إيقاف المحاكمة مبكرًا بسبب الضرر. قامت شركة باير بسحب الأبروتينين من السوق خلال أشهر.

دليل الجراح: 2006
أنت جراح قلب يختار مضادًا لتحلل الفيبرين. 64 تجربة صغيرة تفضل الأبروتينين، لكن لم تكن أي منها قادرة على اكتشاف الوفيات. يتم الآن تسجيل RCT (BART) كبير. هل تنتظر؟
المسار أ: ثق في التحليل التلوي
64 تجربة لا يمكن أن تكون جميعها خاطئة. استمر في وصف الأبروتينين.
تجارب صغيرة تقيس النزيف، وليس الموت. لم يكن لدى أي منهم القوة الكافية للوفيات. قام التحليل التلوي بتجميع النتائج البديلة الضعيفة.
النتيجة: الوفيات الزائدة في مرضى جراحة القلب
المسار ب: تقييم خطر التحيز أولاً
قم بتقييم جميع التجارب الـ 64 باستخدام RoB. لاحظ أنها صغيرة، وتستخدم نتائج بديلة، ولها استنزاف مرتفع. انتظر التجارب المعشاة ذات الشواهد التي تم تشغيلها بشكل مناسب.
يكشف بارت الحقيقة. التحول إلى بدائل أكثر أمانا.
النتيجة: إنقاذ الأرواح من خلال المطالبة بأدلة مدعومة بشكل مناسب
الرؤيا
كمية الأدلة لا تساوي الجودة. إن أربع وستين تجربة ضعيفة القوة تقيس النتائج الخاطئة لا تتفوق على تجربة واحدة كافية لقياس معدل الوفيات. إن خطر تقييم التحيز ليس إجراءً شكليًا - فهو بمثابة الدرع الفاصل بين المرضى والاستنتاجات المضللة من الأدلة الصغيرة المستندة إلى أدلة بديلة.

قامت أربع وستون تجربة صغيرة بقياس النزيف، وليس الموت.

كشفت إحدى التجارب التي تم تشغيلها بشكل كافٍ عن زيادة في معدل الوفيات بنسبة 53٪.

لا يمكن أن تحل كمية الأدلة محل الجودة والقوة.

1. لماذا أخطأت 64 تجربة صغيرة ضرر الأبروتينين؟

A. ضعيف القدرة على مواجهة الوفيات؛ النتائج البديلة المستخدمة
B. مربكة بالإشارة
C. تم قياس النتيجة بشكل غير صحيح
D. المتابعة قصيرة جدًا

الأساليب تحمي المرضى من ثقتنا.

الوحدة السابعة: التركيب

الوحدة السابعة: التركيب (المغنيسيوم/ISIS-4)

التباين رسالة وليس ضجيج.

الجدل حول المغنيسيوم: 1991-1995

عندما يؤدي التجميع إلى الضلال.

🎯 أهداف التعلم

  • احسب أحجام التأثير المجمعة باستخدام نماذج التأثير الثابت والتأثيرات العشوائية
  • اختر بين مقدرات DerSimonian-Laird وHKSJ بشكل مناسب
  • تفسير مخططات الغابة بما في ذلك الأوزان وفترات الثقة والماس
  • اشرح لماذا يمكن لتأثيرات الدراسات الصغيرة أن تضلل التحليلات الوصفية
  • طبق المبدأ: "التباين رسالة، وليس ضجيج"

"أنت تقف على مفترق طرق الأمل والأدلة..."

تقتل أمراض القلب عددًا أكبر من الأشخاص في جميع أنحاء العالم مقارنة بأي سبب آخر. في عام 1991، ظهر أمل جديد: هل يمكن لشيء بسيط ورخيص مثل المغنيسيوم الوريدي أن ينقذ الأرواح بعد احتشاء عضلة القلب؟

كان الأساس المنطقي البيولوجي سليمًا:

يعمل المغنيسيوم على استقرار أغشية القلب، ويمنع عدم انتظام ضربات القلب، ويوسع الأوعية الدموية للشرايين التاجية.

تجربة التدخل الوريدي للمغنيسيوم في ليستر، 1992

2,316
المرضى المسجلون
24%
خفض معدل الوفيات
p = 0.04
ذات دلالة إحصائية

تدخل رخيص وآمن يمكن أن ينقذ حياة 250 ألف شخص سنويا على مستوى العالم.

كان المجتمع الطبي مكهرب.

تجمع الباحثون سبع تجارب عشوائية من المغنيسيوم الرابع في MI:

محاكمة Year N نسبة الاحتمالات
مورتون 19841984400.10
راسموسن 198619862730.35
سميث 198619864000.48
ابراهيم 19871987940.87
شيشتر 199019901030.27
سيريموزينسكي 19891989480.22
الحد-219922,3160.74
🔍

تمرين التحقيق: معضلة المحلل التلوي

أنت أحد مراجعي كوكرين في عام 1993. لقد طُلب منك تجميع الأدلة المتعلقة بالمغنيسيوم من أجل MI. البيانات من سبع تجارب موجودة أمامك.

هل ترى النمط في مخطط الغابة هذا؟

نسبة الأرجحية المجمعة = 0.44 (فاصل الثقة 95%: 0.27-0.71)
تخفيض معدل الوفيات بنسبة 55%! نشر في مجلة لانسيت؟

ولكن انتظر... هل لاحظت أي شيء عن أحجام التجارب؟

ما الذي كان يجب أن يمنحنا وقفة؟

1

أحجام العينات الصغيرة: كان لدى ستة من سبع تجارب أقل من 500 مريض

2

التأثيرات القصوى: أو 0.10 (تخفيض بنسبة 90%) غير قابل للتصديق لأي دواء

3

الكل إيجابي: أين كانت التجارب السلبية؟ مشكلة درج الملفات...

4

عدم تناسق القمع: أظهرت التجارب الصغيرة تأثيرات أكبر بكثير من التجارب الأكبر

🔍

اختبار مخطط التحويل

قبل أن نقوم بالتجميع، يجب علينا التحقق من تحيز النشر. دعونا نتفحص المخطط القمعي.

"ثم جاءت الحقيقة..."

The الدراسة الدولية الرابعة للبقاء على قيد الحياة أثناء الاحتشاء (ISIS-4) تم تسجيل 58,050 مريضًا في 1,086 مستشفى في 31 دولة.

58,050
مرضى
2,216
الوفيات في مجموعة ملغ
2,103
الوفيات في العلاج الوهمي
OR = 1.06 (95% CI: 1.00–1.12)
لا فائدة. إذا كان هناك أي شيء، فإن الاتجاه نحو الأذى.
📊

قبل وبعد: الصورة الكاملة

شاهد ما يحدث عندما نضيف التجربة الضخمة إلى غابتنا مؤامرة ...

قبل داعش-4

7 تجارب صغيرة (العدد = 3,274)

OR = 0.44

إشارة فائدة قوية

بعد إيزيس-4

8 تجارب (ن = 61,324)

OR = 1.02

لا تأثير

1

انحياز النشر

لم تُنشر التجارب السلبية الصغيرة مطلقًا، بل ظلت في أدراج الملفات

2

تأثيرات الدراسات الصغيرة

تميل التجارب الأصغر إلى إظهار تأثيرات أكبر بسبب نقاط الضعف المنهجية

3

التحيز العشوائي العالي

بالصدفة، حققت بعض التجارب الصغيرة نتائج متطرفة - وتم نشر تلك التجارب

4

تضخيم التأثيرات العشوائية

تعطي نماذج التأثيرات العشوائية وزنًا أكبر للتجارب الصغيرة، مما يؤدي إلى تضخيم التحيز

ما هو النموذج الذي يجب أن تختاره؟

نموذج التأثير الثابت

يفترض تأثير حقيقي واحد. دراسات الأوزان بالتباين العكسي (الدقة). المحاكمات الكبيرة تهيمن.

نتيجة المغنيسيوم : OR = 0.96 (p = 0.52)

نموذج التأثيرات العشوائية

يفترض توزيع التأثيرات. يعطي وزنا أكبر للتجارب الصغيرة. فترات ثقة أوسع.

نتيجة المغنيسيوم : OR = 0.59 (p = 0.01)

⚠️ حدد اختيار النموذج النتيجة!

التأثيرات العشوائية لا تعمل على إصلاح التحيز؛ مع تأثيرات الدراسات الصغيرة، قد يؤدي ذلك إلى تحويل الوزن نحو تجارب أصغر وتغيير الاستنتاجات.

1. تحقق من تحيز النشر قبل الوثوق في التقدير المجمع. المخططات القمعية واختبار إيجر هي أدواتك.

2. كن حذرًا من تأثيرات الدراسة الصغيرة. إذا أظهرت التجارب الصغيرة فقط فائدة، فانتظر تجربة كبيرة جيدة التنفيذ.

3. اختيار النموذج مهم. التأثيرات العشوائية يمكن أن تؤدي إلى تضخيم الأدلة المتحيزة. فكر في كلا النموذجين وافهم الآثار المترتبة.

4. يمكن لمحاكمة واحدة كبيرة أن تقلب الكثير من التجارب الصغيرة. وهذا هو السبب في أن التجارب الضخمة مثل إيزيس-4 ذات قيمة كبيرة.

الباحث

لا تستخدم جميع التجارب المعشاة ذات الشواهد تصميمات المجموعة المتوازية القياسية. هناك بديلان شائعان يتطلبان معالجة خاصة عند تجميع النتائج:

1

التجارب العشوائية العنقودية

المجموعات العشوائية (المستشفيات والمدارس)، وليس الأفراد. يقلل تأثير التصميم = 1 + (m−1) × ICC من حجم العينة الفعال. قم بتقسيم N على تأثير التصميم قبل التجميع، أو استخدم SE المعدل من التجربة. يؤدي تجاهل التجميع إلى إنتاج CIs ضيقة بشكل مصطنع.

2

التجارب المتقاطعة

يتلقى كل مريض كلا العلاجين. يعمل التصميم المقترن على تقليل التباين، لكنك تحتاج إلى الارتباط داخل المريض (أو التحليل المقترن SE) للتجميع بشكل صحيح. يعد استخدام المجموعة الموازية SE أمرًا محافظًا. استخدام عدد مزدوج غير صحيح من المرضى.

راجع دليل كوكرين الإصدار 6.4، الفصل 23 للحصول على صيغ مفصلة وأمثلة عملية.

القصة: عكس الفاعل بالسطح المبكر

ماذا لو كانت الطريقة التي تجمع بها الدراسات تحدد ما إذا كان العلاج يبدو منقذًا للحياة أم لا عديمة الفائدة؟

البيانات الحقيقية

تم دعم الفاعل بالسطح المبكر للأطفال المبتسرين بواسطة 6 تجارب صغيرة عرض انخفاض معدل الوفيات (RR 0.84). A التحليل التلوي ذو التأثير الثابت فائدة مؤكدة (P = 0.04). لكن نموذج التأثيرات العشوائية لم يظهر أي أهمية (p=0.12) - تجاوز فاصل الثقة 1.0. لاحقًا، وجدت الدعم (2010) and فون (2012)، تجربتان عمليتان كبيرتان مع ~ 2000 حديثي الولادة مجتمعة، لا فائدة من الفاعل بالسطح المبكر مقابل الخافض للتوتر السطحي اللاحق. تم تغيير الممارسة السريرية بناءً على تجارب صغيرة ونموذج خاطئ.

اختيار نموذج طبيب حديثي الولادة: 2005
أنت تقوم بتحديث مراجعة كوكرين للفاعل بالسطح المبكر. أظهرت ست تجارب صغيرة فائدة مع نموذج التأثير الثابت. نموذج التأثيرات العشوائية غير مهم. ما الذي تقوم بالإبلاغ عنه؟
المسار أ: تقرير التأثير الثابت فقط
التأثير الثابت مهم. الإبلاغ عن النتيجة الإيجابية. تغيير الممارسة.
تعتمد وحدات العناية المركزة لحديثي الولادة المواد الخافضة للتوتر السطحي في وقت مبكر. التجارب اللاحقة لا تظهر أي فائدة. عكس الممارسة.
النتيجة: سنوات من التنبيب غير الضروري للأطفال المبتسرين
المسار ب: الإبلاغ عن كلا النموذجين
إظهار نتائج FE وRE. ضع علامة على أن الأهمية تعتمد على اختيار النموذج. دعوة لإجراء تجارب كبيرة.
عدم اليقين الصادق. أعطيت الأولوية للتجارب الكبيرة. الجواب الحقيقي يظهر بشكل أسرع.
النتيجة: تجنب الأطفال الخدج التدخل غير الضروري
الرؤيا
عندما يتغير الاستنتاج اعتمادًا على ما إذا كنت تستخدم التأثير الثابت أو التأثيرات العشوائية، يكون الاستنتاج هشًا. الإبلاغ عن كليهما. الاعتراف بعدم اليقين. وتذكر: النتيجة الهشة من التجارب الصغيرة ليست تفويضًا لتغيير الممارسة.

1. لماذا أظهر التحليل التلوي للمغنيسيوم فائدة لم يجدها ISIS-4؟

A. كانت منهجية ISIS-4 معيبة
B. خطأ في الحساب في التحليل التلوي
C. تحيز النشر في التجارب الصغيرة
D. كان LIMIT-2 ضعيفًا

2. ما هي العلامة التحذيرية التي ينبغي أن تنبه المراجعين إلى التحيز المحتمل؟

A. مخطط قمع غير متماثل (تجارب صغيرة تظهر تأثيرات أكبر)
B. عدم تجانس منخفض (I² = 0%)
C. معقولية بيولوجية قوية
D. عدد قليل جدًا من التجارب التي يمكن تحليلها

3. عند الاشتباه في تحيز النشر، ما النموذج الذي قد يؤدي إلى تضخيم التحيز؟

A. نموذج التأثير الثابت
B. نموذج التأثيرات العشوائية
C. النموذج البايزي
D. التحليل التلوي للشبكة

يمكن أن تظهر التجارب الصغيرة إشارات خاطئة.

المحاكمات الكبيرة تثبت الحقيقة.

التباين رسالة وليس ضجيج.

التباين رسالة وليس ضجيج.

الوحدة 8: عدم التجانس

الوحدة 8: عدم التجانس (ACCORD)

التباين رسالة وليس ضجيج.

ACCORD: 2008

عندما يخفي المتوسط الحقيقة.

🎯 أهداف التعلم

  • احسب وفسر I² وτ² وفترات التنبؤ
  • تطبيق معايير ICEMAN لتقييم مصداقية المجموعة الفرعية
  • التمييز بين عدم التجانس السريري والمنهجي والإحصائي
  • إجراء وتفسير تحليلات حساسية الإجازة الواحدة
  • اشرح كيف كشف ACCORD عن التأثيرات التفاضلية عبر المجموعات الفرعية

"أنت على وشك أن تشهد واحدة من أكثر حالات إنهاء المحاكمات إثارة للصدمة في التاريخ..."

على مدى عقود من الزمن، كان لدى مجتمع مرضى السكري مبدأ توجيهي واحد: انخفاض نسبة السكر في الدم هو الأفضل. أظهر DCCT (1993) وUKPDS (1998) أن التحكم المكثف في الجلوكوز يقلل من مضاعفات الأوعية الدموية الدقيقة - العمى، الفشل الكلوي، تلف الأعصاب.

الاستقراء المنطقي:

إذا كان التحكم في الجلوكوز يمنع حدوث مضاعفات، ألا ينبغي أن يمنع التحكم المكثف أمراض القلب والأوعية الدموية أيضًا؟

الاختبار النهائي للتحكم المكثف في الجلوكوز

10,251
مرضى السكري من النوع 2
HbA1c <6%
الهدف المكثف
HbA1c 7-7.9%
الهدف القياسي

كان جميع المرضى مصابين بداء السكري من النوع 2 مع ارتفاع خطر الإصابة بأمراض القلب والأوعية الدموية - إما أمراض القلب والأوعية الدموية المثبتة أو عوامل الخطر المتعددة. تم تصميم التجربة لمدة 5.6 سنوات.

6 فبراير 2008

يدعو مجلس مراقبة سلامة البيانات إلى اجتماع طارئ.

بعد 3.5 سنوات، يتخذون قرارًا غير مسبوق:

أوقف التجربة.

حصيلة مكثف معيار HR (95% CI)
نقطة نهاية السيرة الذاتية الأولية 352 حدثًا 371 حدثًا 0.90 (0.78–1.04)
الوفيات الناجمة عن جميع الأسباب 257 حالة وفاة 203 حالة وفاة 1.22 (1.01–1.46)
نقص السكر في الدم الشديد 10.5% 3.5% 3.0× أعلى
زيادة بنسبة 22% في معدل الوفيات
54 حالة وفاة زائدة في ذراع العناية المركزة
🔍

تمرين التحقيق: معضلة الطبيب

أنت طبيب غدد صماء ولديك 500 مريض بالسكري. تم نشر نتائج أكورد. ماذا تقول لمرضاك الذين يسعون جاهدين للحصول على نسبة HbA1c <6%؟

هل المراقبة المكثفة ضارة للجميع؟ أم فقط للبعض؟

كشف تحليل المجموعة الفرعية:

مجموعة فرعيةالموارد البشرية المكثفةالتفسير
عدم وجود أمراض القلب والأوعية الدموية السابقة1.00 (0.76–1.32)لا تأثير
أمراض القلب والأوعية الدموية السابقة1.45 (1.15–1.84)ضرر كبير
خط الأساس لنسبة HbA1c <8%1.02 (0.75–1.40)لا تأثير
خط الأساس لنسبة HbA1c ≥8%1.29 (1.03–1.60)Harm

متوسط التأثير ملثمين عدم التجانس الحرج!

بالنسبة للمرضى الذين يعانون من أمراض القلب والأوعية الدموية أو التحكم الأساسي الضعيف، كان العلاج المكثف ضارًا.

عند الدراسات (أو المجموعات الفرعية) تظهر تأثيرات مختلفة، يجب علينا قياس هذا الاختلاف.

I² = 0–25%: عدم التجانس المنخفض. تكون التأثيرات متسقة عبر الدراسات.

I² = 25–50%: معتدل. ابحث عن مصادر الاختلاف.

I² = 50–75%: جوهري. فكر فيما إذا كان التجميع مناسبًا.

I² = 75–100%: كبير. قد يكون التقدير المجمع الواحد مضللاً.

لكن I² وحده لا يخبرك بما يجب فعله — فهو يشير إلى أنك بحاجة إلى مزيد من البحث.

بينما يخبرك I² بنسبة التباين الناتج عن عدم التجانس، τ² يخبرك بالحجم.

I² (نسبة مئوية)

"ما هو جزء التباين الإجمالي الناتج عن الاختلافات الحقيقية بين الدراسات؟"

المقياس: من 0% إلى 100%

τ² (مطلق)

"ما مدى اختلاف التأثيرات الحقيقية بين الدراسات؟"

نفس مقياس قياس التأثير

استخدم τ² للحساب فترات التنبؤ

يُظهر الفاصل الزمني للتنبؤ نطاق التأثيرات التي تتوقعها في دراسة جديدة - غالبًا ما يكون أوسع بكثير من الثقة الفاصل الزمني.

📊

الفاصل الزمني للتنبؤ: ما يخبرنا به ACCORD حقًا

النظر في التحليل التلوي للتحكم المكثف في الجلوكوز عبر تجارب متعددة...

فاصل الثقة

HR 1.10 (0.95–1.27)

"أفضل تقدير لدينا لمتوسط التأثير"

الفاصل الزمني للتنبؤ

HR 1.10 (0.70–1.73)

"نطاق التأثيرات في بيئة جديدة"

يشمل الفاصل الزمني للتنبؤ كلاً من المنفعة والضرر!

في بعض الإعدادات، قد يكون التحكم المكثف مفيدًا. وفي حالات أخرى، يمكن أن يقتل.

معايير مصداقية المجموعة الفرعية (مقتبسة من ICEMAN, Schandelmaier 2020 & Sun 2012)

1

هل كان تحليل المجموعة الفرعية محددًا مسبقًا؟

المجموعات الفرعية اللاحقة عرضة للبيانات التجريف

2

هل هناك مبرر بيولوجي معقول؟

يجب أن تكون الآلية واضحة ومستقلة عن البيانات

3

هل التأثير ثابت عبر النتائج ذات الصلة؟

إذا ظهر ضرر للوفيات، فهل هناك ضرر مماثل للاحتشاء الدماغي أو السكتة الدماغية؟

4

هل هناك تكرار مستقل؟

هل تم تأكيد تأثير المجموعة الفرعية في دراسات أخرى؟

المعيارالتقييمالنتيجة
محددة مسبقًا؟ نعم - كانت أمراض القلب والأوعية الدموية السابقة في البروتوكول
المنطق البيولوجي؟ نعم، نقص السكر في الدم أكثر خطورة مع الأمراض القلبية الوعائية
نتائج متسقة؟ نعم - تمت محاذاة معدل الوفيات الناجمة عن السيرة الذاتية والوفيات الناجمة عن جميع الأسباب
النسخ المتماثل المستقل؟ جزئيًا - ADVANCE، أظهر VADT أنماطًا مماثلة ~

تصنيف ICEMAN: مصداقية عالية

يبدو أن الضرر التفاضلي لدى المرضى المعرضين لمخاطر عالية حقيقي.

بالنسبة للمرضى الذين لا يعانون من أمراض القلب والأوعية الدموية: يظل التحكم المعتدل في الجلوكوز (نسبة HbA1c ~ 7%) هو الهدف. السيطرة المكثفة قد تقلل من مضاعفات الأوعية الدموية الدقيقة.

بالنسبة للمرضى الذين يعانون من أمراض القلب والأوعية الدموية المثبتة: تجنب الأهداف المكثفة. نقص السكر في الدم يشكل خطرا على القلوب المتضررة.

بالنسبة للمرضى المسنين: أهداف مريحة. نوعية الحياة مهمة. السيطرة الصارمة تسبب السقوط والارتباك والوفيات الزائدة.

العلاج "مقاس واحد يناسب الجميع" ليس دواءً يركز على المريض.

الانحدار التلوي

عندما يكون عدم التجانس مرتفعًا، يمكن للانحدار التلوي تحديد المتغيرات المشتركة على مستوى الدراسة التي تفسر التباين.

السؤال

هل يختلف حجم التأثير بشكل منهجي مع الدراسة الخصائص؟

المتغيرات المصاحبة
السنة، الجرعة، المدة، المخاطر الأساسية، جودة الدراسة
المخرجات
معامل الانحدار (المنحدر)، R²، عدم التجانس المتبقي

الحذر

يتطلب الانحدار التلوي ≥10 دراسات لكل متغير مشترك. مع القليل من الدراسات، فهي استكشافية فقط. مغالطة بيئية: الارتباطات على مستوى الدراسة قد لا تنطبق على الأفراد.

مثال: في ACCORD، قد يختبر الانحدار التلوي ما إذا كان تأثير العلاج يختلف حسب خط الأساس لـ HbA1c، مما يظهر الضرر يتركز في المرضى الذين يعانون من مستويات عالية جدًا.

القصة: ثورة ضغط الدم SPRINT

ما هو الرقم الذي ينقذ الأرواح؟ من يقرر؟

البيانات الحقيقية

لعقود من الزمن، كان الهدف: علاج ضغط الدم <140 ملم زئبق الانقباضي. ثم جاء SPRINT (2015): 9,361 مريضًا شديد الخطورة عشوائية إلى أهداف مكثفة (<120) مقابل أهداف قياسية (<140). تم تخفيض العلاج المكثف أحداث السيرة الذاتية بنسبة 25% and الوفاة بنسبة 27%. توقفت المحاكمة مبكرا من أجل الفائدة. تغيرت المبادئ التوجيهية في جميع أنحاء العالم.

قبل SPRINT: لجنة المبادئ التوجيهية
لقد قمت بوضع إرشادات لضغط الدم في عام 2014. وكان الهدف أقل من 140 لسنوات. هل يجب عليك الانتظار للحصول على أدلة أفضل؟
المسار أ: الحفاظ على الوضع الراهن
احتفظ بالهدف <140 (الممارسة المتبعة، الحد الأدنى من الجدل)
المبادئ التوجيهية دون تغيير. يستمر الأطباء في العلاج إلى أقل من 140.
النتيجة: تفويت الفرصة لمنع الوفيات
المسار ب: تمويل التجربة النهائية
انتظر نتائج SPRINT قبل تحديث الأهداف
SPRINT يوضح الفائدة. قم بتحديث الهدف إلى <120 للمرضى المعرضين لمخاطر عالية.
النتيجة: ما يقدر بأكثر من 100.000 حياة تم إنقاذها على مستوى العالم
JNC 7 (2003): <140
سنوات من عدم اليقين
SPRINT (2015): <120 للحالات عالية الخطورة
الرؤيا
"معيار الرعاية" غير ثابت. ويتغير عندما تتحدى التجارب الافتراضات. على مدى عقد من الزمن، ربما لم يتم علاج المرضى بشكل كاف لأنه لم يختبر أحد السؤال الواضح.

1. لماذا تم إيقاف تجربة ACCORD مبكرًا؟

A. أظهرت المراقبة المكثفة فائدة واضحة للقلب والأوعية الدموية
B. أدت السيطرة المكثفة إلى زيادة معدل الوفيات
C. كان التسجيل بطيئًا جدًا
D. نفدت الميزانية

2. ما الذي يخبرنا به الفاصل الزمني للتنبؤ والذي لا يخبرنا به فاصل الثقة؟

A. يتم تقدير التأثير الحقيقي بشكل أكثر دقة
B. حجم العينة مناسب
C. نطاق التأثيرات التي نتوقعها في دراسة جديدة
D. الصيغة الرياضية تستخدم

3. وفقًا لـ ICEMAN، ما هو العامل الأكثر أهمية لمصداقية المجموعة الفرعية؟

A. المواصفات المسبقة لفرضية المجموعة الفرعية
B. حجم عينة كبير في المجموعة الفرعية
C. قيمة p ذات دلالة إحصائية
D. نتائج متعددة تظهر نفس الاتجاه

عندما تختلف الدراسات،

استمع إلى الخلاف.

التباين رسالة وليس ضجيج.

غياب الدليل ليس دليلاً على الغياب.

الوحدة 9: الدراسات المخفية

الوحدة 9: الدراسات المخفية (Reboxetine)

غياب الدليل ليس دليلاً على الغياب.

ريبوكسيتين: 2010

الـ 74% التي لم تر النور أبدًا.

🎯 أهداف التعلم

  • تفسير المخططات القمعية لاكتشاف عدم التماثل
  • تطبيق اختبار إيجر و اختبارات إحصائية أخرى لتحيز النشر
  • تنفيذ طريقة القطع والتعبئة لتعديل التحيز
  • تقييم نقدي لقيود اختبارات تحيز النشر
  • تطبيق المبدأ: "غياب الدليل ليس دليلاً على الغياب"

"أمل جديد لمرضى الاكتئاب الذين لا يستطيعون تحمل مثبطات استرداد السيروتونين الانتقائية..."

كان Reboxetine (Edronax) مضادًا جديدًا للاكتئاب - وهو مثبط انتقائي لإعادة امتصاص النوربينفرين (NRI). وعلى عكس مثبطات استرداد السيروتونين الانتقائية، فقد استهدف نظامًا مختلفًا من الناقلات العصبية. بالنسبة للمرضى الذين فشلوا أو لم يتمكنوا من تحمل فلوكستين أو سيرترالين، فقد قدم آلية جديدة.

1997
موافقة الاتحاد الأوروبي
50+
البلدان المعتمدة
الملايين
الوصفات الطبية المكتوبة

ما يمكن للأطباء العثور عليه في المجلات الطبية:

مقارنةالتجارب المنشورةالنتيجة المنشورة
ريبوكسيتين مقابل الدواء الوهمي 3 تجارب (العدد = 507) أفضل بكثير (SMD = 0.56)
ريبوكسيتين مقابل SSRIs 4 تجارب (العدد = 628) ما يعادل أو أفضل

تحكي الأدبيات المنشورة قصة واضحة:

يعمل Reboxetine. يستفيد المرضى. يصف بثقة.

ولكن ماذا عن التجارب التي لم تتمكن من رؤيتها؟

في عام 2010، قدم الباحثون الألمان في IQWiG طلبًا إلى وكالة الأدوية الأوروبية...

وطالبوا بالوصول إلى all التجربة البيانات - منشورة وغير منشورة.

ما وجدوه غيَّر كل شيء.

Eyding et al., BMJ 2010

مقارنةتم النشر فقطجميع البيانات
ريبوكسيتين مقابل الدواء الوهمي SMD 0.56 (فائدة) SMD 0.10 (بدون فائدة)
المرضى قيد التحليل 507 (14%) 2,731 (100%)
ريبوكسيتين مقابل SSRIs ما يعادل أدنى (RR 1.23 للضرر)
المرضى قيد التحليل 628 (26%) 2,411 (100%)
لم يتم نشر 74% من بيانات المرضى مطلقًا
لم تظهر التجارب المخفية أي فائدة وأكثر من ذلك ضرر
🔍

تمرين التحقيق: درج الملفات

أنت مراجع منهجي في عام 2008. تبحث في PubMed وEmbase ومكتبة كوكرين عن جميع تجارب الريبوكسيتين. وجدت 7 تجارب منشورة تظهر الفائدة.

هل يمكنك الوثوق بهذا الدليل؟

⚠️ مسار التحويل غير متماثل بشكل كبير!

جميع الدراسات المنشورة تتجمع في جانب واحد. أين التجارب الفارغة والسلبية؟

1

مخطط القمع

حجم تأثير المؤامرة مقابل الخطأ القياسي. يشير القمع المتماثل إلى عدم وجود أي تحيز؛ عدم التماثل يثير الإنذارات.

2

اختبار انحدار إيجر

تأثير الانحدار/SE على 1/SE. يشير التقاطع غير الصفري (P <0.10) إلى تأثيرات دراسة صغيرة. ملاحظة: تضخم معدل الإيجابية الكاذبة مع النتائج الثنائية؛ استخدم اختبار بيترز بدلاً من ذلك.

3

اختبار بيترز

بالنسبة للنتائج الثنائية، سجل التراجعات أو على عكس إجمالي حجم العينة. أقل عرضة للإيجابيات الكاذبة.

4

تقليم وملء

تحسب الدراسات "المفقودة" لجعل مسار التحويل متماثلًا، ثم تعيد حساب التأثير المجمع.

📊

تفاعلية: القطع والتعبئة التحليل

دعونا نطبق القطع والتعبئة على بيانات reboxetine ونرى ما سيكون عليه التقدير المعدل...

تم النشر فقط

7 تجارب

SMD = 0.56

فائدة كبيرة

تقليم وملء

7 + 5 محسوبة = 12 تجربة

SMD = 0.23

منخفضة، لا تزال ذات أهمية اسمية

ولكن حتى التشذيب والملء قلل من أهمية المشكلة!

التأثير الحقيقي مع جميع البيانات هو SMD = 0.10 (فارغ في الأساس).
يعد الاقتطاع والتعبئة أمرًا متحفظًا — فهو لا يصحح بشكل كامل للنشر الانتقائي.

طرق اكتشاف تحيز النشر غير كاملة. الحل الحقيقي هو التسجيل المحتمل.

ClinicalTrials.gov
السجل الأمريكي (2000)
منظمة الصحة العالمية ICTRP
البوابة العالمية
بروسبيرو
مراجعة التسجيل

عند البحث عن التجارب، تحقق دائمًا من السجلات. قارن عدد مسجل المحاولات بالرقم منشور. هذه الفجوة هي إشارة التحذير الخاصة بك.

منذ عام 2005، يتطلب ICMJE التسجيل التجريبي كشرط للنشر.

"تم تسجيل جميع التجارب. تم الإبلاغ عن جميع النتائج."

فضيحة الريبوكسيتين، إلى جانب حالات مماثلة في أدوية أخرى، حفزت حركة عالمية:

2013: سياسة البيانات السريرية لوكالة الأدوية الأوروبية

تلتزم وكالة الأدوية الأوروبية بنشر تقارير الدراسات السريرية

2016: إنفاذ قانون تعديلات إدارة الغذاء والدواء

الإبلاغ عن النتائج الإلزامية على موقع ClinicalTrials.gov في غضون 12 شهرًا

تحالف AllTrials

أكثر من 90.000 مؤيد وأكثر من 700 منظمة تطالب بالشفافية

!

ألمانيا أوصى IQWiG ضد الريبوكستين لعلاج الاكتئاب

!

خفضت NICE في المملكة المتحدة تصنيفه إلى "غير مستحسن"

!

رفضت إدارة الغذاء والدواء عقار الريبوكستين في عام 2001 (كان لديهم إمكانية الوصول إلى بيانات غير منشورة)

لأكثر من عقد من الزمان، تلقى المرضى دواءً ليس أفضل من الدواء الوهمي.

لأنه تم نشر التجارب الإيجابية فقط.

القصة: الخداع في دراسة الباروكستين 329

ماذا لو كان الاستنتاج المنشور هو عكس البيانات الفعلية؟

البيانات الحقيقية

دراسة جلاكسو سميث كلاين 329 اختبار الباروكستين في اكتئاب المراهقين. خلصت الورقة المنشورة (2001) إلى أن الباروكستين كان "جيد التحمل وفعال بشكل عام". فشل البيانات الفعلية: الباروكستين في جميع النتائج الثمانية المحددة مسبقًا. عند إعادة التحليل (RIAT 2015)، أحداث الانتحار/إيذاء النفس: 23 في مجموعة الباروكستين مقابل 5 في العلاج الوهمي. أعادت الورقة المنشورة تحديد النتائج اللاحقة لتصنيع الأهمية. في عام 2015، تم إعادة تحليل RIAT (استعادة التجارب غير المرئية والمهجورة) باستخدام تقرير الدراسة السريرية الأصلي وخلص إلى أن الباروكستين كان ليست آمنة ولا فعالة للمراهقين.

لغز واضع الوصفات: 2003
أنت طبيب نفسي للأطفال. تقول الدراسة رقم 329 - وهي التجربة الكبيرة الوحيدة - إن الباروكستين يعمل لدى المراهقين. لكن إدارة الغذاء والدواء الأمريكية لم توافق عليه للمراهقين. يطلب منك أحد الوالدين وصفه. ماذا تفعل؟
المسار أ: ثق بالمنشور
تشير ورقة JAACAP التي تمت مراجعتها من قبل النظراء إلى أنها فعالة. يصف خارج التسمية.
ملايين الوصفات الطبية في جميع أنحاء العالم. الأحداث الانتحارية عند المراهقين.
النتيجة: أصدرت إدارة الغذاء والدواء تحذيرًا من الصندوق الأسود لمثبطات استرداد السيروتونين الانتقائية في الشباب (2004)
المسار ب: التحقق من سجل التجارب
ابحث في ClinicalTrials.gov عن نقاط النهاية الأصلية. لاحظ أن النتائج المنشورة لا تتطابق مع البروتوكول المسجل.
علامة حمراء: تم اكتشاف تبديل النتائج. أنت تحجب الدواء. أصبح المريض أكثر أمانًا.
النتيجة: تحديد تحيز النشر قبل الضرر
الرؤيا
لا يقتصر تحيز النشر على الدراسات المفقودة فقط. يتعلق الأمر بفقدان الحقيقة في الدراسات المنشورة. يمكن أن يؤدي تبديل النتائج والكتابة الشبحية والتقارير الانتقائية إلى تحويل التجربة الفاشلة إلى أداة تسويقية. قم دائمًا بمقارنة النتائج المنشورة ببروتوكولات التسجيل التجريبية.

1. ما هي النسبة المئوية لبيانات تجربة الريبوكسيتين التي تم إخفاؤها من الأدبيات المنشورة؟

A. 25%
B. 50%
C. 74%
D. 90%

2. لماذا يمكن أن يقلل القص والملء من التصحيح المطلوب؟

A. ويفترض أن التأثيرات موزعة بشكل طبيعي
B. إنها تنسب فقط الدراسات لتحقيق التماثل، والتي قد لا تعكس الواقع بشكل كامل
C. يتطلب 20 دراسة على الأقل
D. إنها تعمل فقط مع دراسات كبيرة جدًا

3. ما هو أفضل دفاع محتمل ضد تحيز النشر؟

A. المخططات القمعية في جميع التحليلات التلوية
B. اختبار إيجر قبل التجميع
C. تسجيل التجارب المحتملة
D. قد يكون المزيد من المجلات الطبية

ما لا يمكنك فعله راجع

أكثر أهمية مما تستطيع.

غياب الدليل ليس دليلاً على الغياب.

يجب اكتساب اليقين وليس افتراضه.

الوحدة 10: اليقين

الوحدة 10: اليقين (الفاعل بالسطح المبكر)

يجب اكتساب اليقين وليس افتراضه.

الفاعل بالسطح المبكر: 2012

عندما تتطور الأدلة عالية الجودة.

🎯 أهداف التعلم

  • تطبيق إطار GRADE الكامل لتقييم اليقين الدليل
  • تقييم جميع عوامل التخفيض الخمسة (RoB، عدم الاتساق، عدم المباشرة، عدم الدقة، تحيز النشر)
  • تحديد متى يجب الترقية للتأثير الكبير، أو الاستجابة للجرعة، أو الإرباك
  • إنشاء ملخص جداول النتائج مع تقديرات التأثير المطلق
  • تطبيق المبدأ: "يجب اكتساب اليقين، وليس افتراضه"

"ثورة في رعاية الأطفال حديثي الولادة..."

كانت متلازمة الضائقة التنفسية (RDS) هي السبب الرئيسي للوفاة بين الأطفال الخدج. كان تطوير المادة الخارجية مادة خافضة للتوتر السطحي— وهي المادة التي تحافظ على الحويصلات الهوائية من الانهيار — واحدًا من التقدم الكبير في طب الأطفال حديثي الولادة.

أصبح السؤال: متى يجب أن نعطي الفاعل بالسطح؟

وقائيًا (لجميع الرضع المعرضين لمخاطر عالية) أم بشكل انتقائي (فقط بعد تطور متلازمة الضائقة التنفسية)؟

أجريت تجارب معشاة ذات شواهد متعددة قبل عصر CPAP الروتيني

حصيلةوقائي مقابل انتقائييقين
وفيات الأطفال حديثي الولادة RR 0.73 (يفضل وقائي) High
اضطراب الشخصية الحدية أو الوفاة RR 0.84 (يفضل وقائي) High
توصية: إعطاء الفاعل بالسطح بشكل وقائي
اعتمدت المبادئ التوجيهية في جميع أنحاء العالم هذا النهج

لكن عالم رعاية الأطفال حديثي الولادة كان يتغير...

ظهرت تقنية جديدة: ضغط مجرى الهواء الإيجابي المستمر (CPAP)

دعم غير جراحي يمكن أن يساعد الرئتين المبتسرين دون التنبيب.

هل ستظل الأدلة القديمة سارية؟

تجارب جديدة أجريت في عصر CPAP

حصيلةتجارب قديمةتجارب جديدة
اضطراب الشخصية الحدية أو الوفاة RR 0.84 (يفضل وقائي) RR 1.12 (تفضيلات انتقائية)
الحاجة إلى إصلاحات ميكانيكية التهوية السفلى مع وقائي أعلى مع وقائي!
الانعكاس الكامل
في عصر جهاز CPAP، يسبب الفاعل بالسطح الوقائي مزيدًا من الضرر
🔍

التحقيق: لماذا تطورت الأدلة؟

أنت طبيب حديثي الولادة. يسأل أحد الزملاء: "كيف يمكن للتجارب العشوائية أن تتناقض مع بعضها البعض؟"

هل كان الدليل الأصلي خاطئًا؟

1

تغيرت غير المباشرة

التجارب القديمة: لا يتوفر جهاز CPAP. تجارب جديدة: معيار رعاية CPAP.

2

تحسين المقارنة

الفاعل بالسطح الانتقائي + CPAP أفضل من التنبيب الوقائي.

3

مسائل السياق

قد لا تنطبق الأدلة من عصر واحد على آخر.

ولهذا السبب يقوم GRADE بتقييم عدم المباشرة!

قد تصبح الأدلة عالية الجودة غير قابلة للتطبيق عندما يتغير السياق.

تصنيف التوصيات والتقييم والتطوير والتقييمات

GRADE يجيب على السؤال: ما مدى ثقتنا في هذا التقدير؟

⊕⊕⊕⊕ مرتفع: واثق جدا. التأثير الحقيقي قريب من التقدير.

⊕⊕⊕◯ متوسط: واثق إلى حد ما. من المحتمل أن يكون التأثير الحقيقي قريبًا، ولكنه قد يختلف بشكل كبير.

⊕⊕◯◯ منخفض: ثقة محدودة. قد يختلف التأثير الحقيقي بشكل كبير.

⊕◯◯◯ منخفض جدًا: ثقة قليلة جدًا. من المحتمل أن يكون التأثير الحقيقي مختلفًا إلى حد كبير.

تبدأ أدلة RCT عند المستوى العالي. يمكن تخفيض تصنيفها إلى ما يلي:

1

خطر التحيز

التوزيع العشوائي المعيب، ونقص التعمية، والمتابعة غير الكاملة، والتقارير الانتقائية

2

التناقض

عدم التجانس غير المبرر عبر الدراسات (I² كبير، CIs غير متداخلة)

3

عدم المباشرة

الاختلافات في عدد السكان أو التدخل أو المقارنة أو النتائج من السؤال

4

عدم الدقة

فترات ثقة واسعة، حجم عينة صغير، أحداث قليلة

5

انحياز النشر

مؤامرة قمع غير متماثلة، تجارب مسجلة مفقودة، تأثير الراعي

يمكن تخفيض كل عامل بمقدار مستوى واحد أو مستويين

مرتفع → معتدل → منخفض → منخفض جدًا

مثال: تحليل تلوي للتجارب المعشاة ذات الشواهد (يبدأ مرتفعًا) مع ارتفاع خطر التحيز (↓1) وعدم المباشرة الخطيرة (↓1) سيتم تصنيفها LOW.

📊

تفاعلي: قم بتطبيق GRADE على الفاعل بالسطح

دعونا نقيم مدى يقين الأدلة الخاصة بالفاعل بالسطح الوقائي باستخدام التجارب القديمة مقابل التجارب الجديدة.

التجارب القديمة (ما قبل CPAP)

البداية: عالية (المضبوطة)

خطر التحيز: منخفض (−0)

التناقض: لا شيء (−0)

عدم المباشرة: جدي (−1)

معايير رعاية مختلفة اليوم

نهائي: ⊕⊕⊕◯ معتدل

تجارب جديدة (عصر CPAP)

البداية: عالية (المضبوطة)

خطر التحيز: منخفض (−0)

التناقض: لا شيء (−0)

عدم المباشرة: لا شيء (−0)

تتطابق مع الممارسة الحالية

نهائي: ⊕⊕⊕⊕ مرتفع

تبدأ الأدلة الرصدية عند LOW. يمكن ترقيتها لـ:

+1

حجم كبير من التأثير

RR >2 أو <0.5 بدون أي إرباك معقول

+1

تدرج الاستجابة للجرعة

تعرض أعلى = تأثير أكبر في نمط ثابت

+1

الإرباك المتبقي

جميع الإرباكات المعقولة من شأنها أن تقلل من التأثير (تقوي الاستدلال السببي)

يتطلب GRADE لغة شفافة حول الثقة:

عالي: "الفاعل بالسطح الوقائي يقلل من وفيات ..."

معتدل: "الفاعل بالسطح الوقائي ربما يقلل ..."

LOW: "الفاعل بالسطح الوقائي قد يقلل ..."

منخفض جدًا: "نحن غير متأكد ما إذا كان الفاعل بالسطح الوقائي يقلل معدل الوفيات..."

تضمن هذه اللغة فهم الأطباء لقوة الأدلة.

القصة: مفارقة الأكسجين عند الأطفال المبتسرين

هل يمكن أن يصبح الكثير من المنقذ قاتلاً؟

البيانات الحقيقية

1940s-50s: أنقذت تركيزات الأكسجين العالية الأطفال المبتسرين من فشل الجهاز التنفسي. ثم جاء وباء العمى— التنسج الليفي القهقري (يسمى الآن ROP). الأطباء خفضوا الأكسجين بشكل كبير. انخفض العمى. ولكن بعد ذلك: زيادة الوفيات وتلف الدماغ من نقص الأكسجة. مستوى الأكسجين الأمثل المطلوب عقود من التجارب للعثور على. أخيرًا حددت تجارب SUPPORT/BOOST II النافذة العلاجية: SpO2 91-95%.

معضلة طبيب حديثي الولادة: 1955
أنت طبيب حديثي الولادة. الأطفال الخدج الذين يعانون من نسبة عالية من الأكسجين يصابون بالعمى. ماذا تفعل؟
المسار أ: التخفيض الدراماتيكي
تقليل الأكسجين بشكل كبير لمنع العمى
انخفاض معدلات العمى. لكن بعض الأطفال يموتون أو يعانون من تلف في الدماغ بسبب نقص الأكسجة.
النتيجة: مقايضة ضرر بآخر
المسار ب: دراسة منهجية
معايرة الأكسجين بعناية، ودراسة العلاقة بين الجرعة والاستجابة
يستغرق عقودًا من الزمن ولكنه يحدد في النهاية النطاق الأمثل.
النتيجة: تحسين البقاء والرؤية
الأربعينيات: ارتفاع الأكسجين ينقذ الأرواح
الخمسينيات: وباء العمى
من الستينيات إلى السبعينيات: الوفيات الناجمة عن انخفاض الأكسجين
2010: الدعم/التعزيز يحدد النطاق الأمثل
الرؤيا
كل تدخل له نافذة علاجية. فالعثور عليه يتطلب القياس وليس الافتراض. لقد تأرجح البندول لمدة 60 عامًا قبل أن تحدد الأدلة التوازن.

1. لماذا تم عكس توصية الفاعل بالسطح بين عامي 2003 و2012؟

A. كانت التجارب الأصلية احتيالية
B. غيّر CPAP المقارنة (غير مباشر)
C. لا يوجد عدد كافٍ من المرضى في التجارب الأصلية
D. تم قياس النتيجة بشكل مختلف

2. أي مما يلي لا يعد عامل تخفيض درجة؟

A. خطر التحيز
B. عدم الدقة
C. تحيز النشر
D. حجم كبير من التأثير

3. ما اللغة التي يجب استخدامها لأدلة اليقين المنخفضة؟

A. "التدخل يقلل..."
B. "من المحتمل أن التدخل يقلل..."
C. "التدخل قد يقلل..."
D. "نحن غير متأكدين سواء..."

الرقم ليس كافيًا.

يجب عليك التعبير عن مدى تأكدك.

يجب اكتساب اليقين وليس افتراضه.

الأساليب تحمي المرضى من ثقتنا.

الوحدة 11: المراجعة الحية

الوحدة 11: المراجعة الحية (COVID-19)

الأساليب تحمي المرضى من ثقتنا.

كوفيد-19 هيدروكسي كلوروكين: 2020

عند تلبية الضرورة الملحة للأدلة.

🎯 أهداف التعلم

  • تطبيق التحليل التسلسلي التجريبي لتحديد متى تكون الأدلة كافية
  • تصميم مراجعة منهجية حية والحفاظ عليها
  • إنشاء مشغلات التحديث وحدود العبث/الضرر
  • إدارة التعددية وإنفاق ألفا في التحليلات المتسلسلة
  • اشرح كيف تطور التوليف السريع للأدلة خلال كوفيد-19

"ينتشر الفيروس بشكل أسرع من انتشارنا فهم..."

كان فيروس كورونا (COVID-19) يقتل الآلاف. امتلأت وحدات العناية المركزة. ولم يكن هناك لقاح ولا علاج. ثم بصيص من الأمل: أظهر هيدروكسي كلوروكين (HCQ)- وهو دواء قديم للملاريا - نشاطًا مضادًا للفيروسات في الدراسات المعملية.

مارس 20
دراسة غوتريت (فرنسا)
36 نقطة
غير عشوائية
الفيروسي
تحسين التخليص

في غضون أسابيع من دراسة غوتريت:

!

28 مارس: تصدر إدارة الغذاء والدواء الأمريكية ترخيص الاستخدام في حالات الطوارئ لـ HCQ

!

4 أبريل: الهند تحظر تصدير HCQ (مخاوف من الاكتناز)

!

عالمي: يؤثر النقص على مرضى الذئبة والتهاب المفاصل الروماتويدي

تلقى الملايين HCQ بناءً على دراسة مراقبة أجريت على 36 مريضًا

ما الخطأ الذي يمكن أن يحدث؟

🔍

التحقيق: غوتريت الدراسة

أنت أحد خبراء EBM المطلوب منك تقييم دراسة HCQ الفرنسية. فحص التصميم...

المشكلةتأثير
غير عشوائيةتحيز الاختيار – من حصل على HCQ؟
تم استبعاد 6 مرضىذهب 3 إلى وحدة العناية المركزة، وتوفي واحد، وانسحب واحد، وأصيب واحد بالغثيان
نتيجة بديلةالحمل الفيروسي، وليس النتائج السريرية
التحكم من مستشفيات مختلفةرعاية مختلفة واختبارات مختلفة
لا يسبب العمىالتحيز في التوقعات في الاختبارات المعملية

ستسجل هذه الدراسة خطرًا كبيرًا للتحيز على RoB 2.0

درجة اليقين: منخفض جدًا. ومع ذلك فقد غيرت السياسة العالمية.

1

التحيز الزمني الخالد

يجب على المرضى البقاء على قيد الحياة لفترة كافية لتلقي العلاج. تتم مقارنة الناجين بغير الناجين.

2

الخلط عن طريق الإشارة

قد يحصل المرضى الأكثر مرضًا على علاجات مختلفة. تلقى المرضى الأكثر صحة HCQ في وقت مبكر.

3

تأثير المستخدم الصحي

يميل المرضى الذين يطلبون العلاج إلى أن يكونوا أكثر صحة بشكل عام.

4

الإبلاغ عن النتائج

تم نشر الدراسات ذات النتائج الإيجابية بشكل أسرع.

تم الانتهاء من التجارب الكبيرة والصارمة بسرعة ملحوظة

محاكمةNالنتيجة
التعافي (المملكة المتحدة) 4,716 لا فائدة من الوفيات (RR 1.09)
تضامن منظمة الصحة العالمية 954 لا فائدة (RR 1.19)
الأوركيد (الولايات المتحدة) 479 توقف لمدة عدم الجدوى
لم يقدم HCQ أي فائدة، وربما تسبب في ضرر
15 يونيو 2020: إدارة الغذاء والدواء الأمريكية تلغي ترخيص الاستخدام في حالات الطوارئ
📊

الجدول الزمني: الأدلة الرصدية مقابل الأدلة المعشاة ذات الشواهد

مارس-مايو 2020

رصدي: ~20 دراسة

اقترح فائدة

مجمعة أو ~0.65

يونيو-يوليو 2020

التجارب المعشاة ذات الشواهد: التعافي والتضامن

لا تظهر أي فائدة/ضرر

RR المجمعة ~ 1.10

من "واعد" إلى "غير فعال" في 3 أشهر

لهذا السبب نحتاج إلى التوزيع العشوائي - والمراجعات الحية لتتبع الأدلة المتطورة.

نهج جديد لـ الأدلة سريعة التطور:

1

المراقبة المستمرة

ابحث في الأدبيات أسبوعيًا أو حتى يوميًا للحصول على أدلة جديدة

2

التحليل التلوي التراكمي

تحديث التقديرات المجمعة مع كل تقارير تجربة جديدة

3

التحليل التسلسلي التجريبي (TSA)

تحديد متى تتراكم معلومات كافية لاستنتاج

4

الإصدار الشفاف

تتبع كل تغيير، والحفاظ على مسار التدقيق الكامل

متى تعلمنا ما يكفي؟

تطبق إدارة أمن المواصلات حدود التوقف على التحليل التلوي - على غرار التحليل المؤقت في تجربة واحدة. إنه يمثل حجم المعلومات المطلوبة (RIS) اللازمة لاكتشاف أو استبعاد تأثير ذي معنى سريريًا.

RIS
حجم العينة المطلوب
α-الإنفاق
يتحكم في خطأ النوع الأول
حدود
المنفعة / الضرر / العبث

بالنسبة لـ HCQ في فيروس كورونا، أظهرت إدارة أمن النقل أنه تم تجاوز حدود عدم الجدوى بحلول يونيو 2020.

1. يمكن أن تكون الدراسات الرصدية مضللة بشكل مذهل عندما يكون التحيز سائدًا. حتى أن العديد من الدراسات التي تشير إلى نفس الاتجاه يمكن أن تكون خاطئة.

2. يمكن إجراء التجارب المعشاة ذات الشواهد بسرعة عند وجود الإرادة. تم تسجيل أكثر من 5000 مريض في برنامج RECOVERY خلال أسابيع.

3. المراجعات الحية ضرورية للمواضيع المتطورة. تصبح المراجعات ذات النقاط الزمنية الثابتة قديمة الطراز على الفور.

4. الضغط السياسي لا يغير علم الأحياء. الأساليب الصارمة تحمي المرضى حتى عندما يكونون تحت الضغط.

القصة: ثورة حساسية الفول السوداني LEAP

ماذا لو كانت الوقاية هي السبب؟

البيانات الحقيقية

لعقود من الزمن، أوصت إرشادات طب الأطفال بما يلي: تجنب تناول الفول السوداني في مرحلة الطفولة لمنع الحساسية. وفي الوقت نفسه، معدلات حساسية الفول السوداني تضاعف ثلاث مرات من عام 1997 إلى عام 2008. ثم جاء قفزة (2015): 640 رضيعًا معرضين لخطر شديد تم اختيارهم بصورة عشوائية لإدخال الفول السوداني مبكرًا مقابل تجنبه. النتيجة: الإدخال المبكر أدى إلى تقليل حساسية الفول السوداني بنسبة 81% (1.9% مقابل 13.7%). كانت استراتيجية الوقاية هي التي تسببت في انتشار الوباء.

مفترق طرق أخصائي الحساسية: 2010
أنت طبيب حساسية أطفال. حساسية الفول السوداني آخذة في الارتفاع على الرغم من المبادئ التوجيهية لتجنبها. هل تشكك في العقيدة؟
المسار أ: اتبع الإرشادات
استمر في التوصية بتجنب الفول السوداني عند الرضع المعرضين لمخاطر عالية
المبادئ التوجيهية "قائمة على الأدلة". من الآمن اتباع الإجماع.
النتيجة: تستمر حساسية الفول السوداني في الارتفاع
المسار ب: تشكك في العقيدة
صمم تجربة لاختبار ما إذا كان التقديم المبكر قد يكون وقائيًا
تجربة LEAP تكشف الحقيقة. المبادئ التوجيهية عكس في جميع أنحاء العالم.
النتيجة: منع الوباء
2000: توصي AAP بتجنبه
2008: معدلات الحساسية ثلاث مرات
2015: LEAP يعكس الدليل
2017: المبادئ التوجيهية تتحول إلى التقديم المبكر
الرؤيا
يتطلب "أولاً، لا ضرر ولا ضرار" دليلاً. إن الافتراضات، حتى لو كانت حسنة النية، يمكن أن تسبب ضررا على نطاق واسع. يحتاج الجهاز المناعي إلى التعرض لتطوير القدرة على التحمل، وقد أدى التجنب إلى حدوث حساسية.

1. ما هو الخلل الرئيسي في دراسة غوتريت هيدروكسي كلوروكين؟

A. عدد قليل جدًا من المرضى
B. لا يسبب العمى
C. باستثناء المرضى الذين تدهورت حالتهم
D. متابعة قصيرة جدًا

2. ما الذي يساعد التحليل التسلسلي للمحاكمة في تحديده؟

A. ما هي الدراسات التي تنطوي على مخاطر عالية للتحيز
B. عندما تتراكم أدلة كافية
C. درجة عدم التجانس
D. ما هو العلاج الأفضل

3. لماذا أظهرت دراسات COVID الرصدية فائدة HCQ بينما لم تظهر التجارب المعشاة ذات الشواهد؟

A. سجلت التجارب المعشاة ذات الشواهد مرضى أكثر مرضًا
B. استخدمت التجارب المعشاة ذات الشواهد نتائج مختلفة
C. التحيز في الدراسات الرصدية
D. الدراسات الرصدية لديها بيانات أفضل

لا يمكن للسرعة أن تحل محل الدقة.

لكن الصرامة يمكن أن تكون سريعة.

توازن المراجعات الحية بين كليهما.

ليست كل إشارة حقيقة.

الوحدة 12: الأساليب المتقدمة

الوحدة 12: الأساليب المتقدمة

ليست كل إشارة حقيقة.

الأساليب المتقدمة

ما وراء التحليل التلوي الزوجي.

🎯 أهداف التعلم

  • تفسير هندسة التحليل التلوي للشبكة وتصنيفات SUCRA
  • تطبيق النماذج ثنائية المتغير للتحليل التلوي لدقة الاختبار التشخيصي
  • قم بإجراء تحليل تلوي للاستجابة للجرعة باستخدام شرائح مرنة
  • فهم متى تكون هناك حاجة إلى تحليل تلوي لبيانات المريض الفردية (IPD)
  • التعرف على الافتراضات والقيود كل طريقة متقدمة

"في بعض الأحيان يكون السؤال أكثر تعقيدًا من السؤال A مقابل B..."

تشكل الأساليب التي تعلمتها الأساس. لكن الواقع السريري يتطلب في كثير من الأحيان المزيد: أي من مضادات الاكتئاب العشرة هو الأفضل؟ ما هي الجرعة المثالية من الستاتين؟ هل يشخص هذا الاختبار السرطان المبكر بدقة؟

تقدم هذه الوحدة أربع طرق متقدمة - كل منها يجيب على أسئلة معقدة مختلفة.

عندما يكون لديك العديد من العلاجات ولكن القليل من التجارب المباشرة

يجمع NMA الأدلة المباشرة (أ ضد ب) مع الأدلة غير المباشرة (A vs C، B vs C → المستنتج A vs B) لمقارنة علاجات متعددة في وقت واحد.

سوكرا
احتمالات الترتيب، وليس حجم التأثير
تناسق
مباشر = غير مباشر؟
الشبكات
تصور الأدلة
🔍

مثال NMA: مضادات الاكتئاب

قام Cipriani 2018 NMA البارز بمقارنة 21 مضادًا للاكتئاب باستخدام 522 تجربة.

التحدي

21 عقارًا، ولكن لم يتم اختبار كل زوج وجهاً لوجه

الكثير مقابل الدواء الوهمي، القليل مقابل بعضها البعض

الحل

يجمع NMA بين الأدلة المباشرة وغير المباشرة عبر الشبكة

يصنف كل 21 طريقة من حيث الفعالية والمقبولية

النتيجة: حصلت بعض الأدوية على تصنيف أعلى من حيث الفعالية، والبعض الآخر من حيث المقبولية

لا يوجد دواء واحد هو "الأفضل" عالميًا؛ تفسير التصنيفات بفواصل زمنية موثوقة، وعبورية، ومقايضات سريرية.

1

العبور

ينبغي توزيع معدِّلات التأثير بالمثل عبر المقارنات؛ وإلا فإن المقارنات غير المباشرة قد تكون متحيزة

2

تناسق

تتفق الأدلة المباشرة وغير المباشرة (قابلة للاختبار)

3

الشبكة المتصلة

جميع المعالجات مرتبطة من خلال مقارنة مشتركة واحدة على الأقل

عندما تفشل الافتراضات، يمكن أن يكون NMA مضللاً

قم دائمًا بتقييم العبورية واختبار عدم الاتساق.

العثور على الجرعة المثالية

يستخدم طريقة جرينلاند-لونجنيكر مع خطوط مكعبة مقيدة لنموذج العلاقات غير الخطية بين الجرعة والتأثير.

1

الأنماط غير الخطية

على شكل J (الكحول والوفيات)، على شكل U (فيتامين د)، العتبة (الأسبرين)

2

الأهمية السريرية

ابحث عن الجرعة التي تحقق أفضل توازن بين الفوائد والأضرار، وليس فقط "الأكثر هو الأفضل"

المعيار الذهبي لتحليل المجموعات الفرعية

بدلاً من البيانات الموجزة المنشورة، احصل على البيانات الأولية على مستوى المريض من المحاكمين. يتيح إجراء تحليلات دقيقة للمجموعات الفرعية، ونمذجة الوقت حتى الحدث، والتعريفات الموحدة.

مرحلة واحدة
نموذج هرمي واحد (وليس تجربة ضخمة)
مرحلتين
التحليل ثم التجميع
80%+ هدف
هدف توفر البيانات

كانت المجموعة التعاونية لتجارب سرطان الثدي المبكرة رائدة في برنامج IPD MA في الثمانينات.

عندما يكون "التدخل" بمثابة اختبار

تجميع التحليل التلوي DTA حساسية (المعدل الإيجابي الحقيقي) و خصوصية (المعدل السلبي الحقيقي) - نتيجتان مترابطتان تتطلبان نماذج ثنائية المتغير.

1

نموذج ثنائي المتغير/HSROC

حسابات الارتباط بين الحساسية والخصوصية

2

منحنى SROC

ملخص منحنى ROC مع مناطق الثقة والتنبؤ بنسبة 95٪

3

كواداس-2

تقييم جودة دراسات الدقة التشخيصية

سؤالطريقة
هل يتغلب "أ" على "ب"؟MA الزوجي
أي من العلاجات العديدة هو الأفضل؟ماجستير الشبكة (NMA)
ما هي الجرعة المثالية؟الجرعة والاستجابة ماجستير
من يستفيد أكثر؟ (مجموعات فرعية)إي بي دي ما
ما مدى دقة هذا الاختبار؟دي تي ايه ما
كيف يتطور التأثير مع مرور الوقت؟البقاء على قيد الحياة/الوقت إلى الحدث MA

يجب أن تتطابق الطريقة مع السؤال. لا تجبر أبدًا على طرح سؤال بطريقة خاطئة.

القصة: المنشطات في ملحمة الإنتان

ثلاث محاكمات كبيرة. ثلاث إجابات مختلفة. ماذا تعتقد؟

البيانات الحقيقية

كورتيكوس (2008): 499 مريضا. الهيدروكورتيزون في الصدمة الإنتانية. لا فائدة من الوفيات. الغدة الكظرية (2018): 3658 مريضا. الهيدروكورتيزون. لا فائدة من الوفيات. أبروشس (2018): 1241 مريضا. هيدروكورتيزون + فلودروكورتيزون. انخفض معدل الوفيات (43% مقابل 49.1%، ع=0.03). نفس فئة التدخل بروتوكولات مختلفة. نتائج مختلفة.

تحدي الكاتب المبادئ التوجيهية
أنت تكتب إرشادات الإنتان. ثلاث محاكمات كبرى تختلف. كيف توصي؟
المسار أ: المتوسط البسيط
تجميع كافة التجارب الثلاث. التأثير الكلي غير مؤكد. استنتج "الأدلة غير واضحة".
تقول الإرشادات أن المنشطات اختيارية. لا توجد توصية قوية.
النتيجة: ترك الأطباء دون توجيه واضح
المسار ب: التحقيق في عدم التجانس
تحليل سبب اختلاف APROCCHSS (فلودروكورتيزون، مدة أطول، مجموعات سكانية مختلفة)
تحديد أن البروتوكول الفعال يختلف عن البروتوكولات غير الفعالة.
النتيجة: التوصية بالبروتوكول الفعال المحدد
الرؤيا
التجارب المتضاربة ليست فشلا. إنها خرائط توضح الأماكن التي يعمل فيها العلاج والأماكن التي لا يعمل فيها. إن الاختلافات بين التجارب - الجرعة، والمدة، والتدخلات المشتركة، والسكان - هي مفتاح الفهم.

1. ما هي الميزة الرئيسية للتحليل التلوي للشبكة مقارنة بالتحليل الزوجي؟

A. لا يتطلب استخراج البيانات
B. يقارن المعالجات التي لم يتم اختبارها بشكل مباشر ضد بعضها البعض
C. إنه يلغي الحاجة إلى تقييم خطر التحيز
D. وينتج قطعًا أفضل للغابات

2. لماذا يتطلب التحليل التلوي DTA نماذج ثنائية المتغير؟

A. للتعامل مع أكثر من دراستين
B. لضبط تحيز النشر
C. ترتبط الحساسية والنوعية
D. لإنشاء قطع أراضي الغابات

3. ما الذي يتطلبه افتراض "الاتساق" في NMA؟

A. يجب أن تكون جميع الدراسات ذات جودة عالية
B. يجب أن تتفق الأدلة المباشرة وغير المباشرة
C. يجب أن تكون أحجام العينات متشابهة
D. لا توجد دراسات مفقودة
منهجي

تغطي هذه الدورة سير عمل المراجعة المنهجية الكاملة. للتعمق أكثر، استكشف الدورات المصاحبة:

دورة DTA
منحنيات ثنائية المتغير/HSROC، SROC، QUADAS-2
خطر إتقان التحيز
RoB 2، ROBINS-I/E، تقييم على مستوى المجال
درجة اليقين
جداول SoF كاملة، GRADE-CERQual
التحليل التلوي IPD
نماذج ذات مرحلة واحدة/مرحلتين، ذات تأثيرات مختلطة
مخبر تحيز النشر
Copas، PET-PEESE، منحنى p، نماذج مختارة
مراجعات المظلة
AMSTAR 2، ROBIS، تصحيح التداخل
المراجعات النذير
CHARMS، PROBAST، تجميع الإحصائيات c
المراجعات الحية + المراجعات السريعة
TSA، مشغلات التحديث، الطرق المختصرة

الوحدة 12 كاملة

"يجب أن تتطابق الطريقة مع السؤال. الأساليب المتقدمة تجيب على الأسئلة المتقدمة، لكن الأساسيات لا تتغير أبدًا."

لقد أتقنت سير العمل الأساسي. تستكشف الوحدات العشر التالية الحدود: الاستدلال البايزي، والتحليل التلوي للشبكة، وبيانات المرضى الفردية، ونمذجة الاستجابة للجرعة، والمتانة والهشاشة، والإنصاف، والتوليف بمساعدة الذكاء الاصطناعي، والأدلة النوعية، والأساليب متعددة المتغيرات، وقابلية التكرار.

ليست كل إشارة حقيقة.

الوحدة 13: المنعطف البايزي

================ الوحدة 13: المنعطف البايزي (تجربة منصة التدافع) ==============================================================================================================

ليست كل إشارة حقيقة.

الوحدة 13: المنعطف البايزي

🎯 أهداف التعلم

  • اشرح الفرق بين الاستدلال المتكرر والاستدلال البايزي
  • تفسير التوزيعات السابقة والاحتمالات والتوزيعات اللاحقة
  • التمييز فواصل موثوقة من فواصل الثقة
  • فهم متى يقدم التحليل التلوي بايزي المزايا
  • التعرف على كيفية تأثير الاختيار المسبق على الاستنتاجات
افتتاحية القصة: التدافع

في عام 2005، بدأت تجربة

التي لن تنتهي أبدًا.

استخدمت تجربة STAMPEDE لسرطان البروستاتا تصميم منصة متعدد الأذرع ومتعدد المراحل (MAMS). يمكن إضافة الأسلحة أو إسقاطها مع تراكم الأدلة. وعلى الرغم من أن إحصاءاتها كانت متكررة، إلا أن الفلسفة التكيفية جسدت الروح الافتراضية: تحديث القرارات مع تراكم البيانات.

في الإحصائيات المتكررة، يعني الاحتمال التردد على المدى الطويل. 95% CI لا يعني "احتمال 95% أن التأثير الحقيقي موجود في الداخل". يعني: لو كررنا الدراسة إلى ما لا نهاية، لكانت 95% من الفترات تحتوي على الحقيقة.

القيمة p
P(بيانات | H₀)، وليس P(H₀ | بيانات)
95% CI
خاصية التغطية، وليس الاعتقاد
مُثَبَّت
تم إصلاح المعلمة الحقيقية

في الإحصائيات الافتراضية، يمثل الاحتمال درجة الاعتقاد. نبدأ بـ قبل (ما نؤمن به قبل البيانات)، قم بالتحديث باستخدام احتمالية (ما تخبرنا به البيانات)، واحصل على أ الخلفي (الاعتقاد المحدث).

1

السابقة × الاحتمالية = الخلفية

نظرية بايز: P(θ|data) ∝ P(data|θ) × P(θ)

2

الفترات الموثوقة

الفاصل الزمني الموثوق به بنسبة 95% قابل للتفسير احتماليًا، ومشروط بالنموذج المحدد والسابق.

الباحث
1

غير معلوماتية (غامضة)

عادي(0, 10000) أو منتظم. يتيح للبيانات السيطرة. يحاكي النتائج المتكررة.

2

معلوماتية ضعيفة

عادية (0, 1) لسجل OR. ينظم التقديرات المتطرفة مع الحفاظ على المرونة.

3

إعلامية

بناءً على الأدلة السابقة. قوية ولكنها مثيرة للجدل. يجب أن تكون محددة مسبقا.

4

نصف كوشي لـ τ

الموصى بها لعدم التجانس. يسمح نصف كوشي (0، 0.5) بـ τ كبيرة ولكنه يركز بالقرب من الصفر.

الباحث

لا يمكن حل معظم النماذج الافتراضية تحليليًا. نستخدم سلسلة ماركوف مونت كارلو (MCMC) لسحب عينات من الجزء الخلفي. الأدوات: JAGS، Stan، brms (R)، PyMC (Python).

السلاسل
سلاسل مستقلة متعددة (عادة 4)
التقارب: R̂ < 1.01 (صارم؛ النصوص الأقدم تستخدم <1.1)
ESS
Bulk-ESS> 400 للوسائل؛ tail-ESS > 400 لـ CIs
منهجي

بدلاً من الاختيار بين نماذج التأثير الثابت والتأثيرات العشوائية، بايزي متوسط النموذج (BMA) يزن كل نموذج حسب احتماله الخلفي. وهذا يفسر عدم اليقين في النموذج في التقدير النهائي.

BF

عوامل بايز

BF₁₀ > 10 = دليل قوي على H₁. BF₁₀ < 1/10 = دليل قوي على H₀.

العنصر النائب للأداة التفاعلية

اضبط القوة السابقة لترى كيف تؤثر على القوة الخلفية. شاهد كيف يطغى المزيد من البيانات على ما سبق.



مربع القصة

قصة STAMPEDE

تم إطلاق STAMPEDE في عام 2005 مع 5 أذرع بحثية تقارن علاجات سرطان البروستاتا المتقدم. بحلول عام 2016، أضافت دواء أبيراتيرون وأظهر انخفاضًا بنسبة 37% في الوفيات (HR 0.63، 95% CI 0.52–0.76).

يجسد تصميم المنصة التفكير التكيفي بايزي: التحليلات المؤقتة توجه اختيار الذراع، ويمكن إدخال أذرع جديدة مع ظهور العلاجات، وإسقاط الأذرع غير المجدية مبكرًا - مما ينقذ المرضى من المرضى غير الفعالين. العلاجات.

سجل STAMPEDE أكثر من 10000 مريض في أكثر من 100 مركز وأحدث تغييرًا جذريًا في رعاية سرطان البروستاتا. تسمح العقلية الافتراضية بتراكم الأدلة واتخاذ القرارات في الوقت الفعلي.

شجرة القرار
التحليل التلوي المتكرر مقابل التحليل بايزي
اختر النظرية الافتراضية عندما: (1) لديك معلومات مسبقة حقيقية، (2) تحتاج إلى بيانات احتمالية ("تأثير فرصة بنسبة 80% > 0")، (3) تجعل بعض الدراسات الخصائص المتكررة غير موثوقة، أو (4) تريد حساب متوسط النموذج.
بايزي مع معلومات سابقة ضعيفة
افتراضي عملي شائع. ينظم التقديرات المتطرفة دون فرض استنتاجات مسبقة قوية.
النظرية الافتراضية مع معلومات سابقة
فقط عندما تكون الأدلة المسبقة قوية ومحددة مسبقًا. يجب إجراء تحليل الحساسية.
كن متكررًا
أبسط ومفهوم جيدًا. يُفضل عندما يكون k كبيرًا ولا توجد معلومات مسبقة.
رد اتصال

هل تتذكر الوحدة 1؟

الإرسال من خلال عدسة بايزي

لو استخدم تحليل بايزي لـ CAST معلومات سابقة من العلوم الأساسية (مضادات اضطراب النظم تقمع PVCs)، فإن الجزء الخلفي سيظل يتحول بقوة نحو الأذى. ومع وجود ما يكفي من البيانات، حتى النتائج السابقة القوية تؤدي إلى الاحتمالية. الدرس المستفاد: الأساليب الافتراضية لا تحمي من المقدمات السيئة - ولكنها تضع الافتراضات شفاف.

Q1. ماذا يعني الفاصل الزمني المعقول بنسبة 95% بايزي؟

A. 95% من التجارب المتكررة ستنتج فواصل تحتوي على القيمة الحقيقية
B. هناك احتمال بنسبة 95% أن تقع المعلمة الحقيقية ضمن هذا الفاصل الزمني
C. الفاصل الزمني لديه فرصة 95% ليكون صحيحًا
D. سوف تقع 95% من البيانات المستقبلية في هذا النطاق

Q2. ما هو المستوى المسبق الموصى به للتغاير بين الدراسات (τ)?

A. موحد (0, 100)
B. عادي (0, 1)
C. نصف كوشي (0, 0.5)
D. ثابت عند 0.5
الحفل الختامي

الوحدة 13 كاملة

"لا يتعلق المنعطف البايزي بالرياضيات. بل يتعلق بالصدق - مما يجعل افتراضاتنا مرئية."

انتقال

ليست كل إشارة حقيقة.

الوحدة 14: الشبكة

====================================================== الوحدة 14: الشبكة (Cipriani 2018 — 21 مضادات الاكتئاب) =========

الأساليب تحمي المرضى من ثقتنا.

الوحدة 14: الشبكة

🎯 أهداف التعلم

  • اشرح سبب عدم كفاية المقارنات الزوجية عند وجود العديد من المعالجات
  • فسر هندسة الشبكة (العقد، الحواف، السُمك)
  • فهم العبور والاتساق ودور الأدلة غير المباشرة
  • فسر تصنيفات SUCRA وجداول الدوري
  • التعرف على متى يتم انتهاك افتراضات NMA
القصة: Cipriani 2018

يواجه الطبيب مريضًا

في الاكتئاب. أي دواء؟

هناك 21 مضادًا للاكتئاب موصوفة بشكل شائع. تقارن معظم التجارب المباشرة بين 2 أو 3 فقط. Cipriani et al. (2018، Lancet) ربطت 522 تجربة و116,477 مريضًا في شبكة واحدة.

1

دليل مباشر

التجارب التي تقارن بشكل مباشر بين A وB تعطي التقدير الأكثر موثوقية.

2

الأدلة غير المباشرة

في حالة وجود A مقابل C وB مقابل C، يمكننا استنتاج A مقابل B. هذا هو "المتعد" الافتراض.

3

الأدلة المختلطة

يجمع NMA بين الاثنين، مرجحًا بالدقة، لتصنيف جميع المعالجات في وقت واحد.

كل عقدة هي علاج. يمثل سمك الحافة عدد الدراسات التي تقارن هاتين المعالجتين.

الباحث

العبور: يجب أن يقترب التقدير غير المباشر (عبر المقارنة المشتركة) من التقدير المباشر. وهذا يتطلب أن يتم توزيع معدّلات التأثير بشكل مماثل عبر المقارنات.

تناسق: اختبار إحصائي لمقارنة الأدلة المباشرة وغير المباشرة. تساعد الاختبارات العالمية (التفاعل بين التصميم والمعالجة) والاختبارات المحلية (تقسيم العقدة) على تحديد حلقات عدم الاتساق.

الباحث
سوكرا
السطح تحت الترتيب التراكمي. تشير القيم الأعلى إلى احتمالية تصنيف أفضل، وليس تفوقًا مضمونًا.
درجة P
التناظرية المتكررة لملخصات احتمالية الترتيب. تفسير مع أحجام التأثير وعدم اليقين.

الحذر: يكون الترتيب مغريًا ولكنه مضلل عندما تكون الاختلافات بين المعالجات صغيرة أو غير مؤكدة. قم دائمًا بالإبلاغ عن فترات المصداقية/الثقة جنبًا إلى جنب مع الرتب.

منهجي

عندما تكون التدخلات معقدة (على سبيل المثال، السلوكية + الدوائية)، يقوم مكون NMA بتحليل المعالجات متعددة المكونات لتقدير المساهمة الفردية لكل مكون. يستخدم النماذج المضافة: التأثير (أ + ب) = التأثير (أ) + التأثير (ب) + التفاعل.

مربع القصة

شبكة سيبرياني

وجد تحليل لانسيت لعام 2018 أن جميع مضادات الاكتئاب الـ 21 كانت أكثر فعالية من العلاج الوهمي. احتل أميتريبتيلين وميرتازابين وفينلافاكسين المرتبة الأولى من حيث الفعالية. احتل أغوميلاتين، وفلوكستين، وإسيتالوبرام المرتبة الأعلى من حيث المقبولية (أقل عدد من المتسربين).

لا يوجد دواء واحد "فاز" في جميع النتائج. كشفت الشبكة عن مقايضات غير مرئية للتحليل الزوجي.

شجرة القرار
التحقق من جدوى NMA
لديك 15 تجربة معشاة ذات شواهد تقارن 6 ستاتينات مختلفة. بعض الأزواج لديهم أدلة مباشرة، والبعض الآخر لا.
التحقق من العبور، ثم ملاءمة NMA
التحقق من أن مجموعات المرضى وتصميمات الدراسة متشابهة بدرجة كافية عبر المقارنات.
تجاهل الأدلة غير المباشرة
يفقد القوة الإحصائية ويترك فجوات في قاعدة الأدلة.
تجميع الكل في مقارنة زوجية واحدة
ينتهك بنية الأدلة. الستاتينات هي أدوية مختلفة.

Q1. ما الافتراض الذي يجب أن يحمله الدليل غير المباشر حتى يكون صالحًا في NMA؟

A. العبور - تتم موازنة معدلات التأثير عبر المقارنات
B. التجانس - يجب أن يكون I² أقل من 25%
C. يجب أن تحتوي جميع الدراسات على أحجام عينات مماثلة
D. يجب أن تكون جميع الدراسات مزدوجة التعمية
إغلاق

الوحدة 14 كاملة

"ترى الشبكة ما لا تستطيع المقارنات الزوجية رؤيته: المشهد الكامل لاختيار العلاج."

ليست كل إشارة حقيقة.

الوحدة 15: الفرد

================ الوحدة 15: الفرد (EBCTCG - التحليل التلوي IPD) ==============================================================================================================

ما الذي كان مخفيا على مرأى من الجميع؟

الوحدة 15: الفرد

🎯 أهداف التعلم

  • اشرح لماذا يمكن للبيانات المجمعة أن تحجب التفاعلات بين العلاج والمتغيرات
  • التمييز بين المرحلة الواحدة ونماذج IPD ذات المرحلتين
  • التعرف على التحيز البيئي في التحليل التلوي الكلي
  • فهم التحديات العملية لجمع IPD
  • تفسير مخططات التفاعل بين العلاج والمتغير

لعقود من الزمن، كانت تجارب سرطان الثدي

الملخصات المنشورة. ليس المرضى.

قامت المجموعة التعاونية لتجارب سرطان الثدي المبكر (EBCTCG) بجمع سجلات فردية من أكثر من 100.000 امرأة عبر مئات التجارب. أظهرت تحليلات IPD الخاصة بهم أن فوائد عقار تاموكسيفين تعتمد بشكل كبير على حالة مستقبلات هرمون الاستروجين، وهو أمر غير مرئي في البيانات الإجمالية.

أبلغت كل تجربة منشورة عن عقار تاموكسيفين عن نتيجة إجمالية. ومن خلال مئات الدراسات، بدا أن عقار تاموكسيفين يقدم فائدة متواضعة. لكن "الفائدة المتواضعة" كانت عبارة عن متوسط يخفي حقيقة عميقة.

انقسام المجموعة الفرعية المخفية

RR 0.59
مجموعة فرعية إيجابية ER: انخفاض بنسبة 41% في التكرار
RR 0.97
المجموعة الفرعية سلبية ER: لا فائدة على الإطلاق

كان التأثير الإجمالي المجمع – أي الخلط بين المرضى المستجيبين وغير المستجيبين – مجرد خيال إحصائي. متوسط "متواضع" يبالغ في تقدير الفائدة لمجموعة واحدة ويشير إلى فائدة ضمنية حيث لا توجد فائدة للمجموعة الأخرى.

AD
الإجمالي: التأثير المنشور + CI فقط
IPD
الفرد: السجلات الأولية على مستوى المريض

يسمح IPD بما يلي: (1) تعريفات نتائج متسقة، (2) تحليل المجموعات الفرعية حسب خصائص المريض، (3) النمذجة من وقت لآخر، (4) التحقق من التحيز البيئي. إنه المعيار الذهبي لاستكشاف تعديل تأثير العلاج.

الباحث
1

مرحلتين

قم بتحليل كل دراسة على حدة، ثم اجمع بين التقديرات (مثل MA القياسي). بسيطة ولكنها تفقد المعلومات.

2

مرحلة واحدة

تناسب نموذج واحد مختلط التأثيرات لجميع بيانات المريض في وقت واحد. أكثر قوة للتفاعلات والأحداث النادرة.

Key: كلاهما يجب أن يأخذ في الاعتبار تجميع الدراسة. لا تقم أبدًا بتجميع IPD كما لو كان من تجربة واحدة ضخمة، فهذا يؤدي إلى الإرباك (مفارقة سيمبسون).

منهجي

قد يُظهر الانحدار التلوي باستخدام متوسط العمر على مستوى الدراسة أن المرضى الأكبر سنًا يستفيدون أكثر. ولكن قد يكون هذا تحيزًا بيئيًا- الارتباط على مستوى الدراسة لا يعكس الحقيقة على مستوى المريض. يمكن لـ IPD فقط أن ينفصل داخل الدراسة from بين تأثيرات الدراسة .

عندما يكذب الكل بشأن أجزائه

مفارقة سيمبسون: الاتجاه الذي يظهر في البيانات المجمعة ينعكس عندما يتم تجميع البيانات بواسطة متغير مربك.

المفارقة في الممارسة

وجد تحليل تجريبي ضخم أن العلاج X مفيد بشكل عام. لكن داخل كل دراسة، كان ضارًا. كيف؟ خلقت الاختلافات في المخاطر الأساسية بين الدراسات وهمًا، إذ حدث أن السكان الأكثر مرضًا يتلقون المزيد من العلاج، مما يؤدي إلى تضخيم الفائدة الإجمالية.

كيتس (2002، BMJ) أظهر أن التجميع عبر الدراسات دون مراعاة التجميع يمكن أن يعكس الاتجاه الواضح للتأثير.

ولهذا السبب تتضمن نماذج IPD ذات المرحلة الواحدة الدراسة كمتغير تجميعي - لمنع الخلط بين الدراسات من التنكر كتأثير علاجي.

مربع القصة

تراث EBCTCG

حددت التحليلات الوصفية لـ IPD الخاصة بـ EBCTCG علاج سرطان الثدي لمدة 40 عامًا. أظهر تحليلهم لعام 2005 للتاموكسيفين مقابل عدم العلاج فائدة واضحة في الأورام إيجابية الإستروجين (RR 0.59) ولكن لا فائدة في الأورام السلبية ER (RR 0.97).

وبدون وجود IPD، لكان التأثير الإجمالي الإجمالي قد تم تجميعه عبر كلا المجموعتين، مما أدى إلى إضعاف الفائدة وربما حرمان المرضى الذين لديهم ER إيجابي من حجم مكاسبهم.

هل تشك في حدوث تفاعلات بين العلاج والمتغيرات؟
Yes →

هل يمكنك الحصول على IPD من أكثر من 80% من التجارب؟

Yes → التحليل التلوي لـ IPD بمرحلة واحدة مع مصطلحات التفاعل
No → على مرحلتين: طلب IPD المتوفر + الركام للباقي
No →

هل التحيز البيئي مصدر قلق؟

Yes → يفضل IPD حتى بدون التفاعلات
No → قد يكون التحليل التلوي للبيانات المجمعة كافيا

قام EBCTCG بجمع البيانات من مئات التجارب على مدار 40 عامًا. تتضمن معظم التحليلات التلوية لـ IPD ما بين 5 إلى 20 تجربة. القرار يعتمد على السؤال وليس الطموح.

منهجي

تذكر الوحدة 3؟ بدا العلاج التعويضي بالهرمونات مفيدًا في الدراسات الرصدية ولكنه ضار في التجارب المعشاة ذات الشواهد. حدث نفس الإخفاء الكلي: أخفت الفائدة الإجمالية ضرر المجموعة الفرعية.

أظهر تحليل IPD لمبادرة صحة المرأة ذلك لاحقًا التوقيت مهم- النساء اللاتي بدأن العلاج التعويضي بالهرمونات خلال 10 سنوات من انقطاع الطمث كان لهن نتائج مختلفة عن تلك التي بدأنها في وقت لاحق. وكانت "فرضية التوقيت" غير مرئية في الملخصات المجمعة المنشورة.

الدرس يتكرر: يمكن للبيانات المجمعة أن تحجب التفاعلات الحرجة بين العلاج والمتغيرات. سواء كان الأمر يتعلق بحالة الطوارئ في سرطان الثدي أو التوقيت في العلاج التعويضي بالهرمونات، فإن البيانات على المستوى الفردي تكشف ما تخفيه الملخصات.

Q1. ما هي الميزة الأساسية لـ IPD مقارنة بالتحليل التلوي للبيانات المجمعة؟

A. ويتضمن دائما المزيد من الدراسات
B. إنه أرخص وأسرع
C. يمكنه استكشاف التفاعلات بين العلاج والمتغيرات دون تحيز بيئي
D. إنه يلغي الحاجة إلى نماذج التأثيرات العشوائية
إغلاق

الوحدة 15 كاملة

"وراء كل تقدير مجمع هناك أفراد لا يمكن لمجموع قصصهم أن تحكي."

التباين رسالة وليس ضجيج.

الوحدة 16: الجرعة

================ الوحدة 16: الجرعة (الكحول J-curve / Stockwell 2016) ==============================================================================================================

التباين رسالة وليس ضجيج.

الوحدة 16: الجرعة

🎯 أهداف التعلم

  • اشرح لماذا تغفل المقارنات الزوجية البسيطة العلاقات بين الجرعة والاستجابة
  • التمييز بين نماذج الاستجابة للجرعة الخطية والتربيعية والخددية
  • تفسير الخطوط المكعبة المقيدة بالعقد
  • تحديد تأثيرات العتبة والمنحنيات على شكل J/U
  • فهم مقارنة النماذج مع AIC/BIC

لعقود من الزمن، شرب معتدل

ظهرت لحماية القلب.

أظهر "المنحنى على شكل حرف J" أن الأشخاص الذين لا يشربون الخمر لديهم معدل وفيات أعلى بأمراض القلب والأوعية الدموية مقارنة بالذين يشربون الخمر بشكل معتدل. لكن ستوكويل وآخرون. (2016) أظهر أن المنحنى J كان نتيجة لتصنيف خاطئ للشاربين السابقين (الذين توقفوا عن التدخين بسبب المرض) على أنهم "ممتنعون".

بحلول عام 2010، أكدت أكثر من 100 دراسة رصدية وجود منحنى J. علمته الكتب الطبية. واستشهد به أطباء القلب. قامت جماعات الضغط في صناعة النبيذ بتمويل المؤتمرات حول هذا الموضوع.

100+
الدراسات الرصدية التي تؤكد منحنى J
15–25%
انخفاض معدل الوفيات القلبية الوعائية لدى الذين يشربون الخمر بشكل معتدل مقابل الممتنعين عن التدخين

بدت الأدلة ساحقة. ولكن ماذا لو كانت مجموعة المقارنة - "الممتنعون" - ملوثة؟

المستسلم المريض

محير مخفي

المشكلة

غالبًا ما يفعل الأشخاص الذين يتوقفون عن الشرب ذلك لأنهم مرضى بالفعل- أمراض الكبد، التفاعلات الدوائية، تشخيص السرطان. تم تصنيف هؤلاء "الشاربين السابقين" على أنهم "ممتنعون" في معظم الدراسات.

التأثير: ظهرت المجموعة المرجعية (الممتنعون). أقل صحة- ليس لأن الامتناع عن ممارسة الجنس كان ضارًا، ولكن لأن المرضى انضموا إليه.

عندما ستوكويل وآخرون. (2016، J مسمار المخدرات الكحول) إزالة الشاربين السابقين وتطبيق تصحيحات جودة الدراسة المناسبة: اختفى منحنى J. وكان التأثير الوقائي وهميا.

يسأل التحليل التلوي القياسي: "هل العلاج X فعال؟" يسأل التحليل التلوي للاستجابة للجرعة: "عند أي جرعة هل العلاج X يعمل بشكل أفضل؟" فهو يجسد العلاقة بين مستوى الجرعة والنتيجة عبر دراسات متعددة.

خطي
الأبسط: log(RR) = β × جرعة
خطي
مرنة: متعددات الحدود متعددة الحدود ذات عقد
عقدة
متعددة الحدود: جرعة^p1 + جرعة^p2
الباحث

مكان RCS عقدة عند نقاط الجرعة المحددة مسبقًا وتناسب متعددات الحدود الملساء فيما بينها. عادة 3-5 عقدة في كميات توزيع الجرعة. عقدة خطية وراء الحدود. تقارن اختبارات اللاخطية نموذج الشريحة بنموذج خطي أبسط.

AIC

مقارنة النماذج

مقارنة AIC/BIC الخطية مع ملاءمة الخط. أقل = أفضل. اختبر أيضًا الابتعاد عن الخطية (القيمة p لمصطلحات الشريحة).

أداة تفاعلية

قارن بين الخطية والتربيعية والتناسبات الخطية. شاهد كيف يتغير شكل النموذج مع اختلاف الافتراضات.

مربع القصة

تم فضح زيف منحنى J للكحول

وجدت إعادة تحليل ستوكويل عام 2016 أنه عندما تم استبعاد شاربي الكحول السابقين بشكل صحيح من المجموعة المرجعية "الممتنعين"، اختفى التأثير الوقائي للشرب المعتدل. كان منحنى J مدفوعًا بالتحيز المرضي.

كشف التحليل التلوي للاستجابة للجرعة عن الحقيقة: يعتمد شكل المنحنى بشكل حاسم على كيفية تعريف "الجرعة الصفرية". أنشأت الفئة المرجعية الخاطئة فائدة وهمية.

أثر منحنى J الوهمي على إرشادات الكحول في جميع أنحاء العالم:

UK

إرشادات NHS (حتى 2016)

"الشرب المعتدل قد يحمي القلب" ظهر في التوجيهات الرسمية. بعد تصحيح ستوكويل، قامت المملكة المتحدة بتعديل الحدود إلى 14 وحدة/أسبوع all يشربون (21 سابقًا للرجال). لم يتم الإعلان عن أي مبلغ "آمن".

US

اللجنة الاستشارية للمبادئ التوجيهية الغذائية

تم الاستشهاد بدراسات منحنى J حتى عام 2015. وأوصت لجنة عام 2020 بخفض الحدود إلى مشروب واحد يوميًا للرجال، مع الاعتراف بتحيز المجموعة المرجعية.

AU

المبادئ التوجيهية الأسترالية

تأخرت حدود الشرب الآمن بسبب أبحاث منحنى J الممولة من الصناعة والتي تروج للاستهلاك المعتدل "الوقائي للقلب"

هل لديك مستويات تعرض ≥3 (وليس فقط المكشوف مقابل غير المكشوف)؟
Yes →

هل العلاقة غير خطية بشكل معقول؟

Yes → الخطوط المكعبة المقيدة (3-5 عقدة).
No → قد يكفي الانحدار التلوي الخطي للاستجابة للجرعة
No →

التحليل التلوي القياسي الزوجي (لا يمكن الاستجابة للجرعة بمستويين فقط)

تحذير: تحقق دائمًا — هل الفئة المرجعية الخاصة بك نظيفة؟ درس منحنى J: مجموعة مرجعية ملوثة تخلق عدم خطية وهمية.

Q1. ما الذي يجعل الخطوط المكعبة المقيدة مفيدة في التحليل التلوي للجرعة والاستجابة

A. أنها تنتج دائمًا خطًا مستقيمًا
B. إنهم يلتقطون منحنيات الاستجابة للجرعة غير الخطية بمرونة
C. أنها تقلل من عدد الدراسات اللازمة
D. ويبسطون النموذج إلى معلمات أقل
إغلاق

اكتملت الوحدة 16

"الجرعة هي التي تصنع السم. وشكل المنحنى يكشف ما إذا كان السم حقيقيا."

غياب الدليل ليس دليلاً على الغياب.

الوحدة 17: الهشاشة

================ الوحدة 17: الهشاشة (أوسيلتاميفير / جيفرسون 2014) ==============================================================================================================

غياب الدليل ليس دليلاً على الغياب.

الوحدة 17: الهشاشة

🎯 أهداف التعلم

  • حساب وتفسير مؤشر الهشاشة
  • استخدم مخططات GOSH لتحديد الدراسات المؤثرة وتأثيرات المجموعة الفرعية
  • تفسير المخططات القمعية المحسنة
  • تطبيق نماذج اختيار Copas وPET-PEESE لتحيز النشر
  • فهم كيف تعزز تحليلات الحساسية استنتاجات التحليل التلوي

خزنت الحكومات المليارات

بناء على أدلة لم يتمكنوا من رؤيتها.

وبعد فيروس H1N1، أنفقت الحكومات المليارات على مخزون الأوسيلتاميفير (تاميفلو). ناضل فريق كوكرين (Jefferson et al. 2014) لسنوات للوصول إلى البيانات غير المنشورة. وعندما فعلوا ذلك أخيرًا، تبخرت الأدلة التي تساعد على منع المضاعفات.

يسأل مؤشر الهشاشة: "كم عدد المرضى الذين سيحتاجون إلى ذلك" هل تحتاج إلى تغيير النتيجة لقلب نتيجة ذات دلالة إحصائية إلى نتيجة غير مهمة؟" يقوم بشكل متكرر بإضافة الأحداث (تحويل غير الأحداث إلى أحداث) في المجموعة ذات الأحداث الأقل حتى p > 0.05.

FI = 1
هش للغاية. قلب مريض واحد يغير النتيجة.
FI > 8
قوي إلى حد معقول. أقل حساسية للنتائج الفردية.
أدوات تفاعلية

أدخل جدول 2×2 لحساب مؤشر الهشاشة. شاهد الأحداث تتغير حتى تنقلب الأهمية.

أحداث
إجمالي N
العلاج
تحكم
الباحث

نظرة رسومية على عدم تجانس الدراسة (GOSH) يناسب نماذج التحليل التلوي لجميع مجموعات الدراسات الفرعية الممكنة. ترسم كل نقطة التأثير المجمع مقابل I² لمجموعة فرعية واحدة. تقترح المجموعات مجموعات فرعية متميزة؛ تشير السحب الخارجية إلى دراسة واحدة تقود إلى عدم التجانس.

بالنسبة لدراسات k، هناك 2k−1 مجموعات فرعية. بالنسبة إلى k > 15، يتم استخدام أخذ العينات العشوائية.

الباحث

تُظهر مخططات التحويل القياسية حجم التأثير مقابل الخطأ القياسي. تحسين الكفاف تضيف الإصدارات مناطق مظللة لـ p <0.01، وp <0.05، وp <0.10. إذا وقعت الدراسات المفقودة في مناطق غير هامة، فمن المحتمل أن يكون هناك تحيز في النشر. إذا وقعت في مناطق مهمة، فقد تفسر أسباب أخرى (مثل جودة الدراسة) عدم التماثل.

منهجي
1

نموذج اختيار Copas

نماذج احتمالية نشر الدراسة كدالة لـ SE وحجم التأثير. يقدر بشكل مشترك التأثير الحقيقي وآلية الاختيار.

2

الحيوانات الأليفة بيز

اختبار تأثير الدقة (PET): تأثيرات التراجع على SE. إذا كان التقاطع = 0، لا يوجد تأثير حقيقي. يستخدم PEESE SE² للحصول على أداء أفضل عند وجود تأثير حقيقي.

مربع القصة

ملحمة أوسيلتاميفير

أظهر التحليل التلوي الأصلي الذي مولته شركة روش (Kaiser 2003) أن الأوسيلتاميفير قلل من مضاعفات الأنفلونزا بنسبة 67%. لكن 8 من 10 تجارب لم يتم نشرها قط. بعد أن حصلت كوكرين على تقارير الدراسة السريرية، انخفضت الفائدة من المضاعفات إلى نسبة غير ملحوظة تبلغ 11%.

ولم تكن الهشاشة إحصائية فحسب، بل كانت معلوماتية. كانت قاعدة الأدلة نفسها تفتقد معظم البيانات.

لقد قمت بحساب مؤشر الهشاشة. ماذا يعني الرقم؟
FI ≤ 3

هشة للغاية. حفنة من الأحداث المختلفة من شأنها أن تعكس النتيجة. تفسير بحذر شديد.

FI 4–8

هش إلى حد ما. حساسة للاضطرابات الصغيرة. هل هناك تجارب غير منشورة قد تغير هذا؟

FI > 8

قوي نسبيًا. ولكن تذكر: الهشاشة ليست سوى بعد واحد. إن تحيز النشر يمكن أن يقوض حتى النتائج القوية.

والش وآخرون. (2014، J Clin Epidemiol) وجدت أنه في 399 تجربة معشاة ذات شواهد منشورة في أفضل المجلات، كان متوسط مؤشر الهشاشة 8 فقط. وكان أكثر من 25% منهم FI ≥ 3. وكانت التجارب التاريخية التي تؤثر على الممارسة السريرية في كثير من الأحيان معلقة بخيط إحصائي.

منهجي

كشفت ملحمة أوسيلتاميفير ثلاثة أنواع من الهشاشة- ولا يلتقط مؤشر الهشاشة سوى الحالة الأولى.

1

الهشاشة الإحصائية (FI)

كم عدد الأحداث التي تقلب القيمة p؟ وهذا ما يقيسه مؤشر الهشاشة. فهو يحدد مدى الحساسية لنتائج المرضى الفردية.

2

الهشاشة المعلوماتية

كم من الأدلة مخفية؟ ثمانية من عشر تجارب روش أوسيلتاميفير لم تُنشر. وكانت قاعدة الأدلة غير مكتملة من الناحية الهيكلية.

3

الهشاشة التحليلية

كم درجة حرية الباحث يمكن أن تغير النتيجة؟ تعريفات مختلفة للنتائج، أو مجموعات التحليل، أو الأساليب الإحصائية.

رد الاتصال بالوحدة 10 (الباروكستين): إعادة التحليل مع تعريفات نتائج مختلفة عكست الاستنتاج تماما. كان ذلك بمثابة هشاشة تحليلية، إذ لم يتم حساب FI أبدًا لأن نقطة النهاية نفسها كانت محل نزاع. ويفحص تقييم المتانة الكامل الأبعاد الثلاثة.

Q1. تشتمل التجربة على 200 مريض لكل ذراع، و12 حدثًا في العلاج، و25 حدثًا تحت السيطرة (قيمة الاحتمال = 0.03). مؤشر الهشاشة هو 3. ماذا يعني هذا؟

A. حجم التأثير هو بالضبط 3
B. سيؤدي تغيير 3 نتائج للمرضى فقط إلى قلب النتيجة إلى غير مهمة
C. والنتيجة قوية جدًا مع 3 دراسات تأكيدية
D. هناك حاجة إلى 3 مرضى على الأقل للدراسة
إغلاق

اكتملت الوحدة 17

"الرقم الذي ينجو من كل محاولة لكسره هو الرقم الذي يستحق الثقة."

ليست كل إشارة حقيقة.

الوحدة 18: حقوق الملكية

================ الوحدة 18: حقوق الملكية (استثناءات SPRINT / التقدم الزائد) ==============================================================================================================

يجب اكتساب اليقين وليس افتراضه.

الوحدة 18: حقوق الملكية

🎯 أهداف التعلم

  • حدد كيفية إنشاء معايير استبعاد التجارب فجوات الأدلة
  • تطبيق إطار PROGRESS-Plus لتقييم العدالة في الأدلة
  • استخدم المبادئ التوجيهية لإعداد تقارير PRISMA-Equity
  • فهم قابلية النقل: عندما تفشل نتائج التجارب في الممارسة
  • صمم استراتيجيات بحث وتوليف تراعي العدالة

أثبت نظام SPRINT أن التحكم الدقيق في ضغط الدم

ينقذ الأرواح. لكن حياة من؟

استبعدت تجربة SPRINT التاريخية المرضى الذين يعانون من مرض السكري والسكتة الدماغية السابقة وفشل القلب. أكثر من 75% من مرضى ارتفاع ضغط الدم في الولايات المتحدة لم يكونوا مؤهلين. وكانت الأدلة قوية ولكن قابلية التطبيق كانت ضيقة.

الشريحة أ: الأغلبية المفقودة

سجل SPRINT 9361 مريضًا وأثبت أن التحكم المكثف في ضغط الدم (الهدف <120 مم زئبق) قلل من أحداث القلب والأوعية الدموية بنسبة 25٪ (HR 0.75، 95٪ CI 0.64-0.89). لكن معايير الاشتمال تحكي قصة مختلفة.

من تم استبعاده:

  • مرض السكري – 35% من البالغين في الولايات المتحدة يعانون من ارتفاع ضغط الدم
  • السكتة الدماغية السابقة — 8% من السكان المصابين بارتفاع ضغط الدم
  • قصور القلب المصحوب بأعراض — 6% من البالغين المصابين بارتفاع ضغط الدم
  • البقاء المتوقع <3 سنوات - أضعف المرضى
  • المقيمين في دار التمريض — مستبعد تمامًا
  • معدل الترشيح الكبيبي <20 مل/دقيقة — مرض الكلى المتقدم

النتيجة: أكثر من 75% من البالغين الأمريكيين المصابين بارتفاع ضغط الدم لم يكونوا مؤهلين. وكانت الأدلة قوية. ولكن لمن؟

الشريحة ب: جغرافية الأدلة

من أين تأتي الأدلة

78%

من المشاركين في التجارب الكبرى لأمراض القلب والأوعية الدموية جاءوا من بلدان مرتفعة الدخل (2000-2020).

6%

من أفريقيا جنوب الصحراء الكبرى - حيث تتزايد أمراض القلب والأوعية الدموية بشكل أسرع.

تجارب الحبوب المتعددة: أجريت 4 من 5 تجارب على مجموعات سكانية متوسط مؤشر كتلة الجسم لديهم أقل من 25. The US mean BMI is 30. Drug metabolism, comorbidity patterns, healthcare access, and genetic variation all differ across populations. لا تضمن الفعالية في مجموعة سكانية معينة الفعالية في مجموعة أخرى.

المرجع: التجارب المتعددة الجنسيات وفجوة PROGRESS-Plus

P
مكان الإقامة
R
العرق / العرق
O
المهنة
G
الجنس / الجنس
R
الدين
E
التعليم
S
SES (اجتماعي واقتصادي)
S
رأس المال الاجتماعي

بالإضافة إلى: العمر والإعاقة والتوجه الجنسي والفئات الضعيفة الأخرى.

الباحث

PRISMA-الأسهم يوسع برنامج PRISMA ليتطلب الإبلاغ عن كيفية معالجة الإنصاف في المراجعة: الخصائص السكانية، وتحليلات المجموعات الفرعية حسب العيوب، وتقييم قابلية التطبيق على السكان المحرومين.

قابلية النقل: فعالية التجربة لا تساوي فعالية العالم الحقيقي. توجد طرق لإعادة وزن بيانات التجارب لتتناسب مع التوزيع السكاني المستهدف.

الشريحة ج: سؤال قابلية النقل
الباحث

قابلية النقل = هل يمكن تطبيق نتائج مجموعة التجربة X على المجموعة السكانية المستهدفة Y؟ هذا ليس سؤالا فلسفيا، بل له أساليب رسمية.

1

الاحتمالية العكسية لترجيح المشاركة (IPPW)

إعادة وزن المشاركين في التجربة بحيث يشبهون المجموعة السكانية المستهدفة في المتغيرات المشتركة الرئيسية.

2

مؤشر قابلية التعميم

يحدد مدى تشابه العينة التجريبية مع المجموعة السكانية المستهدفة من حيث الخصائص المرصودة.

ستيوارت وآخرون (2015، ستات ميد): عندما تم إعادة ترجيح نتائج SPRINT لتتناسب مع سكان الولايات المتحدة الذين يعانون من ارتفاع ضغط الدم، تم تخفيف الفائدة المقدرة - HR 0.82 (مقابل 0.75 في التجربة). العلاج لا يزال يعمل. لكن الحجم يتغير عندما يتغير عدد السكان.

مربع القصة

SPRINT والأغلبية المفقودة

كانت SPRINT تجربة جيدة التصميم شملت 9361 مريضًا. لقد غيرت نتائجها (HR 0.75 للتحكم المكثف مقابل التحكم القياسي في ضغط الدم) المبادئ التوجيهية في جميع أنحاء العالم. لكن التحليلات اللاحقة أظهرت أن الفائدة كانت أقوى في المجموعة الفرعية الأكثر تشابهًا مع مجموعة التجربة، وكانت غير مؤكدة بالنسبة للمجموعات المستبعدة.

العدالة في تركيب الأدلة لا تعني مجرد السؤال "هل ينجح؟" ولكن "لمن يعمل؟"

الشريحة د: شجرة القرار

الجذر: هل تأتي أدلة المراجعة الخاصة بك من مجموعات سكانية مماثلة لهدفك؟

YES → جيد. لكن تحقق: هل يتم الإبلاغ عن المجموعات الفرعية (العمر، الجنس، العرق، الحالة الاجتماعية والاقتصادية) بشكل منفصل؟

  • Yes: استخدم تأثيرات المجموعة الفرعية للتوصيات الخاصة بالسكان
  • No: ضع علامة على أنها قيد - فجوة العدالة في إعداد التقارير

NO → هل يكشف تحليل PROGRESS-Plus عن تأثيرات تفاضلية؟

  • Yes: هناك حاجة إلى توصيات خاصة بالسكان. النظر في إعادة وزن قابلية النقل.
  • No: تعميم حذر مع بيان الإنصاف الصريح في المناقشة
الشريحة E: رد الاتصال بالوحدة 3
منهجي

رد الاتصال: إعادة النظر في درس العلاج التعويضي بالهرمونات

تذكر الوحدة 3؟ وأظهرت قصة HRT ذلك تحيز المستخدم الصحي جعل العلاج الضار يبدو نافعا. قد يكون لـ SPRINT مشكلة معاكسة - فتأثير "المتطوع السليم" قد يؤدي إلى ظهور علاج فعال more فعال مما سيكون عليه في العالم الحقيقي.

ينبغي لكل تحليل تلوي أن يسأل: من الذي تم تضمينه؟ من تم استبعاده؟ وهل هذا مهم؟

Q1. ما الذي يساعد إطار عمل PROGRESS-Plus المراجعين على تقييمه؟

A. عدم التجانس الإحصائي
B. الإنصاف وقابلية التطبيق بين السكان المحرومين
C. الصلاحية الداخلية للدراسات المشمولة
D. اليقين العام بالأدلة
إغلاق

اكتملت الوحدة 18

"إن الأدلة التي تستبعد الضعفاء لا يمكن أن تدعي أنها تخدمهم."

ليست كل إشارة حقيقة.

الوحدة 19: الآلة

=============== الوحدة 19: الآلة (فحص كوكرين لفيروس كورونا) ==============================================================================================================

الرقم بدون مصدر ليس رقمًا.

الوحدة 19: الآلة

🎯 أهداف التعلم

  • وصف كيفية استخدام الذكاء الاصطناعي/التعلم الآلي في فحص المراجعة المنهجية
  • شرح التعلم النشط وسير عمل الإنسان في الحلقة
  • تقييم التحقق من صحة الأتمتة: الاستدعاء وتوفير أعباء العمل والمخاطر
  • التعرف على القيود والتحيزات في الفحص الخوارزمي
  • تطبيق أطر الاستخدام المسؤول للذكاء الاصطناعي في تجميع الأدلة

عندما ضرب فيروس كورونا، وصلت أوراق

بشكل أسرع مما يستطيع البشر قراءته.

بحلول عام 2021، كان هناك أكثر من 300000 ورقة بحثية عن فيروس كورونا. استخدمت شركة Cochrane مصنفات التعلم الآلي لفرز الدراسات من أجل مراجعاتها السريعة، مما أدى إلى تقليل عبء عمل الفحص بنسبة تصل إلى 70% مع الحفاظ على التذكر بنسبة تزيد عن 95%.

الطوفان

بحلول أبريل 2020، ظهرت 4000 نسخة أولية من فيروس كورونا كل أسبوع.

تم فهرسة PubMed 500 مقالة جديدة عن فيروس كورونا يوميًا.

وصلت قائمة انتظار فحص كوكرين 10000 عنوان لم تتم مراجعته.

🔍 رياضيات الاستحالة

زوج من المراجعين يفحصون ~ 200 عنوان في اليوم.

عند 500 مقالة جديدة في اليوم، كانوا يتأخرون أكثر مع كل ساعة.

كان الاستعراض الحي يموت قبل أن يتمكن من العيش.

المحاولات الأولى

الفكرة لم تكن جديدة. كوهين وآخرون. (2006، JAMIA) أظهر لأول مرة أن التعلم الآلي يمكن أن يقلل من عبء عمل الفحص بنسبة 50٪ - مع خسارة أقل من 5٪ في الاستدعاء.

📅
2006: كوهين وآخرون. - مصنفات SVM لمراجعات فئة الأدوية. إثبات المفهوم.
📅
2016: RobotReviewer (Marshall et al., JMLR) — التعلم الآلي لمخاطر تقييم التحيز. موثوقية Inter-Rater مماثلة للمراجعين البشريين.
📅
2021: ASReview (van de Schoot et al., Nature Machine Intelligence) — التعلم النشط الذي يحاكي تقليل عبء العمل بنسبة 95%.

لكن المحاكاة ليست حقيقة. سيكون فيروس كورونا أول اختبار حقيقي على نطاق واسع.

1

تحديد أولويات الفحص

يصنف التعلم النشط الاستشهادات حسب صلتها بالموضوع. يقوم المراجعون بفحص العناصر ذات الصلة على الأرجح أولاً.

2

مساعدة في استخراج البيانات

يستخرج البرمجة اللغوية العصبية عناصر PICO ونتائجها ونتائجها. Always requires human verification.

3

خطر تقييم التحيز

تتنبأ مصنفات ML بمجالات RoB. تجريبي – يظل الحكم البشري هو المعيار الذهبي.

الباحث
استدعاء
> مطلوب بنسبة 95%. دراسة واحدة مفقودة يمكن أن تغير الاستنتاجات.
دبليو إس إس @ 95%
تم حفظ العمل بعد أخذ العينات بنسبة استدعاء تصل إلى 95%.
إيقاف
متى يجب التوقف عن الفحص؟ عتبة متتالية غير ذات صلة.

التوتر الأساسي: توفر الأتمتة الوقت ولكنها تقدم مصدرًا جديدًا للخطأ. قم دائمًا بالإبلاغ عن الأداة والإصدار وبيانات التدريب ومعايير التوقف.

أزمة التحقق
🔍 مفارقة التحقق من الصحة

لمعرفة ما إذا كان الجهاز قد فاتته دراسة ذات صلة، أنت بحاجة إلى إنسان لفحص كل شيء.

ولكن إذا قام البشر بفحص كل شيء، لماذا استخدام الجهاز ؟

الحل: التحقق من صحة الرفض المحتمل.

  • فحص عينة عشوائية بنسبة 10% بواسطة كل من الإنسان والآلة
  • قارن: هل أخطأت الآلة ما وجده الإنسان؟
  • إذا انخفض معدل الاستدعاء إلى أقل من 95%، فأعد تدريب الفحص البشري ووسعه

ثق، ولكن تحقق. تكتسب الآلة دورها، ولا ترثه.

مربع القصة

استجابة كوكرين لفيروس كورونا

قامت شركة كوكرين ببناء سجل دراسة كوفيد-19 باستخدام مصنفات التعلم الآلي المدربة على ملايين السجلات. حقق النظام حساسية بنسبة 99% مع تقليل الفحص اليدوي من أسابيع إلى أيام.

لكن الآلة كانت أداة وليست بديلاً. تم التحقق من كل دراسة مشمولة من قبل المراجعين البشريين. الدرس المستفاد: الذكاء الاصطناعي يعزز المراجع، ولا يحل محله.

الدراسة التي لم يتم العثور عليها تقريبًا

في يونيو 2020، نشرت تجربة RECOVERY نتائجها الخاصة بالديكساميثازون:الأول ثبت أن العلاج يقلل من وفيات فيروس كورونا (الوفيات لمدة 28 يومًا: 22.9% مقابل 25.7%، RR 0.83).

ظهرت النسخة الأولية على medRxiv بعنوان غير قياسي. حدثت مثل هذه السيناريوهات بشكل متكرر أثناء الوباء: فقد صنف مصنفو تعلم الآلة، المدربون على المصطلحات الموجودة، الإطارات غير المألوفة في مرتبة منخفضة.

في العديد من المراجعات الحية، قام المراجعون البشريون بمسح العناوين المميزة بالتعرف على أسماء الأدوية الرئيسية وقاموا بتصعيد الدراسات التي قلل المصنفون من أولوياتها.

وبدون هؤلاء البشر، ربما انتظرت نتائج العلاج التاريخية أسابيع قبل أن تدخل المراجعة الحية.

الآلة تقرأ بشكل أسرع. يقرأ الإنسان بشكل أعمق. ولا يكفي أي منهما وحده.

شجرة القرار: متى يجب عليك استخدام الذكاء الاصطناعي؟
هل ستعرض مراجعتك أكثر من 5000 عنوان؟
نعم → فكر في الفحص بمساعدة الذكاء الاصطناعي

تحديد أولويات التعلم النشط. شاشة مزدوجة عشوائية بنسبة 10%. توقف عندما تسفر 3 دفعات متتالية عن 0 دراسات ذات صلة.

التقرير: نوع المصنف، بيانات التدريب، الاستدعاء عند الإيقاف، قاعدة الإيقاف.

لا ← الفحص اليدوي ممكن

بالنسبة لـ <5000 عنوان، يظل الفحص البشري المزدوج هو المعيار الذهبي. يضيف الذكاء الاصطناعي التعقيد دون فائدة متناسبة.

هل هذه مراجعة حية أم سريعة؟

إذا كانت الإجابة بنعم ← الذكاء الاصطناعي ذو قيمة خاصة. إعادة تدريب المصنف المستمر على الأدلة الجديدة. لكن: لا تدع الجهاز أبدًا يتخذ قرار التضمين النهائي.

يتكرر النمط
منهجي

تذكر الوحدة 6؟ قام بولديرمانز بتلفيق بيانات DECREASE التي وجهت المبادئ التوجيهية لحاصرات بيتا المحيطة بالجراحة لمدة عقد من الزمن.

يمكن للذكاء الاصطناعي الآن اكتشاف الحالات الشاذة الإحصائية تلقائيًا:

  • اختبار GRIM: هل الوسائل المبلغ عنها متوافقة مع أحجام العينات الصحيحة؟
  • SPRITE: هل يمكن إعادة بناء الإحصائيات الموجزة المبلغ عنها من بيانات فردية معقولة؟
  • Statcheck: هل تتطابق القيم الاحتمالية المبلغ عنها مع إحصائيات الاختبار؟

وجدت هذه الأدوات حالات شاذة في مئات الأبحاث المنشورة— أسرع من أي مدقق بشري.

لكن الآلة تلوح. قضاة البشر. ويظل قرار التراجع إنسانيًا إلى حد كبير.

Q1. ما هو الحد الأدنى المقبول للفحص بمساعدة الذكاء الاصطناعي في المراجعات المنهجية؟

A. 80%
B. 90%
C. >95%
D. 100%
إغلاق

أكمل الوحدة 19

"الآلة تقرأ بشكل أسرع. والإنسان يقرأ بشكل أعمق. ومعاً، يقرأان الحقيقة."

ليست كل إشارة حقيقة.

الوحدة 20: النوعية

================ الوحدة 20: النوعية (Bohren 2015 - رعاية الأمومة) ==============================================================================================================

الأساليب تحمي المرضى من ثقتنا.

الوحدة 20: النوعية

🎯 أهداف التعلم

  • اشرح لماذا تتطلب بعض الأسئلة تركيب أدلة نوعية
  • وصف الإثنوغرافيا الفوقية (نوبليت وهير) والتوليف الموضوعي
  • تطبيق إطار CERQual لتقييم الثقة في النتائج النوعية
  • فهم مناهج التوليف ذات الأساليب المختلطة
  • التعرف على متى تغير الأدلة النوعية الممارسة

طرحت منظمة الصحة العالمية سؤالاً

لا يمكن للـ RCT الإجابة.

لماذا تعاني النساء في جميع أنحاء العالم من عدم الاحترام وسوء المعاملة أثناء الولادة؟ بوهرين وآخرون. (2015) قام بتجميع 65 دراسة نوعية من 34 دولة في إطار من سبعة مجالات لسوء المعاملة.

الشريحة أ: سؤال يتجاوز التوزيع العشوائي

في عام 2014، شكلت منظمة الصحة العالمية لجنة لمعالجة الأزمة العالمية: حيث كانت النساء يتعرضن للإيذاء الجسدي، والإهانة اللفظية، وحرمانهن من الرعاية أثناء الولادة. لم يكن هذا حدثًا نادرًا، فقد جاءت التقارير من هناك 34 دولة.

كانوا بحاجة إلى فهم WHY. ما الذي يدفع إلى عدم الاحترام وسوء المعاملة في رعاية الأمومة؟

لا يمكن لأي تجربة معشاة ذات شواهد أن تجيب على هذا. لا يمكنك توزيع النساء بشكل عشوائي على الرعاية المسيئة مقابل الرعاية المحترمة. لا يمكنك أعمى القابلات. لا يمكنك قياس "الكرامة" على مقياس ليكرت. وكان يجب أن تكون الأدلة نوعية.

تم تطويره بواسطة نوبليت وهير (1988)، الإثنوغرافيا الوصفية يترجم المفاهيم عبر الدراسات بدلا من تجميع الأرقام. وينتج أطر تفسيرية جديدة (بنيات من الدرجة الثالثة) من بيانات الدرجة الأولى (اقتباسات المشاركين) والبيانات من الدرجة الثانية (تفسيرات المؤلف).

متبادل
الدراسات تؤكد بعضها البعض
تفنيدي
الدراسات تتناقض مع بعضها البعض
سطر
الوسيطة
الدراسات تبني نظرية جديدة
الشريحة ب: مجالات بوهرين السبعة

ما وجده بورين: تصنيف سوء المعاملة

1. الاعتداء الجسدي

الضرب والقرص والصفع أثناء المخاض

2. الاعتداء الجنسي

اللمس غير اللائق، والإجراءات غير الرضائية

3. الإساءة اللفظية

الصراخ والتهديدات والتعليقات القضائية

4. الوصمة والتمييز

على أساس حالة فيروس نقص المناعة البشرية، والانتماء العرقي، والعمر، والفقر

5. الفشل في المعايير المهنية

الإهمال، وعدم وجود موافقة مستنيرة

6. علاقة سيئة

ضعف التواصل والاستخفاف

7. ظروف النظام الصحي

الاكتظاظ، ونقص الموظفين، ونقص الإمدادات

65 دراسة. 34 دولة. تتكرر نفس الأنماط عبر اللغات والثقافات والأنظمة. لم تكن هذه حكاية. وقد تم توليف هذا الأدلة.

الباحث

يقوم CERQual بتقييم الثقة في نتائج المراجعة النوعية عبر أربعة مكونات:

1

القيود المنهجية

جودة الدراسات المساهمة.

2

التماسك

مدى دعم البيانات لهذه النتائج.

3

الكفاية

ثراء البيانات (وليس فقط عدد الدراسات).

4

الصلة

قابلية التطبيق على سياق سؤال المراجعة.

الشريحة ج: من الدليل إلى العمل

أفاد تجميع بورين بتوصيات منظمة الصحة العالمية لعام 2018 بشأن الرعاية أثناء الولادة لتجربة ولادة إيجابية. تغييرات محددة ترتكز على الأدلة النوعية:

تفصيل. 15
الرفقة أثناء المخاض
تفصيل. 1
رعاية الأمومة المحترمة
تفصيل. 3
التواصل الفعال
تفصيل. 12
الدعم العاطفي

وهذه التوصيات - المبنية على أدلة نوعية - توجه الآن رعاية الأمومة في 194 دولة عضو في منظمة الصحة العالمية. لا يمكن لأي قطعة أرض في الغابة أن تنتجها. لا يمكن لأي إحصائية أن تكشف عنهم.

مربع القصة

إطار بوهرين لسوء المعاملة

حدد التوليف النوعي لعام 2015 سبعة مجالات: الاعتداء الجسدي، والاعتداء الجنسي، والإساءة اللفظية، والوصم والتمييز، وعدم تلبية المعايير المهنية، وسوء العلاقات، وظروف النظام الصحي. استرشد هذا الإطار بتوصيات منظمة الصحة العالمية بشأن الرعاية أثناء الولادة (2018).

لا يمكن لأي قيمة p أن تعبر عن تجربة الصفع أثناء المخاض. أعطى التركيب النوعي صوتًا لما لا تستطيع الأرقام تقديمه.

الشريحة د: شجرة القرار

الجذر: هل سؤال بحثك يتعلق بالتجارب أو التصورات أو العوائق أو الميسرات؟

YES → هل سؤالك حول كيف أو لماذا، وليس فقط ما إذا كان؟

  • Yes: تركيب الأدلة النوعية (الإثنوغرافيا التلوية، التوليف الموضوعي، أو توليف الإطار)
  • No: فكر في الأساليب المختلطة: كمية لـ التأثير + النوعي للآلية

NO → هل سؤالك حول الفعالية/الفعالية؟

  • Yes: التحليل التلوي الكمي
  • But: استكمل المراجعة النوعية لعوائق التنفيذ (تقييم CERQual)

الرؤية الأساسية: تجيب أقوى المراجعات المنهجية على كلا الأمرين: هل تعمل؟ (كمي) ولماذا ينجح أو يفشل؟ (نوعي)

Q1. ما الذي يميز الإثنوغرافيا التلوية عن التحليل التلوي الكمي؟

A. يتضمن 3-5 دراسات فقط
B. يترجم المفاهيم عبر الدراسات بدلاً من تجميع الأرقام
C. لا يتطلب بحثًا منهجيًا
D. إنه أقل صرامة من التوليف الكمي
إغلاق

الوحدة 20 كاملة

"ليس كل ما يهم يمكن إحصاؤه. ليس كل ما يتم إحصاؤه مهم."

التباين رسالة وليس ضجيج.

الوحدة 21: متعدد المتغيرات

====================================================== الوحدة 21: النتائج المترابطة / RVE =========

التباين رسالة وليس ضجيج.

الوحدة 21: متعدد المتغيرات

🎯 أهداف التعلم

  • التعرف على الحالات التي تكون فيها النتائج مترابطة في الدراسة
  • شرح نماذج التأثيرات العشوائية متعددة المتغيرات
  • تطبيق تقدير التباين القوي (RVE) لأحجام التأثير التابعة
  • فهم النماذج ثلاثية المستويات للنماذج المتداخلة البيانات
  • اختر من بين الأساليب متعددة المتغيرات بناءً على بنية البيانات

تقرير تجارب القلب والأوعية الدموية

الوفيات، MI، والسكتة الدماغية، وأكثر من ذلك.

ترتبط هذه النتائج داخل المرضى. لا يمكن للمريض الذي يموت أن يكون لديه نقطة نهاية MI. يعالج التحليل التلوي القياسي كل نتيجة بشكل مستقل - متجاهلاً الاعتماد وأدلة العد المزدوج المحتملة.

الشريحة أ: كذبة الملاءمة

افتح أي كتاب دراسي قياسي للتحليل التلوي. تفترض النماذج أن كل دراسة تساهم في حجم تأثير مستقل واحد. لكن الواقع مختلف.

تشير تجربة واحدة للقلب والأوعية الدموية إلى الوفيات، واحتشاء عضلة القلب، والسكتة الدماغية، وإعادة تكوين الأوعية الدموية. تشير دراسة واحدة للعلاج النفسي إلى حدوث الاكتئاب والقلق ونوعية الحياة عند 3 و6 و12 شهرًا.

30 تجربة
× 4 نتائج
= 120
أحجام التأثير

معظم المحللين إما: (a) يتعاملون مع جميع الـ 120 على أنها مستقلة (تضخيم الدقة بعامل √4)، أو (b) اختر نتيجة واحدة وتجاهل الباقي. كلا النهجين خاطئان.

في التحليل التلوي القياسي الزوجي، تساهم كل دراسة بحجم تأثير one . لكن العديد من الدراسات تشير إلى نتائج أو مجموعات فرعية أو نقاط زمنية أو أذرع متعددة، مما يؤدي إلى إنشاء متكل أحجام التأثير. يؤدي تجاهل هذا إلى تضخيم الدقة وتشويه الاستدلال.

RVE
تقدير قوي للتباين. مقدر الساندويتش يتعامل مع الارتباط غير المعروف.
3-المستوى
دراسة ← تم تصميم نموذج تداخل النتائج بشكل صريح.
الباحث

يستخدم RVE (Hedges, Tipton & Johnson, 2010) نوع ساندويتش مقدِّر يوفر أخطاء قياسية صالحة بغض النظر عن الارتباط الحقيقي بين التأثيرات التابعة. لا حاجة لمعرفة أو تقدير الارتباط داخل الدراسة. الأفضل من أجل ≥20 دراسة.

تصحيح العينة الصغيرة: طور Tipton & Pustejovsky (2015) تصحيحات عينة صغيرة (CR2) لـ RVE، باستخدام درجات الحرية Satterthwaite عندما يكون عدد المجموعات صغيرًا.

الشريحة B: الحقيقة الرياضية
الباحث

ما تأثير الاعتماد على فترات ثقتك

إذا كانت 4 نتائج من نفس الدراسة لها ارتباط داخل الدراسة ρ = 0.5:

التعامل كمستقل

عرض CI = X

محاسبة التبعية

عرض CI = 1.58X

يجب أن يكون فاصل الثقة الخاص بك أوسع بنسبة 58%. كل تحليل تلوي تجاهل هذا نشر نتائج دقيقة بشكل خاطئ.

RVE (Hedges, Tipton & Johnson, 2010): يستخدم مقدر التباين "الساندويتش" الذي ينتج أخطاء معيارية صحيحة بدون تحتاج إلى معرفة الارتباط الدقيق داخل الدراسة.

الشريحة ج: المستويات الثلاثة (موسعة)
الباحث
1

المستوى 1: تباين أخذ العينات

خطأ في القياس ضمن كل تقدير لحجم التأثير.

2

المستوى 2: التباين داخل الدراسة

تختلف النتائج والنقاط الزمنية ضمن دراسة واحدة.

3

المستوى 3: التباين بين الدراسة

تختلف الدراسات عن بعضها البعض في المجموعات السكانية والإعدادات والأساليب.

مثال: في التحليل التلوي للعلاج النفسي للاكتئاب (k=50 دراسة، 180 تأثير). الأحجام)، 35% كان من التباين ضمن الدراسة (نتائج مختلفة) و 65% كان بين الدراسة (علاجات مختلفة، والسكان). يكشف هذا التحليل عن مقدار عدم التجانس داخل vs بين دراسات.

منهجي

عندما تكون التأثيرات متداخلة (على سبيل المثال، نتائج متعددة داخل الدراسات، أو دراسات داخل مجموعات البحث)، نموذج ثلاثي المستويات يقسم التباين إلى: (1) تباين العينات (المستوى 1)، (2) التباين داخل الدراسة (المستوى 2)، و (3) التباين بين الدراسة (المستوى 3). يحافظ هذا على الاستدلال الصحيح أثناء استعارة القوة عبر المستويات.

مربع القصة

تحدي القلب والأوعية الدموية

قد يتضمن التحليل التلوي للستاتينات 30 تجربة، تشير كل منها إلى الوفيات، والاحتشاء الدماغي، والسكتة الدماغية، وإعادة تكوين الأوعية الدموية. هذا هو 120 حجم تأثير من 30 مجموعة. إن التعامل معها على أنها 120 تقديرًا مستقلاً يؤدي إلى تضخيم الدقة بعامل يتعلق بالارتباط داخل الدراسة.

تتعامل نماذج RVE أو النماذج متعددة المتغيرات مع هذا بشكل صحيح - مما ينتج فترات ثقة أوسع وصادقة.

الشريحة د: شجرة القرار

الجذر: هل التحليل التلوي الخاص بك له تأثيرات متعددة لكل دراسة؟

YES → هل تعرف (أو تستطيع تقدير) الارتباطات داخل الدراسة؟

  • Yes: نموذج التأثيرات العشوائية متعدد المتغيرات (الأكثر كفاءة)
  • No: RVE مع تصحيح العينات الصغيرة (قوي للارتباطات غير المعروفة)

NO → نموذج التأثيرات العشوائية أحادي المتغير القياسي

السؤال الفرعي: هل تأثيراتك المتعددة ناتجة عن نتائج أو نقاط زمنية أو مجموعات فرعية مختلفة؟

  • نتائج مختلفة → نموذج ثلاثي المستويات أو RVE مع التجميع
  • نقاط زمنية مختلفة → شبكة من النقاط الزمنية ذات الارتباط الزمني
  • مجموعات فرعية مختلفة → فكر فيما إذا كانت المجموعات الفرعية ذات معنى أو يجب حساب متوسطها

Q1. ما هي المشكلة التي يحلها تقدير التباين القوي (RVE)؟

A. تحيز النشر
B. التبعية بين أحجام التأثير المتعددة من نفس الدراسة
C. عدم التجانس بين الدراسات
D. تأثيرات الدراسات الصغيرة
إغلاق

اكتملت الوحدة 21

"عندما تكون النتائج متشابكة، فإن التظاهر بأنها مستقلة هو كذبة مصلحة."

الرقم بدون مصدر ليس رقمًا.

الوحدة 22: الإثبات

================ الوحدة 22: الإثبات (خطأ رينهارت-روجوف في Excel) ==============================================================================================================

الرقم بدون مصدر ليس رقمًا.

الوحدة 22: الإثبات

🎯 أهداف التعلم

  • فهم كيفية انتشار الأخطاء الحسابية من خلال السياسة
  • تعريف قابلية التكرار والتمييز عن قابلية التكرار
  • تطبيق تجزئة الأدلة والأرقام الحاملة للإثبات
  • استخدم قوائم التحقق من التكرار للتحليل التلوي
  • التعرف على دور التسجيل المسبق والبيانات المفتوحة

فتح طالب دراسات عليا جدول بيانات

ووجدت أن عصر التقشف بني على خطأ.

في عام 2010، ادعى راينهارت وروجوف أن البلدان التي تزيد فيها نسبة الدين إلى الناتج المحلي الإجمالي عن 90% كان نموها سلبيا. وقد أثر هذا على سياسات التقشف في جميع أنحاء أوروبا. في عام 2013، اكتشف توماس هيرندون خطأً في برنامج Excel أدى إلى استبعاد 5 دول من المتوسط. وكانت النتيجة المصححة: نمو إيجابي متواضع، وليس الانهيار.

قابلة للتكرار
نفس البيانات + نفس الرمز = نفس النتيجة
قابلة للتكرار
بيانات جديدة + نفس الأساليب = نتيجة متسقة

قابلية التكرار هي المعيار الأدنى. إذا لم يتمكن الآخرون من إعادة إنتاج تقديرك المجمع من بياناتك المبلغ عنها، فلا يمكن التحقق من التحليل. يجب أن تتشارك التحليلات التلوية: البيانات المستخرجة، ونصوص التحليل، وإصدارات البرامج، والبذور العشوائية.

الباحث

يجب أن يحمل كل رقم في التحليل التلوي المصدر: من أين جاء، وكيف تم تحويله، وما هو الكود الذي أنتجه. تجزئة الأدلة بصمة مشفرة للمدخلات، لذا فإن أي تغيير (عرضي أو غير مقصود) متعمد) يمكن اكتشافه.

SHA

تجزئة الإدخال

تجزئة SHA-256 للبيانات المستخرجة. إذا تغيرت خلية واحدة، يتغير التجزئة. سلسلة المصدر: البيانات → الكود → النتيجة → التجزئة.

أداة تفاعلية

تحقق من كل عنصر لتقييم إمكانية تكرار نتائج التحليل التلوي. كيف تقيم تقييمك؟

مربع القصة

خطأ Excel الذي غير الاقتصادات

وقد تم الاستشهاد بكتاب راينهارت روجوف "النمو في زمن الديون" في شهاداته أمام الكونجرس، وتقارير المفوضية الأوروبية، والموجزات السياسية لصندوق النقد الدولي. كان خطأ Excel (تم استبعاد الصفوف 30-34 من صيغة المتوسط) يعني أن خمسة بلدان - أستراليا والنمسا وبلجيكا وكندا والدنمارك - كانت مفقودة ببساطة.

ارتفع المتوسط المصحح من -0.1% إلى +2.2%. أثرت سياسات التقشف على الملايين. إن قابلية التكرار ليست سعيًا للكمال الأكاديمي، بل هي ضمانة ضد الكوارث.

رد اتصال

تذكر الوحدة 5؟

انخفاض من خلال عدسة التكاثر

تم سحب تجارب DECREASE التي أجراها دون بولدرمانز للحصول على بيانات ملفقة. لو كانت هناك أرقام تحمل إثباتًا - مدخلات مجزأة، وسلاسل مصدر، وحسابات تم التحقق منها - لكان من الممكن اكتشاف التلفيق قبل دخلت الأدلة التحليلات التلوية وتغيير المبادئ التوجيهية الجراحية.

Q1. ما هو خطأ راينهارت-روجوف؟

A. لقد استخدموا عينة صغيرة جدًا
B. استبعدت صيغة Excel 5 دول، مما أدى إلى عكس النتيجة
C. لقد درسوا الفترة الزمنية الخاطئة
D. لقد استخدموا الاختبار الإحصائي الخاطئ
إغلاق

الوحدة 22 كاملة

"الرقم بدون مصدر ليس رقمًا. والتحليل بدون إمكانية التكرار ليس دليلاً."

يجب اكتساب اليقين وليس افتراضه.

الوحدة 23: أول سباق سريع لك

الوحدة 23: Capstone - أول سباق سريع لك

يجب اكتساب اليقين وليس افتراضه.

الوحدة 23: أول سباق سريع لك

🎯 أهداف التعلم

  • فهم سير عمل المراجعة المنهجية لمدة 40 يومًا
  • قم بتخطيط المبادئ السبعة لمراحل الممارسة الحقيقية
  • التعرف على بوابات تعريف الإنهاء (DoD) كنقاط تفتيش للجودة
  • نقدر لماذا يمنع الهيكل حالات الفشل التي درستها
  • خريج جاهز لإجراء (وليس مجرد فهم) التحليل التلوي
اكتملت الرحلة

لقد تعلمت القصص.

الآن يجب عليك السير على الطريق.

كل عكس الأدلة التي درستها حدث بسبب الفرق knew الطرق ولكن لم يتم يتبع لهم بشكل منهجي.

إطار عمل META-SPRINT

سير عمل منظم لمدة 40 يومًا مع 5 بوابات طور. كل بوابة عبارة عن نقطة تفتيش لتعريف التنفيذ (DoD) تمنعك من المضي قدمًا حتى يتم ضمان الجودة.

40
الأيام حتى الانتهاء
5
بوابات مرحلة وزارة الدفاع
اليوم 34
تجميد صعب

لماذا 40 يوما؟ طويلة بما يكفي للدقة، وقصيرة بما يكفي لمنع زحف النطاق. تم دفن إشارات القلب روزيجليتازون لسنوات لأنه لم يكن هناك موعد نهائي يفرض الشفافية.

البوابات الخمس
A

DoD-A: قفل البروتوكول (الأيام 1-3)

تم تعريف PICOS، وتم تعيين قواعد النقطة الزمنية، واختيارات النموذج محددة مسبقًا. لا يوجد هدف متحرك.

B

DoD-B: قفل البحث (الأيام 6-10)

تم البحث في جميع قواعد البيانات، وفحص الأدبيات الرمادية، والتحقق من صحة PRESS. لا توجد دراسات مخفية.

C

DoD-C: قفل الاستخراج (الأيام 10-28)

الاستخراج المزدوج، ربط المصدر، تقييم RoB. لا أرقام ملفقة.

وتابع غيتس
D

DoD-D: قفل التحليل (الأيام 21-33)

تم إنشاء قطع الغابات، وإجراء تحليلات الحساسية، واستكشاف عدم التجانس. لا قطف الكرز.

E

DoD-E: قفل التقديم (الأيام 33-40)

تصنيف درجة اليقين، كتابة الملخص السريري، وضع اللمسات النهائية على المخطوطة. لا ثقة زائدة.

تجميد اليوم 34: لا يمكن إجراء دراسات جديدة تمت إضافته بعد اليوم 34. وهذا يمنع "زحف النطاق المسلح" الذي ابتليت به التحليلات الوصفية لجراحة العمود الفقري لـ BMP، حيث استمرت الصناعة في "العثور" على دراسات إيجابية.

سبعة مبادئ تم تعيينها للممارسة

كل مبدأ تعلمته يرتبط ببوابة مرحلة محددة:

وزارة الدفاع-أ "ليست كل إشارة هي الحقيقة" — حدد مسبقًا ما يمكن اعتباره الدليل
DoD-B "ما الذي كان مخفيا على مرأى من الجميع؟" - بحث شامل
DoD-C "الرقم بدون مصدر ليس رقمًا" — ربط كل نقطة بيانات
DoD-D "التجانس هو رسالة وليس ضجيج"- تحقق، لا تتجاهل
DoD-E "فاليقين يجب اكتسابه، وليس افتراضه"- صنف كل شيء
ضمان الجودة الخصومة للفريق الأحمر

مبدأ الفريق الأحمر

فريقك الخاص يحاول تعطيل عملك.

في كل يوم، يقضي اثنان من أعضاء الفريق المتناوبين 12 دقيقة في التحقق من جودة البيانات كخصوم. هذه هي الطريقة التي تم بها اكتشاف احتيال بولدت - ليس من خلال المراجعة الودية، ولكن من خلال الفحص المتشكك الذي لاحظ معدلات توظيف مستحيلة.

بروتوكول الطوارئ CondGO

ماذا يحدث عندما تكتشف مشكلة حرجة في منتصف السباق؟

CondGO = الذهاب المشروط

بروتوكول إنقاذ محدود. لديك بالضبط 72 ساعة لإصلاح المشكلة باستخدام الإجراءات المسموح بها فقط. إذا لم تتمكن من إصلاح الأمر، فيجب عليك إيقاف المراجعة.

📖 درس أفانديا: شهدت شركة GSK إشارات القلب والأوعية الدموية في عام 2000 ولكن لم يكن لديها موعد نهائي قسري. لقد "شاهدوا وانتظروا" لمدة 7 سنوات. وتضرر عشرات الآلاف. توجد CondGO لأن عبارة "سنتعامل معها في النهاية" تقتل الأشخاص.

تخرجك

لقد بدأت هذه الدورة بالقصص.

لقد أنهيتها جاهزة للتمرين.

يأخذ سير عمل META-SPRINT كل ما تعلمته وينظمه في نظام مدته 40 يومًا يمنع حالات الفشل التي تمت دراستها.

عندما تكون مستعدًا لإجراء مراجعة منهجية حقيقية، افتح تطبيق META-SPRINT. ستوجهك القصص التي تعلمتها هنا، وستظهر كتذكيرات في كل خطوة.

القصة: تعاون CTT - عندما تنقذ الطرق الملايين

كيف يبدو الأمر عندما يتم اتباع كل مبدأ؟

البيانات الحقيقية

يعد تعاون القائمين على تجارب علاج الكوليسترول (CTT) هو المعيار الذهبي للتحليل التلوي. لقد حصلوا على بيانات مريض فردية من أكثر من 170,000 مشارك عبر 26 تجربة ستاتين. البروتوكول المحدد مسبقًا. IPD من جميع التجارب الكبرى. نتائج موحدة. النتيجة: تقليل الستاتينات الأحداث الوعائية الكبرى بنسبة 21% لكل مليمول/لتر من تقليل LDL (RR 0.79، 95٪ CI 0.77-0.81)، بغض النظر عن المخاطر الأساسية. تم تكرار هذه النتيجة عبر 5 تحليلات تلوية على مدار 15 عامًا، منع ما يقدر بنحو من الإصابة بالنوبات القلبية والسكتات الدماغية في جميع أنحاء العالم.

المبادئ السبعة المطبقة
تُظهر قصة CTT ما يحدث عند اتباع كل مبدأ من هذه الدورة. خذ بعين الاعتبار البديل:
المسار أ: بدون المبادئ
لا يوجد بروتوكول. البيانات المنشورة فقط. لا روب. لا التحقيق في عدم التجانس. لا الصف.
التجارب الصغيرة المتضاربة. لا يزال الجدل حول الستاتين مستمرًا. الملايين دون علاج.
النتيجة: استمرار الوفيات القلبية الوعائية التي يمكن الوقاية منها
المسار ب: طريقة CTT
البروتوكول المسجل مسبقًا. IPD من جميع التجارب. نتائج موحدة. أساليب شفافة. الدرجة درجة عالية من اليقين.
إجابة نهائية. تتغير المبادئ التوجيهية العالمية. الستاتينات موصوفة لمن يستفيد.
النتيجة: إنقاذ ملايين الأرواح من خلال تجميع الأدلة الصارمة
الرؤيا
كل مبدأ في هذه الدورة موجود لأن غيابه يسبب الضرر. يثبت تعاون CTT أنه عندما تكون الأساليب صارمة، وعندما يكون للبيانات مصدر، وعندما يتم تقييم التحيز واكتساب اليقين - يصبح التحليل التلوي أقوى أداة في الطب. أنت الآن تحمل هذه المبادئ. استخدمها.
اختبار Capstone

1. ما هو الغرض من "التجميد الشديد" لليوم 34 في META-SPRINT؟

أ. لإتاحة الوقت لمراجعة النظراء
ب. لمنع الدراسات المضافة متأخراً من التلاعب بالنتائج
ج. لتسريع النشر
د. للتنسيق مع المواعيد النهائية للمجلة

2. يمنح بروتوكول CondGO الفرق المدة اللازمة لإصلاح المشكلات الحرجة؟

أ. 24 ساعة
ب. 48 ساعة
ج. 72 ساعة
د. أسبوع واحد

3. اكتشف فريق ضمان الجودة الخصوم للفريق الأحمر احتيال يواكيم بولدت من خلال ملاحظة:

أ. معدلات توظيف المرضى المستحيلة
ب. الاختراق في الاختبارات الإحصائية
ج. أحجام التأثير غير المتسقة
د. شهادة المبلغين عن المخالفات
إغلاق

القصص التي تعلمتها ليست تاريخًا.

إنها تحذيرات تحمي عملك المستقبلي.

عندما تقوم بإجراء التحليل التلوي الأول،
تذكر CAST قبل أن تثق في إشارة،
تذكر Poldermans قبل تخطي المصدر،
تذكر Reboxetine قبل أن تتجاهل مسار التحويل.

أنت الآن جاهز. الذهاب مع الهيكل. اذهب بالتواضع. اتبع المبادئ السبعة.

ليست كل إشارة حقيقة.

الوحدة 24: الاختبار النهائي

الوحدة 24: الاختبار النهائي (التقييم الختامي)

يجب اكتساب اليقين وليس افتراضه.

الاختبار النهائي

اختبر مدى إتقانك لمبادئ التحليل التلوي. يتناول كل سؤال مفهومًا أساسيًا من الدورة.

Q1. يريد أحد الباحثين دراسة "تأثيرات التمارين الرياضية على الصحة". ما هي المشكلة الأساسية في سؤال البحث هذا؟

A. إنه يفتقر إلى التوزيع العشوائي
B. حجم العينة صغير جدًا
C. ليس كذلك للإجابة - يفتقر إلى عناصر PICO المحددة
D. ويفتقر إلى الموافقة الأخلاقية
السؤال الثاني: تحيز النشر

Q2. يُظهر المخطط القمعي عدم تناسق واضح مع الدراسات المفقودة في المنطقة السفلية اليسرى. ماذا يوحي هذا؟

A. الدراسات الكبيرة لديها تقديرات أكثر دقة
B. من المحتمل أن تكون الدراسات السلبية الصغيرة غير منشورة
C. التأثير الحقيقي أقوى من المقدر
D. خطأ في أخذ العينات العشوائية
Q3: عدم التجانس

Q3. يشير التحليل التلوي إلى I² = 85% وτ² = 0.42. ما هو التفسير الأكثر ملاءمة؟

A. هناك فرصة بنسبة 85% للتأثير الحقيقي
B. حجم التأثير كبير جدًا
C. يوجد تباين كبير بين الدراسة؛ التحقيق في المصادر
D. النتائج مهمة سريريًا
Q4: الصف

Q4. في GRADE، ما هو اليقين المبدئي لمجموعة من الأدلة من التجارب المعشاة ذات الشواهد؟

A. High
B. معتدل
C. Low
D. منخفض جدًا
س5: خطر التحيز

Q5. في RoB 2.0، ما المجال الذي يقيم ما إذا كان مقيمو النتائج يعرفون تخصيص العلاج؟

A. D1: عملية التوزيع العشوائي
B. D2: الانحرافات عن التدخلات المقصودة
C. D3: نتيجة مفقودة البيانات
D. D4: قياس النتيجة
Q6: عكس الأدلة

Q6. أظهرت تجربة CAST أن الأدوية المضادة لاضطراب النظم تزيد معدل الوفيات على الرغم من قمع عدم انتظام ضربات القلب. هذا مثال على:

A. خطأ في أخذ العينات العشوائية
B. فشل النتيجة البديلة
C. مربكة بالإشارة
D. السببية العكسية
Q7: التأثيرات الثابتة مقابل التأثيرات العشوائية

Q7. متى يجب تفضيل نموذج التأثيرات العشوائية على التأثير الثابت نموذج؟

A. عندما تكون أحجام العينات كبيرة
B. عندما تكون النتائج ثنائية
C. عندما يكون من المتوقع عدم التجانس بين الدراسات
D. عند الاشتباه في تحيز النشر

Q8. وفقًا لمعايير ICEMAN، مما يجعل تحليل المجموعة الفرعية أكثر مصداقية؟

A. تم تحديد الفرضية مسبقًا
B. تم اختبار عدد كبير من المجموعات الفرعية
C. لا يوجد مبرر بيولوجي
D. تأثيرات غير متناسقة عبر التجارب داخل المجموعة الفرعية
س9: التحليل التلوي للشبكة

Q9. ما الافتراض الذي يجب التحقق منه في التحليل التلوي للشبكة لضمان المقارنات غير المباشرة الصحيحة؟

A. جميع الدراسات لها أحجام عينات متساوية
B. تقيس جميع الدراسات نفس النتيجة
C. العبور (اتساق معدلات التأثير)
D. التعمية المزدوجة في جميع التجارب

Q10. في التحليل التسلسلي التجريبي (TSA)، إلى ماذا يشير تجاوز حد عدم الجدوى؟

A. أسباب العلاج ضرر
B. من غير المرجح أن تظهر الدراسات الإضافية تأثيرًا ذا معنى
C. الدليل قاطع لصالحه
D. التحليل التلوي ضعيف

الجزء الأول كامل - تابع إلى الجزء 2 (الوحدات المتقدمة)

الجزء 2: أسئلة الوحدة المتقدمة (Q11-Q25)

الأسئلة 11-25 تغطي الوحدات 13-22 (Bayesian، NMA، IPD، الاستجابة للجرعة، الهشاشة، العدالة، الذكاء الاصطناعي، النوعي، متعدد المتغيرات، التكاثر).

Q11: بايزي

Q11. في التحليل التلوي بايزي، ماذا يحدث عند استخدام سابقة غامضة مع العديد من الدراسات؟

A. يتطابق الجزء الخلفي بشكل وثيق مع النتيجة المتكررة
B. يهيمن السابق على الجزء الخلفي
C. يصبح الفاصل الزمني الموثوق به واسعًا بلا حدود
D. فشل النموذج للالتقاء

Q12. في NMA المضاد للاكتئاب الذي طوره سيبرياني، لماذا لم يتم الإعلان عن دواء واحد "الفائز"؟

A. عدد قليل جدًا من الدراسات
B. تم تصنيف الأدوية المختلفة بشكل أفضل على نتائج مختلفة
C. لم يكن هناك دليل غير مباشر متاح
D. لا يمكن تحديد SUCRA محسوب

Q13. لماذا لا يجب عليك أبدًا تجميع IPD كما لو كان من تجربة واحدة ضخمة؟

A. لدى IPD دائمًا عدد أقل من الدراسات عن المجموع
B. إنه يتجاهل تجميع الدراسات ويقدم ارتباكًا
C. لا يمكنه التعامل مع بيانات الوقت حتى الحدث
D. لا يمكن تجميع النتائج الثنائية
Q14: الاستجابة للجرعة

Q14. ما الذي تسبب في اختفاء "منحنى J" للكحول في إعادة تحليل ستوكويل؟

A. تمت إضافة دراسات جديدة أظهرت عدم وجود فائدة
B. تمت إزالة من يشربون الخمر السابقون بشكل صحيح من المجموعة المرجعية الممتنعين
C. تم زيادة حجم العينة
D. تعديل أفضل للمربكين
Q15: الهشاشة

Q15. في ملحمة الأوسيلتاميفير، ما الذي اكتشفه كوكرين عند الوصول إلى الأبحاث السريرية غير المنشورة تقارير الدراسة ؟

A. كان الدواء غير فعال تمامًا
B. كان التأثير أكبر مما كان يُعتقد في الأصل
C. اختفت فائدة المضاعفات إلى حد كبير
D. كانت الآثار الجانبية أكثر شيوعًا مما تم الإبلاغ عنه
Q16: الإنصاف

Q16. ما هي النسبة المئوية لمرضى ارتفاع ضغط الدم في الولايات المتحدة الذين لم يكونوا مؤهلين لتجربة SPRINT؟

A. حوالي 25%
B. حوالي 50%
C. أكثر من 75%
D. ما يقرب من 100%

Q17. لماذا يُعتبر الذكاء الاصطناعي "مُعززًا" وليس "بديلًا" في المراجعات المنهجية؟

A. الذكاء الاصطناعي أبطأ من المراجعين البشريين
B. يتمتع الذكاء الاصطناعي باستدعاء مثالي
C. يقوم الذكاء الاصطناعي بالفحص بسرعة ولكنه لا يستطيع إصدار أحكام سياقية على المستوى البشري
D. الذكاء الاصطناعي مكلف للغاية بالنسبة لمعظم المراجعات
Q18: النوعي

Q18. ما الذي يقيمه عنصر "الملاءمة" في CERQual؟

A. عدد الدراسات فقط
B. ثراء وكمية البيانات التي تدعم النتيجة
C. اتساق النتائج عبر الدراسات
D. إمكانية التعميم على مجموعات سكانية أخرى
Q19: متعدد المتغيرات

Q19. يتضمن التحليل التلوي 30 تجربة ستاتين، تشير كل منها إلى 4 نتائج مترابطة (120 حجم تأثير). ما هو النهج الصحيح؟

A. تعامل مع جميع الـ 120 كأحجام تأثير مستقلة
B. استخدم RVE مع تصحيح عينة صغيرة
C. اختر نتيجة واحدة فقط لكل دراسة
D. متوسط النتائج الأربع داخل كل دراسة
Q20: التكاثر

Q20. في خطأ راينهارت-روجوف، ما هو متوسط معدل النمو المصحح لـ البلدان ذات الديون المرتفعة؟

A. −0.1% (نفس ما تم المطالبة به)
B. +2.2%
C. 0%
D. +5%

درجة النجاح: 15/20 عبر كلا الجزأين

راجع أي أسئلة لم يتم الرد عليها من خلال العودة إلى الوحدة ذات الصلة. كل سؤال يختبر مفهومًا أساسيًا.

ليست كل إشارة حقيقة.

الأساليب تحمي المرضى من ثقتنا.

تهانينا

لقد أكملت عكس الأدلة: دورة التحليل التلوي.

أتمنى أن يسترشد تركيبك بالحقيقة، وتجميعك بالحكمة،
واستنتاجاتك بالتواضع.

السبعة المبادئ:

"ليست كل إشارة هي الحقيقة."

"أساليب تحمي المرضى من ثقتنا."

"ما الذي كان مخفيا على مرأى من الجميع؟"

"الرقم بدون مصدر ليس رقمًا."

"التباين هو رسالة، وليس ضجيجا."

"غياب الدليل ليس دليلاً على الغياب"

"اليقين يجب أن يُكتسب، لا أن يُفترض."

"اهدنا إلى الصراط المستقيم..."

التنقل بين الشرائح - الحد الأدنى من الأسهم العائمة
لوحة الأدوات