ليست كل إشارة حقيقة.
الوحدة 0: الافتتاحية
🎯 أهداف التعلم
- تعريف التحليل التلوي وشرح دوره في تركيب الأدلة
- تحديد متى لا ينبغي إجراء الدراسات مجمعة
- وصف التسلسل الهرمي للأدلة وموقع المراجعات المنهجية
- إدراك أن التحليل التلوي يمكن أن يكون مضللاً عندما يتم إجراؤه بشكل سيئ
- تذكر المبادئ السبعة التي ترتكز عليها هذه الدورة
هذه الدورة موجودة لأن
كان الطب خاطئًا.
لا مرة واحدة. ليس نادرا. مرارا. بطرق قتلت المرضى الذين كانوا يثقون في صحة الأدلة.
ما هو التحليل التلوي؟
طريقة إحصائية للجمع بين نتائج دراسات مستقلة متعددة تتناول نفس السؤال.
* عند إجرائه بشكل جيد. إن جودة السلوك لها أهمية أكبر من تصميم الدراسة وحده — كما تعترف GRADE.
لماذا دراسات البلياردو؟
زيادة القوة الإحصائية
قد تكون الدراسات الفردية أصغر من أن تتمكن من اكتشاف التأثيرات.
تحسين الدقة
فترات ثقة أضيق حول تقديرات التأثير.
حل الخلاف
عندما تتعارض الدراسات، يمكن للتجميع توضيح الإشارة.
استكشاف عدم التجانس
حدد سبب اختلاف التأثيرات عبر المجموعات السكانية أو الإعدادات.
لكن التحليل التلوي يمكنه ذلك أيضًا
مضلل
وعندما يتم القيام بذلك بشكل سيء، فإنه يؤدي إلى تضخيم التحيز بدلاً من الحقيقة.
عندما لا تجمع
تقيس الدراسات أشياء مختلفة بشكل أساسي (التفاح والبرتقال)
عدم التجانس الشديد الذي لا يمكن تفسيره
دراسة واحدة تهيمن على جميع الدراسات الأخرى (مشكلة الدراسة الضخمة)
تحتوي الدراسات على مخاطر عالية للتحيز لا يمكن تعديلها
التجميع هو امتياز وليس حق.
ويجب الدفاع عن قرار الدمج.
التسلسل الهرمي للأدلة
المراجعات المنهجية والتحليلات التلوية للتجارب المعشاة ذات الشواهد
التجارب المعشاة ذات الشواهد
دراسات الأتراب
دراسات الحالات والشواهد
سلسلة الحالات / رأي الخبراء
ويعتمد الموقع في التسلسل الهرمي على جودة المنهجية، وليس على نوع الدراسة وحده.
يتم تدريس هذه الدورة من خلال
عكس الأدلة.
تبدأ كل وحدة بقصة توضح كيف أخطأ الطب في فهم الأمور. ثم نتعلم الطريقة التي كانت ستمنع الضرر.
المبادئ السبعة
ستعود هذه العبارات طوال رحلتك:
1. "ليست كل إشارة هي الحقيقة."
2. "أساليب تحمي المرضى من ثقتنا."
3. "ما الذي كان مخفيا على مرأى من الجميع؟"
4. "الرقم بدون مصدر ليس رقمًا."
5. "التباين هو رسالة، وليس ضجيجا."
6. "غياب الدليل ليس دليلاً على الغياب"
7. "اليقين يجب أن يُكتسب، لا أن يُفترض."
الوحدة 0 اختبار
1. لماذا لا ينبغي عليك في بعض الأحيان تجميع الدراسات في التحليل التلوي؟
2. أين تقع المراجعات المنهجية للتجارب المعشاة ذات الشواهد في التسلسل الهرمي للأدلة؟
ابدأ الرحلة.
الوحدة 1: السؤال
ليست كل إشارة حقيقة.
هذه ليست قصة عن الخطأ.
إنها قصة عن اليقين.
الوحدة 1: السؤال
🎯 أهداف التعلم
- قم بصياغة سؤال PICO مركّز لإجراء مراجعة منهجية
- التمييز بين النتائج البديلة والنتائج المهمة للمريض
- اشرح لماذا لا تعتبر المعقولية البيولوجية وحدها دليلا كافيا
- وصف تجربة CAST وآثارها على الطب المبني على الأدلة
- تطبيق قاعدة: "ليس كل إشارة مضيئة هدى"
~9,000
الوفيات الزائدة سنويا
من العلاج الذي يعتقد الجميع أنه نجح.
هذه هي قصة كيف آمنا، وكيف كنا مخطئين.
الملاحظة
كان المرضى الذين يعانون من الـ PVC المتكرر بعد احتشاء عضلة القلب لديهم معدل وفيات أعلى بمقدار 2-5 مرات.
حاجة سريرية هائلة. هدف واضح.
الاستجابة
تم تطوير أدوية مضادة لاضطراب النظم، ووافقت عليها إدارة الغذاء والدواء،
ووصفت لحوالي 200000 مريض سنويًا.
لا يظهر أي شرير في هذه القصة.
تصرف الجميع بناءً على أفضل الأدلة المتاحة.
المنطق الذي أقنع الجميع
تتنبأ مضادات اضطراب النظم القلبي بعد احتشاء عضلة القلب بالموت القلبي المفاجئ
الأدوية المضادة لاضطراب نظم القلب تقمع الـ PVCs
قمع الـ PVCs يجب أن يمنع الموت المفاجئ
مضادات اضطراب النظم تنقذ حياة مرضى ما بعد احتشاء عضلة القلب
كانت السلسلة منطقية. شعرت أن الاستنتاج لا مفر منه.
تجربة قمع اضطراب نظم القلب
أخيرًا، سأل أحدهم: "هل قمع الـ PVCs ينقذ الأرواح بالفعل؟"
النتائج: أبريل 1989
يقوم مجلس مراقبة سلامة البيانات بإيقاف التجربة مبكرًا.
| حصيلة | المخدرات (ن = 755) | الدواء الوهمي (ن = 743) |
|---|---|---|
| الوفيات الناجمة عن عدم انتظام ضربات القلب | 33 | 9 |
| جميع الوفيات القلبية | 43 | 16 |
| إجمالي الوفيات | 56 | 22 |
| معدل الوفيات | 7.4% | 3.0% |
الأدوية التي كبحت عدم انتظام ضربات القلب بشكل مثالي زادت معدل الوفيات بنسبة 150٪.
التكلفة البشرية
قبل CAST، كان حوالي 200.000 أمريكي يتلقون هذه الأدوية سنويًا.
~9,000
الوفيات الزائدة سنويا - وربما أكثر
حرب فيتنام: حوالي 6,000 حالة وفاة في الولايات المتحدة سنويًا. • هذه الأدوية: حوالي 9,000+ حالة وفاة سنويًا
لكل رقم اسم لن نعرفه أبدًا.
انظر مرة أخرى.
المنطق – إعادة النظر
تتنبأ مضادات اضطراب النظم القلبي بعد احتشاء عضلة القلب بالموت القلبي المفاجئ
الأدوية المضادة لاضطراب نظم القلب تقمع الـ PVCs
قمع الـ PVCs يجب أن يمنع الموت المفاجئ
مضادات اضطراب النظم تنقذ حياة مرضى ما بعد احتشاء عضلة القلب
لم يتم اختبار الافتراض القائل بأن قمع العلامة سيؤدي إلى إصلاح النتيجة.
ما الخطأ الذي حدث: الفخ البديل
كانت الـ PVCs علامة على الأنسجة التالفة، وليست سببًا للوفاة
كان للأدوية تأثيرات على عدم انتظام ضربات القلب، مما أدى إلى إيقاعات أكثر فتكًا
تحسن البديل بينما ساءت النتيجة - بديل منفصل
لم يكذب البديل. لقد طرحنا عليه السؤال الخطأ.
إطار عمل PICO
يحتوي كل سؤال سريري قابل للإجابة على أربعة مكونات:
تمرين التحقيق: الدليل قبل CAST
أنت طبيب قلب في عام 1988. نجا مريض من احتشاء عضلة القلب ولكنه يعاني من انقباضات قلبية متكررة. الأدب الرصدي واضح...
| دراسة | المرضى الذين يعانون من PVC | خطر الوفيات |
|---|---|---|
| لون (1977) | مواد PVC عالية الجودة | أعلى بمقدار 2.4 مرة |
| أكبر (1984) | > 10 PVC/ساعة | أعلى بمقدار 3.1 مرة |
| مخرجي (1984) | PVC المعقدة | أعلى بمقدار 4.8 مرة |
الإشارة واضحة. الآلية معقولة. هل تصف مضادات اضطراب النظم؟
قبل: المنطق الرصدي
PVCs → ارتفاع معدل الوفيات
المخدرات قمع PVC
∴ الأدوية يجب أن تقلل من معدل الوفيات
بعد: CAST RCT (1989)
معدل الوفيات بسبب المخدرات: 7.4%
معدل الوفيات عند العلاج الوهمي: 3.0%
RR = 2.5 (زيادة بنسبة 150% في الوفيات)
تحسن البديل. مات المرضى. ولهذا السبب نسأل: "ما هي النتيجة المهمة؟"
دروس تركيب الأدلة
المعقولية البيولوجية ليست دليلاً
الآلية المنطقية لا تضمن التأثير المتوقع.
نقاط النهاية البديلة يمكن أن تكون مضللة
إن تحسين العلامة الحيوية لا يثبت تحسنًا في النتائج.
توفر التجارب العشوائية أقوى الأدلة السببية
بيانات المراقبة وحدها نادرًا ما يحدد السببية للتدخلات بسبب الخلط.
الإجماع ليس دليلاً
200000 وصفة طبية، وموافقة إدارة الغذاء والدواء الأمريكية، والمبادئ التوجيهية كانت كلها خاطئة.
ولهذا السبب نقوم بالتحليل التلوي: لرؤية الحقائق الظاهرة الماضية.
ماذا لو كان السؤال الذي تطرحه يحدد من يعيش ومن يموت؟
البيانات الحقيقية
في عام 1989، عرف أطباء القلب أن يمكن تحقيق قمع PVC باستخدام الإنكايينيد والفليكاينيد. بدت نقطة النهاية البديلة مثالية: قامت الأدوية بقمع PVCs عن طريق 80%+. لكن CAST عشوائية 1,498 مريض للعقار النشط مقابل الدواء الوهمي. تم إيقاف التجربة مبكرًا: 56 حالة وفاة في مجموعة الدواء مقابل 22 في العلاج الوهمي. زادت الوفيات 2.5 ضعف. ما يقدر ~ 9000 حالة وفاة أمريكية زائدة سنويًا كانت تُعزى إلى هذه الأدوية.
ما يبدو مؤكدًا قد يكون خاطئًا.
ما يعتقده الجميع قد يكون كاذبا.
توجد طرق حتى لا يدفع المرضى ثمن ثقتنا.
ولهذا السبب أنت هنا.
اختبار الوحدة 1
1. ما هو الخطأ الأساسي في منطق عدم انتظام ضربات القلب؟
2. في PICO، ما الذي يرمز إليه الحرف "O" ولماذا يهم؟
ليست كل إشارة حقيقة.
الأساليب تحمي المرضى من ثقتنا.
ما الذي كان مخفيا على مرأى من الجميع؟
هذه قصة عن
الأدلة الرصدية.
الوحدة الثانية: البروتوكول
🎯 أهداف التعلم
- اشرح لماذا يمنع التسجيل المسبق للبروتوكول التحيز
- تحديد العناصر الأساسية لتسجيل PROSPERO
- تمييز تحيز المستخدم الصحي عن تأثيرات العلاج الحقيقية
- وصف لماذا بالغت الدراسات الرصدية في تقدير فوائد العلاج التعويضي بالهرمونات
- تطبيق المبدأ: "الطرق تحمي المرضى من ثقتنا الثقة"
30+
الدراسات الرصدية
جميعها تظهر أن العلاج بالهرمونات البديلة يحمي النساء بعد انقطاع الطمث من أمراض القلب.
بدت الأدلة دامغة. بدا الاستنتاج مؤكدًا.
دراسة صحة الممرضات
تمت متابعة 122,000 ممرضة لعقود من الزمن. كان لدى مستخدمي العلاج التعويضي بالهرمونات انخفاض في معدل الوفيات القلبية الوعائية بنسبة 40-50٪.
دراسة تاريخية. منهجية لا تشوبها شائبة. استنتاج خاطئ.
التحيز الخفي
انحياز المستخدم الصحي: النساء اللاتي اخترن العلاج التعويضي بالهرمونات كن أكثر صحة وأكثر ثراء وتعليمًا
انحياز الامتثال: النساء اللاتي تناولن العلاج التعويضي بالهرمونات باستمرار اعتنين بأنفسهن بشكل أفضل أيضًا
انحياز واصف الوصف: أعطى الأطباء العلاج التعويضي بالهرمونات لنساء أكثر صحة مع عوامل خطر أقل
لم يكن العلاج يحميهن. لقد كانوا محميين بالفعل.
WHI: النساء مبادرة الصحة
أكبر تجربة عشوائية أجريت على العلاج التعويضي بالهرمونات على الإطلاق.
النتائج: يوليو 2002
توقفت التجربة مبكرًا بعد 5.2 سنة. الضرر أكثر من المنافع.
| حصيلة | نسبة الخطر | الاتجاه |
|---|---|---|
| مرض القلب التاجي | 1.29 | HARM |
| السكتة الدماغية | 1.41 | HARM |
| سرطان الثدي | 1.26 | HARM |
| الانسداد الرئوي | 2.13 | HARM |
الدرس
التحديد المسبق
بروتوكول مكتوب قبل بدء البحث يمنع الصيد ويمنع التحيز ويمنع تشويه الإدراك المتأخر.
ماذا لو نجح العلاج - ولكن فقط بعض؟
البيانات الحقيقية
الذي أظهر أن العلاج التعويضي بالهرمونات يزيد من أحداث القلب والأوعية الدموية بشكل عام. لكن التحليلات اللاحقة كشفت عن نمط حرج: النساء اللاتي بدأن العلاج التعويضي بالهرمونات خلال 10 سنوات من انقطاع الطمث had قللن من خطر الإصابة بأمراض القلب والأوعية الدموية. النساء اللاتي يبدأن بعد مرور 20 عامًا على انقطاع الطمث had زيادة المخاطر. النتيجة الإجمالية الخالية/الضرر أخفت تأثير التوقيت.
تسجيل PROSPERO
سجل قبل البحث
PROSPERO: دولي السجل المحتمل للمراجعات المنهجية
اقفل قراراتك
PICO، استراتيجية البحث، النتائج، خطة التحليل - جميعها محددة مسبقًا
تعديلات الوثيقة
مسموح بالتغييرات ولكن يجب أن تكون شفافة ومبررة
منع الازدواجية
تحقق مما إذا كانت مراجعتك موجودة بالفعل من قبل البدء
اختبار الوحدة 2
1. لماذا أظهرت دراسة صحة الممرضات فائدة من العلاج التعويضي بالهرمونات لم تفعله WHI؟
2. ما هو الغرض الأساسي من تسجيل PROSPERO؟
المواصفات المسبقة ليست كذلك البيروقراطية.
إنها حماية.
ضد ميلنا للعثور على ما نتوقعه.
الأساليب تحمي المرضى من ثقتنا.
ما الذي كان مخفيا على مرأى من الجميع؟
الوحدة 3: البحث
ما الذي كان مخفيا على مرأى من الجميع؟
هذه قصة عن
ما لم ينشروه.
الوحدة 3: البحث
🎯 أهداف التعلم
- قم بتطوير استراتيجية بحث شاملة باستخدام إرشادات PRESS
- ابحث في قواعد بيانات متعددة بما في ذلك مصادر الأدبيات الرمادية
- تحديد سجلات التجارب وقواعد البيانات التنظيمية (ClinicalTrials.gov، FDA)
- اشرح كيف كشفت قضية الروزيجليتازون عن أضرار خفية في القلب والأوعية الدموية
- تطبيق المبدأ: "ما الذي كان مخفيًا على مرأى من الجميع؟"
$3.2B
المبيعات السنوية في الذروة
كان أفانديا (روزيجليتازون) واحدًا من أدوية مرض السكري الأكثر مبيعًا في العالم.
تبدو التجارب المنشورة مطمئنة. أما الكتب غير المنشورة فقد روت قصة مختلفة.
الأدلة المنشورة (ما قبل 2007)
وأظهرت التجارب المنشورة أن روزيجليتازون خفض بشكل فعال نسبة HbA1c. نادرا ما تم الإبلاغ عن نتائج القلب والأوعية الدموية.
بدا البديل جيدًا. ولكن ماذا عن الأحداث القلبية الوعائية الفعلية؟
اكتشاف نيسن: مايو 2007
د. حصل ستيفن نيسن على بيانات التجارب غير المنشورة من موقع الويب الخاص بشركة GSK.
لقد طُلب من GSK، بموجب تسوية قانونية، نشر نتائج التجارب السريرية عبر الإنترنت. قام نيسن وولسكي بتحليل 42 تجربة - لم يتم نشر العديد منها مطلقًا في المجلات.
كانت البيانات علنية من الناحية الفنية.
لم يقم أحد بالبحث عنه بشكل منهجي.
نتائج التحليل التلوي
| حصيلة | نسبة الاحتمالات | 95% CI |
|---|---|---|
| احتشاء عضلة القلب | 1.43 | 1.03 - 1.98 |
| وفاة السيرة الذاتية | 1.64 | 0.98 - 2.74 |
نشرت في NEJM. دعت إدارة الغذاء والدواء الأمريكية إلى اجتماع للجنة الاستشارية الطارئة.
اللجنة الاستشارية لإدارة الغذاء والدواء: يوليو 2007
تم تقسيم اللجنة. ومنهم من أراد سحبها. ووصف البعض التحليل التلوي بأنه معيب.
لكن لا يمكن إخفاء الإشارة.
العواقب
تحذير الصندوق الأسود تمت إضافته لمخاطر قصور القلب (2007)
قيود شديدة بشأن وصف الأدوية في الولايات المتحدة (2010)
منشور من السوق الأوروبية بالكامل (2010)
تتطلب إدارة الغذاء والدواء الآن تجارب نتائج القلب والأوعية الدموية لجميع أدوية مرض السكري
ما يتطلبه البحث الشامل
قائمة التحقق من الصحافة
مراجعة النظراء لاستراتيجيات البحث الإلكتروني
ترجمة سؤال البحث
هل يعكس البحث PICO العناصر؟
عوامل التشغيل المنطقية والتقريبية
هل لا يتم استخدام AND أو OR بشكل صحيح؟
عناوين الموضوع
هل مصطلحات MeSH/Emtree مناسبة ومفصلة؟
الكلمات النصية
المرادفات، المتغيرات الإملائية، الاقتطاع؟
قائمة PRESS المرجعية (تابع)
التهجئة وبناء الجملة وأرقام الأسطر
هل هناك أخطاء قد تؤدي إلى استرجاعها
الحدود والمرشحات
هل حدود التاريخ واللغة وتصميم الدراسة مناسبة؟
تعمل عمليات البحث التي يراجعها النظراء على تحسين استرجاع الدراسات الرئيسية بشكل كبير.
المبادئ التوجيهية الصحفية: McGowan et al., 2016
ترجمة قاعدة البيانات
يجب تعديل نفس البحث لكل قاعدة بيانات:
"داء السكري، النوع 2"[MeSH] OR "مرض السكري من النوع 2"[tiab]
'مرض السكري غير المعتمد على الأنسولين'/exp OR 'مرض السكري من النوع 2':ti,ab
عناوين المواضيع، الحقل العلامات، والمشغلين تختلف بين قواعد البيانات.
ماذا يحدث عندما تبحث - ولا تجد شيئًا؟
البيانات الحقيقية
الحكومات المخزونة 9 مليارات دولار للأوسيلتاميفير (تاميفلو) لعلاج جائحة الأنفلونزا. حاولت مؤسسة كوكرين مراجعة الأدلة. من 77 تجربة سريرية، التقارير الكاملة موجودة فقط 20. رفضت شركة Roche مشاركة البيانات الخاصة بـ 5 سنوات. عندما حصلت BMJ وCochrane أخيرًا على أكثر من 160.000 صفحة ومن خلال تقارير الدراسات السريرية، وجدوا أن عقار تاميفلو قلل الأعراض بنسبة أقل من يوم واحد، مع لا يوجد دليل منع دخول المستشفى أو المضاعفات.
إذا بحثت شركة Nissen في PubMed فقط،
لكانت الإشارة مخفية.
البحث الشامل هو البقاء.
ما الذي كان مخفيا على مرأى من الجميع؟
الوحدة 3 مسابقة
1. ما نوع مصدر الأدلة الذي كشف عن إشارة القلب والأوعية الدموية للروزيجليتازون؟
2. ما الذي تعنيه كلمة PRESS؟
ما الذي كان مخفيا على مرأى من الجميع؟
الوحدة 4: الفحص
الرقم بدون مصدر ليس رقمًا.
هذه قصة عن
ما اختاروا الإبلاغ عنه.
الوحدة 4: الفحص
🎯 أهداف التعلم
- تطبيق مخطط تدفق PRISMA لتوثيق اختيار الدراسة
- تنفيذ فحص المراجع المزدوج مع حل النزاعات
- تحديد تقارير النتائج الانتقائية ومعالجة البيانات
- حساب الموثوقية بين التقييمات (كابا كوهين)
- تطبيق المبدأ: "الرقم بدون مصدر ليس رقمًا"
88,000
النوبات القلبية المنسوبة إلى Vioxx
دواء رائج. إشارة مخفية. كارثة يمكن الوقاية منها.
بين في عامي 1999 و2004، تناول الملايين هذا المسكن. لم يعد البعض إلى المنزل مطلقًا.
ظهور Vioxx
كان Rofecoxib (Vioxx) أحد مضادات الالتهاب غير الستيروئيدية الانتقائية لـ COX-2. تم تسويقه على أنه أكثر أمانًا للمعدة من مسكنات الألم التقليدية.
تجربة VIGOR (2000)
أبحاث نتائج الجهاز الهضمي فيوكس
ما نشرته VIGOR
| نتيجة جي آي | فيوكس | نابروكسين |
|---|---|---|
| أحداث الجهاز الهضمي المؤكدة | 2.1 لكل 100 نقطة سنة | 4.5 لكل 100 نقطة سنة |
| تخفيض | أحداث الجهاز الهضمي أقل بنسبة 54% | |
العنوان: فيوكس أكثر أمانًا لمعدتك!
هذا ما قيل للأطباء. هذا ما يعتقده المرضى.
ما دفنه VIGOR
| نتيجة السيرة الذاتية | فيوكس | نابروكسين |
|---|---|---|
| احتشاء عضلة القلب | 20 حدثا | 4 أحداث |
| المخاطر النسبية | أعلى بمقدار 5 مرات في مجموعة Vioxx | |
التقارير الانتقائية
التلاعب بقطع البيانات: حدثت 3 نوبات قلبية إضافية بعد القطع المستخدم في المنشور
يلف: تم شرح إشارة السيرة الذاتية بعيدًا عن كون النابروكسين واقيًا للقلب (لا يوجد دليل)
تبديل النتائج: تم تحديد أحداث السيرة الذاتية مسبقًا ولكن لم يتم التأكيد عليها
المعرفة الداخلية: تُظهر رسائل البريد الإلكتروني لشركة Merck أنهم كانوا على علم بالإشارة
تجربة APPROVe (2004)
تجربة للوقاية من سلائل القولون والمستقيم - توقفت مبكرًا من أجل السلامة.
بعد أربع سنوات من ظهور VIGOR لخطر 5x. أربع سنوات متأخرة جداً.
هل فكرت في ذلك ماذا يحدث عندما تختبئ الإشارة في الضوضاء؟
البيانات الحقيقية
تمت الموافقة على Vioxx (rofecoxib) في 1999. By 2004، تشير التقديرات 88.000-140.000 نوبة قلبية زائدة and 30.000-40.000 حالة وفاة. أظهرت تجربة VIGOR الخاصة بشركة Merck 5x خطر على القلب والأوعية الدموية في عام 2000، ولكن تم رفضه باعتباره "تأثير النابروكسين الواقي للقلب".
مخطط تدفق PRISMA
يجب أن تكون كل خطوة من خطوات الفحص موثقة وشفافة.
الفحص المزدوج: لماذا مراجعان؟
يقلل من تحيز الاختيار
قد يفضل أحد المراجعين دون وعي دراسات معينة
يصيد الأخطاء
الإرهاق وسوء القراءة والأخطاء أمر لا مفر منه
القوى معايير صريحة
تكشف الخلافات الغموض في قواعد الإدماج
اتفاق نموذجي: κ = 0.6-0.8
يتم حل الخلافات عن طريق المناقشة أو المراجع الثالث
المعايرة: المرحلة التجريبية
قبل فحص آلاف السجلات، يجب على المراجعين معايرة عينة مكونة من 50 إلى 100 سجل.
شاشة نفس المجموعة بشكل مستقل
مقارنة القرارات ومناقشة الخلافات
تحسين معايير الاشتمال حتى κ > 0.7
توثيق عملية المعايرة وأي تغييرات في القواعد
تحديثات بريسما 2020
قامت PRISMA 2020 بمراجعة قائمة المراجعة بشكل جوهري مع إعداد تقارير موسعة حول طرق التوليف وتقييم اليقين وتسجيل البروتوكول.
إذا تم فحص بيانات القلب والأوعية الدموية الخاصة بـ Vioxx من قبل مراجعين مستقلين،
إذا كان مطلوبًا الإبلاغ عن جميع النتائج المحددة مسبقًا،
كان من الممكن منع 88000 نوبة قلبية.
الرقم بدون مصدر ليس رقمًا.
اختبار الوحدة 4
1. في تجربة VIGOR، ما هو الخطر النسبي لـ MI في مجموعة Vioxx مقارنةً بالنابروكسين؟
2. ما أهمية الفحص المزدوج (مراجعان مستقلان)؟
الرقم بدون مصدر ليس رقمًا.
الوحدة 5: الاستخلاص
الرقم بدون مصدر ليس رقمًا.
هذه قصة عن
الأرقام التي لم تكن موجودة من قبل.
الوحدة 5: الاستخلاص
🎯 أهداف التعلم
- تصميم نموذج موحد لاستخراج البيانات مع حقول المصدر
- حساب أحجام التأثير من مختلف الإحصاءات المبلغ عنها (OR، RR، HR، SMD)
- تنفيذ الاستخراج المزدوج مع حل التناقض
- تحديد العلامات الحمراء لتلفيق البيانات وسوء السلوك
- اشرح كيف أثر الاحتيال في DECREASE على الإرشادات السريرية
~10,000
الوفيات الزائدة المحتملة في أوروبا
من الإرشادات المستندة إلى التجارب السريرية الملفقة البيانات.
أثرت تجارب DECREASE على الرعاية المحيطة بالجراحة في جميع أنحاء العالم. تم اختراع البيانات.
دون بولدرمانز: باحث نجم
أستاذ في مركز إيراسموس الطبي، روتردام. مؤلف أكثر من 500 ورقة. المؤلف الرئيسي للمبادئ التوجيهية ESC بشأن رعاية القلب المحيطة بالجراحة.
يبدو أنه مصدر لا يرقى إليه الشك. حتى ينظر شخص ما إلى البيانات.
تجارب DECREASE: المطالبة
| محاكمة | العثور على | تأثير |
|---|---|---|
| انخفاض-I (1999) | انخفاض بنسبة 90% في حالات الوفاة القلبية | المبادئ التوجيهية المتغيرة |
| التخفيض الرابع (2009) | حاصرات بيتا آمنة في المخاطر المنخفضة | توصيات موسعة |
وكانت أحجام التأثير كبيرة بشكل غير معقول.
تخفيض 90%؟ لا يوجد شيء تقريبًا في الطب يعمل بشكل جيد.
التحقيق: 2011
تم التحقيق في Erasmus MC بعد شكاوى المبلغين عن المخالفات
بيانات المرضى الملفقة: المرضى الذين لم يكونوا موجودين أو لم يتم تسجيلهم
لا توجد موافقة مستنيرة: لم يوافق العديد من "المشاركين" أبدًا
تم طرد Poldermans: من Erasmus MC في عام 2011
سلسلة الضرر
عندما تمت إزالة DECREASE من التحليلات الوصفية...
لقد أظهرت تجربة POISE (2008) ضررًا. تم رفضه لأنه يتعارض مع DECREASE.
لماذا لم يتم اكتشاف هذا؟
الثقة في السلطة: كان بولديرمانز مؤلف المبادئ التوجيهية الذي قام بمراجعة الأدلة الخاصة به
لا يوجد التحقق من البيانات: لم يطلب أحد بيانات المريض الفردية
مكانة النشر: منشور في أفضل المجلات، ويفترض أنه صالح
قبول التأثيرات غير المعقولة: يجب أن تثير التخفيضات بنسبة 90% الشكوك
استخراج البيانات: الدفاع ضد الاحتيال
الاستخراج المزدوج
مستخرجان بشكل مستقل - يكتشفان أخطاء النسخ ويفرضان التدقيق
مصدر السجل
جدول، صفحة، فقرة - كل رقم يمكن تتبعه إلى المصدر
التحقق من التسجيل
ClinicalTrials.gov النتائج مقابل النشر - التناقضات هي علامات حمراء
طلب IPD
تكشف بيانات المريض الفردية ما تخفيه الملخصات الإجمالية
حساب حجم التأثير
أثناء الاستخراج، يمكنك حساب أحجام التأثير من البيانات المبلغ عنها:
نسبة الأرجحية، نسبة المخاطرة، فرق المخاطرة من جداول 2x2
الفرق المتوسط، الفرق المتوسط الموحد من الوسائل وSD
استخرج دائمًا من المصدر الأكثر موثوقية.
تفضل: نتائج ITT > لكل بروتوكول > المجموعات الفرعية
الأعلام الحمراء أثناء الاستخراج
أحجام التأثير غير المعقول: يجب أن تؤدي التخفيضات بنسبة 80-90% إلى التدقيق
الاختلالات الأساسية: المجموعات التي تمت مطابقتها "بشكل مثالي جدًا"
أرقام الجولة: "بالضبط 50" أو "بالضبط 100" مريض لكل ذراع
تناقضات التسجيل: تختلف N المنشورة عن N المسجلة
تحويلات حجم التأثير
نتائج تقرير الدراسات في مقاييس مختلفة. لتجميعها، غالبًا ما تحتاج إلى تحويلات:
| From | To | صيغة |
|---|---|---|
| مصلحة الارصاد الجوية (د) | سجل-أو | سجل-OR = د × π / √3 |
| سجل-أو | مصلحة الارصاد الجوية (د) | د = سجل-OR × √3 / π |
| الارتباط (ص) | فيشر ز | z = 0.5 × ln((1+r)/(1−r)) |
| OR | RR | RR = OR / (1 − P₀ + P₀ × OR) |
| OR | NNT | NNT = 1 / (P₀ − OR×P₀ / (1−P₀+OR×P₀)) |
P₀ = خطر خط الأساس في مجموعة التحكم. تفترض هذه الصيغ شروطًا تقريبية؛ انظر بورنشتاين وآخرون. (الفصل 7) للاشتقاقات الدقيقة.
بيانات الوقت حتى الحدث (البقاء)
أبلغت العديد من التجارب عن نتائج الوقت حتى الحدث باستخدام نسب الخطر (الموارد البشرية). يتطلب تجميع الموارد البشرية في التحليل التلوي معالجة خاصة:
السجل (HR) + طريقة SE
استخرج السجل (HR) وSE الخاص به من التجربة. إذا لم يتم الإبلاغ عنها، فاشتق SE من CI: SE = (ln(upper) - ln(lower)) / (2 × 1.96). التجمع باستخدام طرق التباين العكسي القياسية.
عندما لا يتم الإبلاغ عن الموارد البشرية
توجد طرق لإعادة بناء IPD من منحنيات كابلان-ماير (Guyot et al. 2012) أو تقدير الموارد البشرية من القيم p وأعداد الأحداث (Parmar et al. 1998). تفضل دائمًا معدل الموارد البشرية المعدل الذي تم الإبلاغ عنه مباشرة عندما يكون متاحًا.
HR <1 يفضل العلاج؛ الموارد البشرية > 1 تفضل التحكم. يفعل not تحويل الموارد البشرية إلى ORs أو RRs - فهي تقيس كميات مختلفة بشكل أساسي.
ماذا لو لم تكن البيانات التي تستخرجها حقيقية على الإطلاق؟
البيانات الحقيقية
كان يواكيم بولدت هو الباحث الأكثر إنتاجًا في إدارة سوائل التخدير. تم سحب أكثر من 180 من منشوراته — وهي واحدة من أكبر حالات التراجع في التاريخ الطبي. وأظهرت بياناته الملفقة أن نشا هيدروكسي إيثيل (HES) آمن. خلصت التحليلات التلوية التي شملت دراساته إلى أن HES غير ضار. عندما تمت إزالة دراسات بولدت، انعكس التأثير المجمع: زاد HES إصابة الكلى بنسبة 59% (RR 1.59، 95٪ CI 1.26-2.00) و الوفيات بنسبة ~ 9٪ (RR 1.09). يقدر آلاف المرضى تلقى سائلاً ضاراً بناءً على أدلة ملفقة.
كل رقم في تحليلك التلوي
يجب أن يعود إلى مصدر يمكن التحقق منه.
الرقم بدون مصدر ليس رقمًا.
من الممكن أن تؤدي البيانات الاحتيالية إلى الوفاة تمامًا مثل الأدوية الاحتيالية.
اختبار الوحدة 5
1. ماذا حدث عندما تمت إزالة بيانات تجربة DECREASE من التحليلات الوصفية لحاصرات بيتا؟
2. لماذا يجب أن يكون الاستخراج المزدوج ممارسة قياسية؟
الرقم بدون مصدر ليس رقمًا.
الوحدة 6: التحيز
الأساليب تحمي المرضى من ثقتنا.
هذه قصة عن
التحيز الذي لا يمكننا رؤيته.
الوحدة 6: التحيز
🎯 أهداف التعلم
- تطبيق خطر التحيز 2.0 (RoB 2) على التجارب العشوائية
- تطبيق ROBINS-I على الدراسات غير العشوائية
- تقييم جميع مجالات RoB 2 الخمسة (العشوائية، والانحرافات، والبيانات المفقودة، والقياس، والاختيار)
- التمييز بين الإرباك من خلال الإشارة من آثار العلاج الحقيقية
- اشرح كيف كشف تحليل بارت عن الأضرار الخفية للأبروتينين
20+
سنوات في السوق
كان الأبروتينين هو المعيار الذهبي لتقليل العمليات الجراحية نزيف.
ثم أجرى شخص ما تجربة معشاة ذات شواهد. الحقيقة كانت مختلفة.
التحيز الخفي: الإرباك من خلال الإشارة
حصل المرضى المرضى على أبروتينين: استخدمه الجراحون في الحالات المعقدة عالية الخطورة
انحياز الناجين: لا يمكن للمرضى المتوفين الإبلاغ عن المضاعفات
تحيز النشر: لم يتم نشر الدراسات السلبية
لم تتمكن الدراسات الرصدية من فصل تأثير الدواء عن المخاطر الأساسية للمريض.
بارت: الحقيقة العشوائية
الحفاظ على الدم باستخدام مضادات انحلال الفيبرين في تجربة عشوائية
| حصيلة | أبروتينين | البدائل |
|---|---|---|
| معدل الوفيات لمدة 30 يومًا | 6.0% | 3.9% |
| المخاطر النسبية | 1.53 (53% زيادة في الوفيات) | |
التحقيق: تقييم التحيز
أنت تقوم بمراجعة الدراسات الرصدية. تطبيق خطر التفكير المتحيز:
| سؤال | رصدي | بارت (RCT) |
|---|---|---|
| تخصيص عشوائي؟ | ❌ اختيار الجراح | ✓ نعم |
| يمكن مقارنة خط الأساس؟ | ❌ تعاطي سيكر | ✓ متوازن |
| المسببة للعمى؟ | ❌ التسمية المفتوحة | ✓ مزدوج التعمية |
الخلط بالإشارة: أعطى الجراحون أبروتينين للمرضى الأكثر مرضًا. عزت الدراسات الرصدية البقاء على قيد الحياة إلى الدواء، عندما كانت تقيس تحيز البقاء على قيد الحياة.
خطر التحيز 2.0: المجالات الخمسة
عملية التوزيع العشوائي
الانحرافات عن التدخلات المقصودة
بيانات النتائج المفقودة
قياس النتيجة
اختيار النتيجة المبلغ عنها
ROBINS-I: للدراسات غير العشوائية
عندما لا تكون التجارب المعشاة ذات الشواهد متاحة، استخدم ROBINS-I (خطر التحيز في الدراسات غير العشوائية التدخلات)
مربك
الاختلافات الأساسية بين المجموعات
اختيار المشاركين
الاستثناءات ذات الصلة للتدخل
تصنيف التدخلات
سوء تصنيف حالة التعرض
الانحرافات عن التدخلات المقصودة
التدخلات المشتركة، التلوث
البيانات المفقودة
الخسارة التفاضلية للمتابعة
قياس النتائج
انحياز التأكد
اختيار النتيجة المبلغ عنها
تقارير انتقائية
التقييمات: منخفضة / متوسطة / خطيرة / حرجة / لا توجد معلومات
ماذا يحدث عندما تتفق 64 دراسة - وكلها خاطئة؟
البيانات الحقيقية
تم استخدام الأبروتينين في جراحة القلب لتقليل النزيف لـ 20 سنة. 64 تجربة عشوائية صغيرة اقترح أنه آمن و فعالة. وأكدت التحليلات التلوية فائدة. ثم تجربة BART (2008) عشوائية 2331 مريضا: أبروتينين مقابل حمض الترانيكساميك مقابل حمض الأمينوكابرويك. النتيجة: زيادة الأبروتينين الوفيات بنسبة 53% (RR 1.53، 95% CI 1.06-2.22). تم إيقاف المحاكمة مبكرًا بسبب الضرر. قامت شركة باير بسحب الأبروتينين من السوق خلال أشهر.
قامت أربع وستون تجربة صغيرة بقياس النزيف، وليس الموت.
كشفت إحدى التجارب التي تم تشغيلها بشكل كافٍ عن زيادة في معدل الوفيات بنسبة 53٪.
لا يمكن أن تحل كمية الأدلة محل الجودة والقوة.
اختبار الوحدة 6
1. لماذا أخطأت 64 تجربة صغيرة ضرر الأبروتينين؟
الأساليب تحمي المرضى من ثقتنا.
الوحدة السابعة: التركيب
التباين رسالة وليس ضجيج.
الجدل حول المغنيسيوم: 1991-1995
عندما يؤدي التجميع إلى الضلال.
الوحدة السابعة: التركيب
🎯 أهداف التعلم
- احسب أحجام التأثير المجمعة باستخدام نماذج التأثير الثابت والتأثيرات العشوائية
- اختر بين مقدرات DerSimonian-Laird وHKSJ بشكل مناسب
- تفسير مخططات الغابة بما في ذلك الأوزان وفترات الثقة والماس
- اشرح لماذا يمكن لتأثيرات الدراسات الصغيرة أن تضلل التحليلات الوصفية
- طبق المبدأ: "التباين رسالة، وليس ضجيج"
السنة: 1991
"أنت تقف على مفترق طرق الأمل والأدلة..."
تقتل أمراض القلب عددًا أكبر من الأشخاص في جميع أنحاء العالم مقارنة بأي سبب آخر. في عام 1991، ظهر أمل جديد: هل يمكن لشيء بسيط ورخيص مثل المغنيسيوم الوريدي أن ينقذ الأرواح بعد احتشاء عضلة القلب؟
كان الأساس المنطقي البيولوجي سليمًا:
يعمل المغنيسيوم على استقرار أغشية القلب، ويمنع عدم انتظام ضربات القلب، ويوسع الأوعية الدموية للشرايين التاجية.
الحد -2: التجربة التاريخية
تجربة التدخل الوريدي للمغنيسيوم في ليستر، 1992
تدخل رخيص وآمن يمكن أن ينقذ حياة 250 ألف شخص سنويا على مستوى العالم.
كان المجتمع الطبي مكهرب.
التحليل التلوي: 1993
تجمع الباحثون سبع تجارب عشوائية من المغنيسيوم الرابع في MI:
| محاكمة | Year | N | نسبة الاحتمالات |
|---|---|---|---|
| مورتون 1984 | 1984 | 40 | 0.10 |
| راسموسن 1986 | 1986 | 273 | 0.35 |
| سميث 1986 | 1986 | 400 | 0.48 |
| ابراهيم 1987 | 1987 | 94 | 0.87 |
| شيشتر 1990 | 1990 | 103 | 0.27 |
| سيريموزينسكي 1989 | 1989 | 48 | 0.22 |
| الحد-2 | 1992 | 2,316 | 0.74 |
تمرين التحقيق: معضلة المحلل التلوي
أنت أحد مراجعي كوكرين في عام 1993. لقد طُلب منك تجميع الأدلة المتعلقة بالمغنيسيوم من أجل MI. البيانات من سبع تجارب موجودة أمامك.
هل ترى النمط في مخطط الغابة هذا؟
ولكن انتظر... هل لاحظت أي شيء عن أحجام التجارب؟
التحذير العلامات
ما الذي كان يجب أن يمنحنا وقفة؟
أحجام العينات الصغيرة: كان لدى ستة من سبع تجارب أقل من 500 مريض
التأثيرات القصوى: أو 0.10 (تخفيض بنسبة 90%) غير قابل للتصديق لأي دواء
الكل إيجابي: أين كانت التجارب السلبية؟ مشكلة درج الملفات...
عدم تناسق القمع: أظهرت التجارب الصغيرة تأثيرات أكبر بكثير من التجارب الأكبر
اختبار مخطط التحويل
قبل أن نقوم بالتجميع، يجب علينا التحقق من تحيز النشر. دعونا نتفحص المخطط القمعي.
⚠️ قمع غير متماثل
تتجمع التجارب الصغيرة على اليسار (تظهر الفائدة). أين التجارب السلبية الصغيرة؟
اختبار إيجر ع = 0.04 — عدم تناسق ذو دلالة إحصائية.
العام: 1995 — تقارير داعش-4
"ثم جاءت الحقيقة..."
The الدراسة الدولية الرابعة للبقاء على قيد الحياة أثناء الاحتشاء (ISIS-4) تم تسجيل 58,050 مريضًا في 1,086 مستشفى في 31 دولة.
قبل وبعد: الصورة الكاملة
شاهد ما يحدث عندما نضيف التجربة الضخمة إلى غابتنا مؤامرة ...
قبل داعش-4
7 تجارب صغيرة (العدد = 3,274)
OR = 0.44
إشارة فائدة قوية
بعد إيزيس-4
8 تجارب (ن = 61,324)
OR = 1.02
لا تأثير
لماذا كانت التجارب الصغيرة مضللة؟
انحياز النشر
لم تُنشر التجارب السلبية الصغيرة مطلقًا، بل ظلت في أدراج الملفات
تأثيرات الدراسات الصغيرة
تميل التجارب الأصغر إلى إظهار تأثيرات أكبر بسبب نقاط الضعف المنهجية
التحيز العشوائي العالي
بالصدفة، حققت بعض التجارب الصغيرة نتائج متطرفة - وتم نشر تلك التجارب
تضخيم التأثيرات العشوائية
تعطي نماذج التأثيرات العشوائية وزنًا أكبر للتجارب الصغيرة، مما يؤدي إلى تضخيم التحيز
تأثير واحد ثابت مقابل تأثيرات عشوائية
ما هو النموذج الذي يجب أن تختاره؟
يفترض تأثير حقيقي واحد. دراسات الأوزان بالتباين العكسي (الدقة). المحاكمات الكبيرة تهيمن.
نتيجة المغنيسيوم : OR = 0.96 (p = 0.52)
يفترض توزيع التأثيرات. يعطي وزنا أكبر للتجارب الصغيرة. فترات ثقة أوسع.
نتيجة المغنيسيوم : OR = 0.59 (p = 0.01)
⚠️ حدد اختيار النموذج النتيجة!
التأثيرات العشوائية لا تعمل على إصلاح التحيز؛ مع تأثيرات الدراسات الصغيرة، قد يؤدي ذلك إلى تحويل الوزن نحو تجارب أصغر وتغيير الاستنتاجات.
دروس المغنيسيوم
1. تحقق من تحيز النشر قبل الوثوق في التقدير المجمع. المخططات القمعية واختبار إيجر هي أدواتك.
2. كن حذرًا من تأثيرات الدراسة الصغيرة. إذا أظهرت التجارب الصغيرة فقط فائدة، فانتظر تجربة كبيرة جيدة التنفيذ.
3. اختيار النموذج مهم. التأثيرات العشوائية يمكن أن تؤدي إلى تضخيم الأدلة المتحيزة. فكر في كلا النموذجين وافهم الآثار المترتبة.
4. يمكن لمحاكمة واحدة كبيرة أن تقلب الكثير من التجارب الصغيرة. وهذا هو السبب في أن التجارب الضخمة مثل إيزيس-4 ذات قيمة كبيرة.
تصاميم الدراسات الخاصة في التحليل التلوي
لا تستخدم جميع التجارب المعشاة ذات الشواهد تصميمات المجموعة المتوازية القياسية. هناك بديلان شائعان يتطلبان معالجة خاصة عند تجميع النتائج:
التجارب العشوائية العنقودية
المجموعات العشوائية (المستشفيات والمدارس)، وليس الأفراد. يقلل تأثير التصميم = 1 + (m−1) × ICC من حجم العينة الفعال. قم بتقسيم N على تأثير التصميم قبل التجميع، أو استخدم SE المعدل من التجربة. يؤدي تجاهل التجميع إلى إنتاج CIs ضيقة بشكل مصطنع.
التجارب المتقاطعة
يتلقى كل مريض كلا العلاجين. يعمل التصميم المقترن على تقليل التباين، لكنك تحتاج إلى الارتباط داخل المريض (أو التحليل المقترن SE) للتجميع بشكل صحيح. يعد استخدام المجموعة الموازية SE أمرًا محافظًا. استخدام عدد مزدوج غير صحيح من المرضى.
راجع دليل كوكرين الإصدار 6.4، الفصل 23 للحصول على صيغ مفصلة وأمثلة عملية.
ماذا لو كانت الطريقة التي تجمع بها الدراسات تحدد ما إذا كان العلاج يبدو منقذًا للحياة أم لا عديمة الفائدة؟
البيانات الحقيقية
تم دعم الفاعل بالسطح المبكر للأطفال المبتسرين بواسطة 6 تجارب صغيرة عرض انخفاض معدل الوفيات (RR 0.84). A التحليل التلوي ذو التأثير الثابت فائدة مؤكدة (P = 0.04). لكن نموذج التأثيرات العشوائية لم يظهر أي أهمية (p=0.12) - تجاوز فاصل الثقة 1.0. لاحقًا، وجدت الدعم (2010) and فون (2012)، تجربتان عمليتان كبيرتان مع ~ 2000 حديثي الولادة مجتمعة، لا فائدة من الفاعل بالسطح المبكر مقابل الخافض للتوتر السطحي اللاحق. تم تغيير الممارسة السريرية بناءً على تجارب صغيرة ونموذج خاطئ.
اختبار الوحدة السابعة
1. لماذا أظهر التحليل التلوي للمغنيسيوم فائدة لم يجدها ISIS-4؟
2. ما هي العلامة التحذيرية التي ينبغي أن تنبه المراجعين إلى التحيز المحتمل؟
3. عند الاشتباه في تحيز النشر، ما النموذج الذي قد يؤدي إلى تضخيم التحيز؟
يمكن أن تظهر التجارب الصغيرة إشارات خاطئة.
المحاكمات الكبيرة تثبت الحقيقة.
التباين رسالة وليس ضجيج.
التباين رسالة وليس ضجيج.
الوحدة 8: عدم التجانس
التباين رسالة وليس ضجيج.
ACCORD: 2008
عندما يخفي المتوسط الحقيقة.
الوحدة 8: عدم التجانس
🎯 أهداف التعلم
- احسب وفسر I² وτ² وفترات التنبؤ
- تطبيق معايير ICEMAN لتقييم مصداقية المجموعة الفرعية
- التمييز بين عدم التجانس السريري والمنهجي والإحصائي
- إجراء وتفسير تحليلات حساسية الإجازة الواحدة
- اشرح كيف كشف ACCORD عن التأثيرات التفاضلية عبر المجموعات الفرعية
السنة: 2008
"أنت على وشك أن تشهد واحدة من أكثر حالات إنهاء المحاكمات إثارة للصدمة في التاريخ..."
على مدى عقود من الزمن، كان لدى مجتمع مرضى السكري مبدأ توجيهي واحد: انخفاض نسبة السكر في الدم هو الأفضل. أظهر DCCT (1993) وUKPDS (1998) أن التحكم المكثف في الجلوكوز يقلل من مضاعفات الأوعية الدموية الدقيقة - العمى، الفشل الكلوي، تلف الأعصاب.
الاستقراء المنطقي:
إذا كان التحكم في الجلوكوز يمنع حدوث مضاعفات، ألا ينبغي أن يمنع التحكم المكثف أمراض القلب والأوعية الدموية أيضًا؟
ACCORD: إجراء للسيطرة على مخاطر القلب والأوعية الدموية في مرض السكري
الاختبار النهائي للتحكم المكثف في الجلوكوز
كان جميع المرضى مصابين بداء السكري من النوع 2 مع ارتفاع خطر الإصابة بأمراض القلب والأوعية الدموية - إما أمراض القلب والأوعية الدموية المثبتة أو عوامل الخطر المتعددة. تم تصميم التجربة لمدة 5.6 سنوات.
6 فبراير 2008
يدعو مجلس مراقبة سلامة البيانات إلى اجتماع طارئ.
بعد 3.5 سنوات، يتخذون قرارًا غير مسبوق:
أوقف التجربة.
النتائج المروعة
| حصيلة | مكثف | معيار | HR (95% CI) |
|---|---|---|---|
| نقطة نهاية السيرة الذاتية الأولية | 352 حدثًا | 371 حدثًا | 0.90 (0.78–1.04) |
| الوفيات الناجمة عن جميع الأسباب | 257 حالة وفاة | 203 حالة وفاة | 1.22 (1.01–1.46) |
| نقص السكر في الدم الشديد | 10.5% | 3.5% | 3.0× أعلى |
تمرين التحقيق: معضلة الطبيب
أنت طبيب غدد صماء ولديك 500 مريض بالسكري. تم نشر نتائج أكورد. ماذا تقول لمرضاك الذين يسعون جاهدين للحصول على نسبة HbA1c <6%؟
هل المراقبة المكثفة ضارة للجميع؟ أم فقط للبعض؟
كشف تحليل المجموعة الفرعية:
| مجموعة فرعية | الموارد البشرية المكثفة | التفسير |
|---|---|---|
| عدم وجود أمراض القلب والأوعية الدموية السابقة | 1.00 (0.76–1.32) | لا تأثير |
| أمراض القلب والأوعية الدموية السابقة | 1.45 (1.15–1.84) | ضرر كبير |
| خط الأساس لنسبة HbA1c <8% | 1.02 (0.75–1.40) | لا تأثير |
| خط الأساس لنسبة HbA1c ≥8% | 1.29 (1.03–1.60) | Harm |
متوسط التأثير ملثمين عدم التجانس الحرج!
بالنسبة للمرضى الذين يعانون من أمراض القلب والأوعية الدموية أو التحكم الأساسي الضعيف، كان العلاج المكثف ضارًا.
فهم عدم التجانس: I² وما بعده
عند الدراسات (أو المجموعات الفرعية) تظهر تأثيرات مختلفة، يجب علينا قياس هذا الاختلاف.
I² = 0–25%: عدم التجانس المنخفض. تكون التأثيرات متسقة عبر الدراسات.
I² = 25–50%: معتدل. ابحث عن مصادر الاختلاف.
I² = 50–75%: جوهري. فكر فيما إذا كان التجميع مناسبًا.
I² = 75–100%: كبير. قد يكون التقدير المجمع الواحد مضللاً.
لكن I² وحده لا يخبرك بما يجب فعله — فهو يشير إلى أنك بحاجة إلى مزيد من البحث.
Tau² (τ²): التباين بين الدراسة
بينما يخبرك I² بنسبة التباين الناتج عن عدم التجانس، τ² يخبرك بالحجم.
"ما هو جزء التباين الإجمالي الناتج عن الاختلافات الحقيقية بين الدراسات؟"
المقياس: من 0% إلى 100%
"ما مدى اختلاف التأثيرات الحقيقية بين الدراسات؟"
نفس مقياس قياس التأثير
استخدم τ² للحساب فترات التنبؤ
يُظهر الفاصل الزمني للتنبؤ نطاق التأثيرات التي تتوقعها في دراسة جديدة - غالبًا ما يكون أوسع بكثير من الثقة الفاصل الزمني.
الفاصل الزمني للتنبؤ: ما يخبرنا به ACCORD حقًا
النظر في التحليل التلوي للتحكم المكثف في الجلوكوز عبر تجارب متعددة...
فاصل الثقة
HR 1.10 (0.95–1.27)
"أفضل تقدير لدينا لمتوسط التأثير"
الفاصل الزمني للتنبؤ
HR 1.10 (0.70–1.73)
"نطاق التأثيرات في بيئة جديدة"
يشمل الفاصل الزمني للتنبؤ كلاً من المنفعة والضرر!
في بعض الإعدادات، قد يكون التحكم المكثف مفيدًا. وفي حالات أخرى، يمكن أن يقتل.
متى يكون تأثير المجموعة الفرعية ذا مصداقية؟
معايير مصداقية المجموعة الفرعية (مقتبسة من ICEMAN, Schandelmaier 2020 & Sun 2012)
هل كان تحليل المجموعة الفرعية محددًا مسبقًا؟
المجموعات الفرعية اللاحقة عرضة للبيانات التجريف
هل هناك مبرر بيولوجي معقول؟
يجب أن تكون الآلية واضحة ومستقلة عن البيانات
هل التأثير ثابت عبر النتائج ذات الصلة؟
إذا ظهر ضرر للوفيات، فهل هناك ضرر مماثل للاحتشاء الدماغي أو السكتة الدماغية؟
هل هناك تكرار مستقل؟
هل تم تأكيد تأثير المجموعة الفرعية في دراسات أخرى؟
تم تطبيق ICEMAN على ACCORD
| المعيار | التقييم | النتيجة |
|---|---|---|
| محددة مسبقًا؟ | نعم - كانت أمراض القلب والأوعية الدموية السابقة في البروتوكول | ✓ |
| المنطق البيولوجي؟ | نعم، نقص السكر في الدم أكثر خطورة مع الأمراض القلبية الوعائية | ✓ |
| نتائج متسقة؟ | نعم - تمت محاذاة معدل الوفيات الناجمة عن السيرة الذاتية والوفيات الناجمة عن جميع الأسباب | ✓ |
| النسخ المتماثل المستقل؟ | جزئيًا - ADVANCE، أظهر VADT أنماطًا مماثلة | ~ |
تصنيف ICEMAN: مصداقية عالية
يبدو أن الضرر التفاضلي لدى المرضى المعرضين لمخاطر عالية حقيقي.
الآثار السريرية
بالنسبة للمرضى الذين لا يعانون من أمراض القلب والأوعية الدموية: يظل التحكم المعتدل في الجلوكوز (نسبة HbA1c ~ 7%) هو الهدف. السيطرة المكثفة قد تقلل من مضاعفات الأوعية الدموية الدقيقة.
بالنسبة للمرضى الذين يعانون من أمراض القلب والأوعية الدموية المثبتة: تجنب الأهداف المكثفة. نقص السكر في الدم يشكل خطرا على القلوب المتضررة.
بالنسبة للمرضى المسنين: أهداف مريحة. نوعية الحياة مهمة. السيطرة الصارمة تسبب السقوط والارتباك والوفيات الزائدة.
العلاج "مقاس واحد يناسب الجميع" ليس دواءً يركز على المريض.
الانحدار التلوي: شرح عدم التجانس
عندما يكون عدم التجانس مرتفعًا، يمكن للانحدار التلوي تحديد المتغيرات المشتركة على مستوى الدراسة التي تفسر التباين.
هل يختلف حجم التأثير بشكل منهجي مع الدراسة الخصائص؟
الحذر
يتطلب الانحدار التلوي ≥10 دراسات لكل متغير مشترك. مع القليل من الدراسات، فهي استكشافية فقط. مغالطة بيئية: الارتباطات على مستوى الدراسة قد لا تنطبق على الأفراد.
مثال: في ACCORD، قد يختبر الانحدار التلوي ما إذا كان تأثير العلاج يختلف حسب خط الأساس لـ HbA1c، مما يظهر الضرر يتركز في المرضى الذين يعانون من مستويات عالية جدًا.
ما هو الرقم الذي ينقذ الأرواح؟ من يقرر؟
البيانات الحقيقية
لعقود من الزمن، كان الهدف: علاج ضغط الدم <140 ملم زئبق الانقباضي. ثم جاء SPRINT (2015): 9,361 مريضًا شديد الخطورة عشوائية إلى أهداف مكثفة (<120) مقابل أهداف قياسية (<140). تم تخفيض العلاج المكثف أحداث السيرة الذاتية بنسبة 25% and الوفاة بنسبة 27%. توقفت المحاكمة مبكرا من أجل الفائدة. تغيرت المبادئ التوجيهية في جميع أنحاء العالم.
اختبار الوحدة 8
1. لماذا تم إيقاف تجربة ACCORD مبكرًا؟
2. ما الذي يخبرنا به الفاصل الزمني للتنبؤ والذي لا يخبرنا به فاصل الثقة؟
3. وفقًا لـ ICEMAN، ما هو العامل الأكثر أهمية لمصداقية المجموعة الفرعية؟
عندما تختلف الدراسات،
استمع إلى الخلاف.
التباين رسالة وليس ضجيج.
غياب الدليل ليس دليلاً على الغياب.
الوحدة 9: الدراسات المخفية
غياب الدليل ليس دليلاً على الغياب.
ريبوكسيتين: 2010
الـ 74% التي لم تر النور أبدًا.
الوحدة 9: الدراسات المخفية
🎯 أهداف التعلم
- تفسير المخططات القمعية لاكتشاف عدم التماثل
- تطبيق اختبار إيجر و اختبارات إحصائية أخرى لتحيز النشر
- تنفيذ طريقة القطع والتعبئة لتعديل التحيز
- تقييم نقدي لقيود اختبارات تحيز النشر
- تطبيق المبدأ: "غياب الدليل ليس دليلاً على الغياب"
السنة: 1997
"أمل جديد لمرضى الاكتئاب الذين لا يستطيعون تحمل مثبطات استرداد السيروتونين الانتقائية..."
كان Reboxetine (Edronax) مضادًا جديدًا للاكتئاب - وهو مثبط انتقائي لإعادة امتصاص النوربينفرين (NRI). وعلى عكس مثبطات استرداد السيروتونين الانتقائية، فقد استهدف نظامًا مختلفًا من الناقلات العصبية. بالنسبة للمرضى الذين فشلوا أو لم يتمكنوا من تحمل فلوكستين أو سيرترالين، فقد قدم آلية جديدة.
الأدلة المنشورة
ما يمكن للأطباء العثور عليه في المجلات الطبية:
| مقارنة | التجارب المنشورة | النتيجة المنشورة |
|---|---|---|
| ريبوكسيتين مقابل الدواء الوهمي | 3 تجارب (العدد = 507) | أفضل بكثير (SMD = 0.56) |
| ريبوكسيتين مقابل SSRIs | 4 تجارب (العدد = 628) | ما يعادل أو أفضل |
تحكي الأدبيات المنشورة قصة واضحة:
يعمل Reboxetine. يستفيد المرضى. يصف بثقة.
ولكن ماذا عن التجارب التي لم تتمكن من رؤيتها؟
في عام 2010، قدم الباحثون الألمان في IQWiG طلبًا إلى وكالة الأدوية الأوروبية...
وطالبوا بالوصول إلى all التجربة البيانات - منشورة وغير منشورة.
ما وجدوه غيَّر كل شيء.
الصورة الكاملة
Eyding et al., BMJ 2010
| مقارنة | تم النشر فقط | جميع البيانات |
|---|---|---|
| ريبوكسيتين مقابل الدواء الوهمي | SMD 0.56 (فائدة) | SMD 0.10 (بدون فائدة) |
| المرضى قيد التحليل | 507 (14%) | 2,731 (100%) |
| ريبوكسيتين مقابل SSRIs | ما يعادل | أدنى (RR 1.23 للضرر) |
| المرضى قيد التحليل | 628 (26%) | 2,411 (100%) |
تمرين التحقيق: درج الملفات
أنت مراجع منهجي في عام 2008. تبحث في PubMed وEmbase ومكتبة كوكرين عن جميع تجارب الريبوكسيتين. وجدت 7 تجارب منشورة تظهر الفائدة.
هل يمكنك الوثوق بهذا الدليل؟
⚠️ مسار التحويل غير متماثل بشكل كبير!
جميع الدراسات المنشورة تتجمع في جانب واحد. أين التجارب الفارغة والسلبية؟
مجموعة أدوات تحيز النشر
مخطط القمع
حجم تأثير المؤامرة مقابل الخطأ القياسي. يشير القمع المتماثل إلى عدم وجود أي تحيز؛ عدم التماثل يثير الإنذارات.
اختبار انحدار إيجر
تأثير الانحدار/SE على 1/SE. يشير التقاطع غير الصفري (P <0.10) إلى تأثيرات دراسة صغيرة. ملاحظة: تضخم معدل الإيجابية الكاذبة مع النتائج الثنائية؛ استخدم اختبار بيترز بدلاً من ذلك.
اختبار بيترز
بالنسبة للنتائج الثنائية، سجل التراجعات أو على عكس إجمالي حجم العينة. أقل عرضة للإيجابيات الكاذبة.
تقليم وملء
تحسب الدراسات "المفقودة" لجعل مسار التحويل متماثلًا، ثم تعيد حساب التأثير المجمع.
تفاعلية: القطع والتعبئة التحليل
دعونا نطبق القطع والتعبئة على بيانات reboxetine ونرى ما سيكون عليه التقدير المعدل...
تم النشر فقط
7 تجارب
SMD = 0.56
فائدة كبيرة
تقليم وملء
7 + 5 محسوبة = 12 تجربة
SMD = 0.23
منخفضة، لا تزال ذات أهمية اسمية
ولكن حتى التشذيب والملء قلل من أهمية المشكلة!
التأثير الحقيقي مع جميع البيانات هو SMD = 0.10 (فارغ في الأساس).
يعد الاقتطاع والتعبئة أمرًا متحفظًا — فهو لا يصحح بشكل كامل للنشر الانتقائي.
أفضل دفاع: سجلات المحاكمة
طرق اكتشاف تحيز النشر غير كاملة. الحل الحقيقي هو التسجيل المحتمل.
عند البحث عن التجارب، تحقق دائمًا من السجلات. قارن عدد مسجل المحاولات بالرقم منشور. هذه الفجوة هي إشارة التحذير الخاصة بك.
منذ عام 2005، يتطلب ICMJE التسجيل التجريبي كشرط للنشر.
حملة AllTrials
"تم تسجيل جميع التجارب. تم الإبلاغ عن جميع النتائج."
فضيحة الريبوكسيتين، إلى جانب حالات مماثلة في أدوية أخرى، حفزت حركة عالمية:
2013: سياسة البيانات السريرية لوكالة الأدوية الأوروبية
تلتزم وكالة الأدوية الأوروبية بنشر تقارير الدراسات السريرية
2016: إنفاذ قانون تعديلات إدارة الغذاء والدواء
الإبلاغ عن النتائج الإلزامية على موقع ClinicalTrials.gov في غضون 12 شهرًا
تحالف AllTrials
أكثر من 90.000 مؤيد وأكثر من 700 منظمة تطالب بالشفافية
الريبوكسيتين
ألمانيا أوصى IQWiG ضد الريبوكستين لعلاج الاكتئاب
خفضت NICE في المملكة المتحدة تصنيفه إلى "غير مستحسن"
رفضت إدارة الغذاء والدواء عقار الريبوكستين في عام 2001 (كان لديهم إمكانية الوصول إلى بيانات غير منشورة)
لأكثر من عقد من الزمان، تلقى المرضى دواءً ليس أفضل من الدواء الوهمي.
لأنه تم نشر التجارب الإيجابية فقط.
ماذا لو كان الاستنتاج المنشور هو عكس البيانات الفعلية؟
البيانات الحقيقية
دراسة جلاكسو سميث كلاين 329 اختبار الباروكستين في اكتئاب المراهقين. خلصت الورقة المنشورة (2001) إلى أن الباروكستين كان "جيد التحمل وفعال بشكل عام". فشل البيانات الفعلية: الباروكستين في جميع النتائج الثمانية المحددة مسبقًا. عند إعادة التحليل (RIAT 2015)، أحداث الانتحار/إيذاء النفس: 23 في مجموعة الباروكستين مقابل 5 في العلاج الوهمي. أعادت الورقة المنشورة تحديد النتائج اللاحقة لتصنيع الأهمية. في عام 2015، تم إعادة تحليل RIAT (استعادة التجارب غير المرئية والمهجورة) باستخدام تقرير الدراسة السريرية الأصلي وخلص إلى أن الباروكستين كان ليست آمنة ولا فعالة للمراهقين.
اختبار الوحدة 9
1. ما هي النسبة المئوية لبيانات تجربة الريبوكسيتين التي تم إخفاؤها من الأدبيات المنشورة؟
2. لماذا يمكن أن يقلل القص والملء من التصحيح المطلوب؟
3. ما هو أفضل دفاع محتمل ضد تحيز النشر؟
ما لا يمكنك فعله راجع
أكثر أهمية مما تستطيع.
غياب الدليل ليس دليلاً على الغياب.
يجب اكتساب اليقين وليس افتراضه.
الوحدة 10: اليقين
يجب اكتساب اليقين وليس افتراضه.
الفاعل بالسطح المبكر: 2012
عندما تتطور الأدلة عالية الجودة.
الوحدة 10: اليقين
🎯 أهداف التعلم
- تطبيق إطار GRADE الكامل لتقييم اليقين الدليل
- تقييم جميع عوامل التخفيض الخمسة (RoB، عدم الاتساق، عدم المباشرة، عدم الدقة، تحيز النشر)
- تحديد متى يجب الترقية للتأثير الكبير، أو الاستجابة للجرعة، أو الإرباك
- إنشاء ملخص جداول النتائج مع تقديرات التأثير المطلق
- تطبيق المبدأ: "يجب اكتساب اليقين، وليس افتراضه"
العام: التسعينيات
"ثورة في رعاية الأطفال حديثي الولادة..."
كانت متلازمة الضائقة التنفسية (RDS) هي السبب الرئيسي للوفاة بين الأطفال الخدج. كان تطوير المادة الخارجية مادة خافضة للتوتر السطحي— وهي المادة التي تحافظ على الحويصلات الهوائية من الانهيار — واحدًا من التقدم الكبير في طب الأطفال حديثي الولادة.
أصبح السؤال: متى يجب أن نعطي الفاعل بالسطح؟
وقائيًا (لجميع الرضع المعرضين لمخاطر عالية) أم بشكل انتقائي (فقط بعد تطور متلازمة الضائقة التنفسية)؟
مراجعة كوكرين الأصلية (2003)
أجريت تجارب معشاة ذات شواهد متعددة قبل عصر CPAP الروتيني
| حصيلة | وقائي مقابل انتقائي | يقين |
|---|---|---|
| وفيات الأطفال حديثي الولادة | RR 0.73 (يفضل وقائي) | High |
| اضطراب الشخصية الحدية أو الوفاة | RR 0.84 (يفضل وقائي) | High |
لكن عالم رعاية الأطفال حديثي الولادة كان يتغير...
ظهرت تقنية جديدة: ضغط مجرى الهواء الإيجابي المستمر (CPAP)
دعم غير جراحي يمكن أن يساعد الرئتين المبتسرين دون التنبيب.
هل ستظل الأدلة القديمة سارية؟
تحديث كوكرين لعام 2012
تجارب جديدة أجريت في عصر CPAP
| حصيلة | تجارب قديمة | تجارب جديدة |
|---|---|---|
| اضطراب الشخصية الحدية أو الوفاة | RR 0.84 (يفضل وقائي) | RR 1.12 (تفضيلات انتقائية) |
| الحاجة إلى إصلاحات ميكانيكية التهوية | السفلى مع وقائي | أعلى مع وقائي! |
التحقيق: لماذا تطورت الأدلة؟
أنت طبيب حديثي الولادة. يسأل أحد الزملاء: "كيف يمكن للتجارب العشوائية أن تتناقض مع بعضها البعض؟"
هل كان الدليل الأصلي خاطئًا؟
تغيرت غير المباشرة
التجارب القديمة: لا يتوفر جهاز CPAP. تجارب جديدة: معيار رعاية CPAP.
تحسين المقارنة
الفاعل بالسطح الانتقائي + CPAP أفضل من التنبيب الوقائي.
مسائل السياق
قد لا تنطبق الأدلة من عصر واحد على آخر.
ولهذا السبب يقوم GRADE بتقييم عدم المباشرة!
قد تصبح الأدلة عالية الجودة غير قابلة للتطبيق عندما يتغير السياق.
إطار عمل GRADE
تصنيف التوصيات والتقييم والتطوير والتقييمات
GRADE يجيب على السؤال: ما مدى ثقتنا في هذا التقدير؟
⊕⊕⊕⊕ مرتفع: واثق جدا. التأثير الحقيقي قريب من التقدير.
⊕⊕⊕◯ متوسط: واثق إلى حد ما. من المحتمل أن يكون التأثير الحقيقي قريبًا، ولكنه قد يختلف بشكل كبير.
⊕⊕◯◯ منخفض: ثقة محدودة. قد يختلف التأثير الحقيقي بشكل كبير.
⊕◯◯◯ منخفض جدًا: ثقة قليلة جدًا. من المحتمل أن يكون التأثير الحقيقي مختلفًا إلى حد كبير.
الدرجة: العوامل التي تقلل من درجة اليقين
تبدأ أدلة RCT عند المستوى العالي. يمكن تخفيض تصنيفها إلى ما يلي:
خطر التحيز
التوزيع العشوائي المعيب، ونقص التعمية، والمتابعة غير الكاملة، والتقارير الانتقائية
التناقض
عدم التجانس غير المبرر عبر الدراسات (I² كبير، CIs غير متداخلة)
عدم المباشرة
الاختلافات في عدد السكان أو التدخل أو المقارنة أو النتائج من السؤال
عدم الدقة
فترات ثقة واسعة، حجم عينة صغير، أحداث قليلة
الدرجة: العامل الخامس
انحياز النشر
مؤامرة قمع غير متماثلة، تجارب مسجلة مفقودة، تأثير الراعي
يمكن تخفيض كل عامل بمقدار مستوى واحد أو مستويين
مرتفع → معتدل → منخفض → منخفض جدًا
مثال: تحليل تلوي للتجارب المعشاة ذات الشواهد (يبدأ مرتفعًا) مع ارتفاع خطر التحيز (↓1) وعدم المباشرة الخطيرة (↓1) سيتم تصنيفها LOW.
تفاعلي: قم بتطبيق GRADE على الفاعل بالسطح
دعونا نقيم مدى يقين الأدلة الخاصة بالفاعل بالسطح الوقائي باستخدام التجارب القديمة مقابل التجارب الجديدة.
التجارب القديمة (ما قبل CPAP)
البداية: عالية (المضبوطة)
خطر التحيز: منخفض (−0)
التناقض: لا شيء (−0)
عدم المباشرة: جدي (−1)
معايير رعاية مختلفة اليوم
نهائي: ⊕⊕⊕◯ معتدل
تجارب جديدة (عصر CPAP)
البداية: عالية (المضبوطة)
خطر التحيز: منخفض (−0)
التناقض: لا شيء (−0)
عدم المباشرة: لا شيء (−0)
تتطابق مع الممارسة الحالية
نهائي: ⊕⊕⊕⊕ مرتفع
الدرجة: العوامل التي تعمل على تحسين اليقين
تبدأ الأدلة الرصدية عند LOW. يمكن ترقيتها لـ:
حجم كبير من التأثير
RR >2 أو <0.5 بدون أي إرباك معقول
تدرج الاستجابة للجرعة
تعرض أعلى = تأثير أكبر في نمط ثابت
الإرباك المتبقي
جميع الإرباكات المعقولة من شأنها أن تقلل من التأثير (تقوي الاستدلال السببي)
توصيل اليقين
يتطلب GRADE لغة شفافة حول الثقة:
عالي: "الفاعل بالسطح الوقائي يقلل من وفيات ..."
معتدل: "الفاعل بالسطح الوقائي ربما يقلل ..."
LOW: "الفاعل بالسطح الوقائي قد يقلل ..."
منخفض جدًا: "نحن غير متأكد ما إذا كان الفاعل بالسطح الوقائي يقلل معدل الوفيات..."
تضمن هذه اللغة فهم الأطباء لقوة الأدلة.
هل يمكن أن يصبح الكثير من المنقذ قاتلاً؟
البيانات الحقيقية
1940s-50s: أنقذت تركيزات الأكسجين العالية الأطفال المبتسرين من فشل الجهاز التنفسي. ثم جاء وباء العمى— التنسج الليفي القهقري (يسمى الآن ROP). الأطباء خفضوا الأكسجين بشكل كبير. انخفض العمى. ولكن بعد ذلك: زيادة الوفيات وتلف الدماغ من نقص الأكسجة. مستوى الأكسجين الأمثل المطلوب عقود من التجارب للعثور على. أخيرًا حددت تجارب SUPPORT/BOOST II النافذة العلاجية: SpO2 91-95%.
اختبار الوحدة 10
1. لماذا تم عكس توصية الفاعل بالسطح بين عامي 2003 و2012؟
2. أي مما يلي لا يعد عامل تخفيض درجة؟
3. ما اللغة التي يجب استخدامها لأدلة اليقين المنخفضة؟
الرقم ليس كافيًا.
يجب عليك التعبير عن مدى تأكدك.
يجب اكتساب اليقين وليس افتراضه.
الأساليب تحمي المرضى من ثقتنا.
الوحدة 11: المراجعة الحية
الأساليب تحمي المرضى من ثقتنا.
كوفيد-19 هيدروكسي كلوروكين: 2020
عند تلبية الضرورة الملحة للأدلة.
الوحدة 11: المراجعة الحية
🎯 أهداف التعلم
- تطبيق التحليل التسلسلي التجريبي لتحديد متى تكون الأدلة كافية
- تصميم مراجعة منهجية حية والحفاظ عليها
- إنشاء مشغلات التحديث وحدود العبث/الضرر
- إدارة التعددية وإنفاق ألفا في التحليلات المتسلسلة
- اشرح كيف تطور التوليف السريع للأدلة خلال كوفيد-19
مارس 2020: عالم في أزمة
"ينتشر الفيروس بشكل أسرع من انتشارنا فهم..."
كان فيروس كورونا (COVID-19) يقتل الآلاف. امتلأت وحدات العناية المركزة. ولم يكن هناك لقاح ولا علاج. ثم بصيص من الأمل: أظهر هيدروكسي كلوروكين (HCQ)- وهو دواء قديم للملاريا - نشاطًا مضادًا للفيروسات في الدراسات المعملية.
التعجل للتبني
في غضون أسابيع من دراسة غوتريت:
28 مارس: تصدر إدارة الغذاء والدواء الأمريكية ترخيص الاستخدام في حالات الطوارئ لـ HCQ
4 أبريل: الهند تحظر تصدير HCQ (مخاوف من الاكتناز)
عالمي: يؤثر النقص على مرضى الذئبة والتهاب المفاصل الروماتويدي
تلقى الملايين HCQ بناءً على دراسة مراقبة أجريت على 36 مريضًا
ما الخطأ الذي يمكن أن يحدث؟
التحقيق: غوتريت الدراسة
أنت أحد خبراء EBM المطلوب منك تقييم دراسة HCQ الفرنسية. فحص التصميم...
| المشكلة | تأثير |
|---|---|
| غير عشوائية | تحيز الاختيار – من حصل على HCQ؟ |
| تم استبعاد 6 مرضى | ذهب 3 إلى وحدة العناية المركزة، وتوفي واحد، وانسحب واحد، وأصيب واحد بالغثيان |
| نتيجة بديلة | الحمل الفيروسي، وليس النتائج السريرية |
| التحكم من مستشفيات مختلفة | رعاية مختلفة واختبارات مختلفة |
| لا يسبب العمى | التحيز في التوقعات في الاختبارات المعملية |
ستسجل هذه الدراسة خطرًا كبيرًا للتحيز على RoB 2.0
درجة اليقين: منخفض جدًا. ومع ذلك فقد غيرت السياسة العالمية.
لماذا تم تضليل دراسات رصد كوفيد؟
التحيز الزمني الخالد
يجب على المرضى البقاء على قيد الحياة لفترة كافية لتلقي العلاج. تتم مقارنة الناجين بغير الناجين.
الخلط عن طريق الإشارة
قد يحصل المرضى الأكثر مرضًا على علاجات مختلفة. تلقى المرضى الأكثر صحة HCQ في وقت مبكر.
تأثير المستخدم الصحي
يميل المرضى الذين يطلبون العلاج إلى أن يكونوا أكثر صحة بشكل عام.
الإبلاغ عن النتائج
تم نشر الدراسات ذات النتائج الإيجابية بشكل أسرع.
يونيو 2020: تقرير التجارب المعشاة ذات الشواهد
تم الانتهاء من التجارب الكبيرة والصارمة بسرعة ملحوظة
| محاكمة | N | النتيجة |
|---|---|---|
| التعافي (المملكة المتحدة) | 4,716 | لا فائدة من الوفيات (RR 1.09) |
| تضامن منظمة الصحة العالمية | 954 | لا فائدة (RR 1.19) |
| الأوركيد (الولايات المتحدة) | 479 | توقف لمدة عدم الجدوى |
الجدول الزمني: الأدلة الرصدية مقابل الأدلة المعشاة ذات الشواهد
مارس-مايو 2020
رصدي: ~20 دراسة
اقترح فائدة
مجمعة أو ~0.65
يونيو-يوليو 2020
التجارب المعشاة ذات الشواهد: التعافي والتضامن
لا تظهر أي فائدة/ضرر
RR المجمعة ~ 1.10
من "واعد" إلى "غير فعال" في 3 أشهر
لهذا السبب نحتاج إلى التوزيع العشوائي - والمراجعات الحية لتتبع الأدلة المتطورة.
مراجعات منهجية حية
نهج جديد لـ الأدلة سريعة التطور:
المراقبة المستمرة
ابحث في الأدبيات أسبوعيًا أو حتى يوميًا للحصول على أدلة جديدة
التحليل التلوي التراكمي
تحديث التقديرات المجمعة مع كل تقارير تجربة جديدة
التحليل التسلسلي التجريبي (TSA)
تحديد متى تتراكم معلومات كافية لاستنتاج
الإصدار الشفاف
تتبع كل تغيير، والحفاظ على مسار التدقيق الكامل
التحليل التسلسلي التجريبي (TSA)
متى تعلمنا ما يكفي؟
تطبق إدارة أمن المواصلات حدود التوقف على التحليل التلوي - على غرار التحليل المؤقت في تجربة واحدة. إنه يمثل حجم المعلومات المطلوبة (RIS) اللازمة لاكتشاف أو استبعاد تأثير ذي معنى سريريًا.
بالنسبة لـ HCQ في فيروس كورونا، أظهرت إدارة أمن النقل أنه تم تجاوز حدود عدم الجدوى بحلول يونيو 2020.
الدروس المستفادة من ملحمة HCQ
1. يمكن أن تكون الدراسات الرصدية مضللة بشكل مذهل عندما يكون التحيز سائدًا. حتى أن العديد من الدراسات التي تشير إلى نفس الاتجاه يمكن أن تكون خاطئة.
2. يمكن إجراء التجارب المعشاة ذات الشواهد بسرعة عند وجود الإرادة. تم تسجيل أكثر من 5000 مريض في برنامج RECOVERY خلال أسابيع.
3. المراجعات الحية ضرورية للمواضيع المتطورة. تصبح المراجعات ذات النقاط الزمنية الثابتة قديمة الطراز على الفور.
4. الضغط السياسي لا يغير علم الأحياء. الأساليب الصارمة تحمي المرضى حتى عندما يكونون تحت الضغط.
ماذا لو كانت الوقاية هي السبب؟
البيانات الحقيقية
لعقود من الزمن، أوصت إرشادات طب الأطفال بما يلي: تجنب تناول الفول السوداني في مرحلة الطفولة لمنع الحساسية. وفي الوقت نفسه، معدلات حساسية الفول السوداني تضاعف ثلاث مرات من عام 1997 إلى عام 2008. ثم جاء قفزة (2015): 640 رضيعًا معرضين لخطر شديد تم اختيارهم بصورة عشوائية لإدخال الفول السوداني مبكرًا مقابل تجنبه. النتيجة: الإدخال المبكر أدى إلى تقليل حساسية الفول السوداني بنسبة 81% (1.9% مقابل 13.7%). كانت استراتيجية الوقاية هي التي تسببت في انتشار الوباء.
اختبار الوحدة 11
1. ما هو الخلل الرئيسي في دراسة غوتريت هيدروكسي كلوروكين؟
2. ما الذي يساعد التحليل التسلسلي للمحاكمة في تحديده؟
3. لماذا أظهرت دراسات COVID الرصدية فائدة HCQ بينما لم تظهر التجارب المعشاة ذات الشواهد؟
لا يمكن للسرعة أن تحل محل الدقة.
لكن الصرامة يمكن أن تكون سريعة.
توازن المراجعات الحية بين كليهما.
ليست كل إشارة حقيقة.
الوحدة 12: الأساليب المتقدمة
ليست كل إشارة حقيقة.
الأساليب المتقدمة
ما وراء التحليل التلوي الزوجي.
الوحدة 12: الأساليب المتقدمة
🎯 أهداف التعلم
- تفسير هندسة التحليل التلوي للشبكة وتصنيفات SUCRA
- تطبيق النماذج ثنائية المتغير للتحليل التلوي لدقة الاختبار التشخيصي
- قم بإجراء تحليل تلوي للاستجابة للجرعة باستخدام شرائح مرنة
- فهم متى تكون هناك حاجة إلى تحليل تلوي لبيانات المريض الفردية (IPD)
- التعرف على الافتراضات والقيود كل طريقة متقدمة
عندما لا يكون الاقتران كافيًا
"في بعض الأحيان يكون السؤال أكثر تعقيدًا من السؤال A مقابل B..."
تشكل الأساليب التي تعلمتها الأساس. لكن الواقع السريري يتطلب في كثير من الأحيان المزيد: أي من مضادات الاكتئاب العشرة هو الأفضل؟ ما هي الجرعة المثالية من الستاتين؟ هل يشخص هذا الاختبار السرطان المبكر بدقة؟
تقدم هذه الوحدة أربع طرق متقدمة - كل منها يجيب على أسئلة معقدة مختلفة.
التحليل التلوي للشبكة (NMA)
عندما يكون لديك العديد من العلاجات ولكن القليل من التجارب المباشرة
يجمع NMA الأدلة المباشرة (أ ضد ب) مع الأدلة غير المباشرة (A vs C، B vs C → المستنتج A vs B) لمقارنة علاجات متعددة في وقت واحد.
مثال NMA: مضادات الاكتئاب
قام Cipriani 2018 NMA البارز بمقارنة 21 مضادًا للاكتئاب باستخدام 522 تجربة.
التحدي
21 عقارًا، ولكن لم يتم اختبار كل زوج وجهاً لوجه
الكثير مقابل الدواء الوهمي، القليل مقابل بعضها البعض
الحل
يجمع NMA بين الأدلة المباشرة وغير المباشرة عبر الشبكة
يصنف كل 21 طريقة من حيث الفعالية والمقبولية
النتيجة: حصلت بعض الأدوية على تصنيف أعلى من حيث الفعالية، والبعض الآخر من حيث المقبولية
لا يوجد دواء واحد هو "الأفضل" عالميًا؛ تفسير التصنيفات بفواصل زمنية موثوقة، وعبورية، ومقايضات سريرية.
NMA: الافتراضات الحرجة
العبور
ينبغي توزيع معدِّلات التأثير بالمثل عبر المقارنات؛ وإلا فإن المقارنات غير المباشرة قد تكون متحيزة
تناسق
تتفق الأدلة المباشرة وغير المباشرة (قابلة للاختبار)
الشبكة المتصلة
جميع المعالجات مرتبطة من خلال مقارنة مشتركة واحدة على الأقل
عندما تفشل الافتراضات، يمكن أن يكون NMA مضللاً
قم دائمًا بتقييم العبورية واختبار عدم الاتساق.
التحليل التلوي للاستجابة للجرعة
العثور على الجرعة المثالية
يستخدم طريقة جرينلاند-لونجنيكر مع خطوط مكعبة مقيدة لنموذج العلاقات غير الخطية بين الجرعة والتأثير.
الأنماط غير الخطية
على شكل J (الكحول والوفيات)، على شكل U (فيتامين د)، العتبة (الأسبرين)
الأهمية السريرية
ابحث عن الجرعة التي تحقق أفضل توازن بين الفوائد والأضرار، وليس فقط "الأكثر هو الأفضل"
بيانات المريض الفردية (IPD)
المعيار الذهبي لتحليل المجموعات الفرعية
بدلاً من البيانات الموجزة المنشورة، احصل على البيانات الأولية على مستوى المريض من المحاكمين. يتيح إجراء تحليلات دقيقة للمجموعات الفرعية، ونمذجة الوقت حتى الحدث، والتعريفات الموحدة.
كانت المجموعة التعاونية لتجارب سرطان الثدي المبكرة رائدة في برنامج IPD MA في الثمانينات.
دقة الاختبار التشخيصي (DTA)
عندما يكون "التدخل" بمثابة اختبار
تجميع التحليل التلوي DTA حساسية (المعدل الإيجابي الحقيقي) و خصوصية (المعدل السلبي الحقيقي) - نتيجتان مترابطتان تتطلبان نماذج ثنائية المتغير.
نموذج ثنائي المتغير/HSROC
حسابات الارتباط بين الحساسية والخصوصية
منحنى SROC
ملخص منحنى ROC مع مناطق الثقة والتنبؤ بنسبة 95٪
كواداس-2
تقييم جودة دراسات الدقة التشخيصية
اختيار الطريقة الصحيحة
| سؤال | طريقة |
|---|---|
| هل يتغلب "أ" على "ب"؟ | MA الزوجي |
| أي من العلاجات العديدة هو الأفضل؟ | ماجستير الشبكة (NMA) |
| ما هي الجرعة المثالية؟ | الجرعة والاستجابة ماجستير |
| من يستفيد أكثر؟ (مجموعات فرعية) | إي بي دي ما |
| ما مدى دقة هذا الاختبار؟ | دي تي ايه ما |
| كيف يتطور التأثير مع مرور الوقت؟ | البقاء على قيد الحياة/الوقت إلى الحدث MA |
يجب أن تتطابق الطريقة مع السؤال. لا تجبر أبدًا على طرح سؤال بطريقة خاطئة.
ثلاث محاكمات كبيرة. ثلاث إجابات مختلفة. ماذا تعتقد؟
البيانات الحقيقية
كورتيكوس (2008): 499 مريضا. الهيدروكورتيزون في الصدمة الإنتانية. لا فائدة من الوفيات. الغدة الكظرية (2018): 3658 مريضا. الهيدروكورتيزون. لا فائدة من الوفيات. أبروشس (2018): 1241 مريضا. هيدروكورتيزون + فلودروكورتيزون. انخفض معدل الوفيات (43% مقابل 49.1%، ع=0.03). نفس فئة التدخل بروتوكولات مختلفة. نتائج مختلفة.
اختبار الوحدة 12
1. ما هي الميزة الرئيسية للتحليل التلوي للشبكة مقارنة بالتحليل الزوجي؟
2. لماذا يتطلب التحليل التلوي DTA نماذج ثنائية المتغير؟
3. ما الذي يتطلبه افتراض "الاتساق" في NMA؟
النظام البيئي للدورة
تغطي هذه الدورة سير عمل المراجعة المنهجية الكاملة. للتعمق أكثر، استكشف الدورات المصاحبة:
منحنيات ثنائية المتغير/HSROC، SROC، QUADAS-2
RoB 2، ROBINS-I/E، تقييم على مستوى المجال
جداول SoF كاملة، GRADE-CERQual
نماذج ذات مرحلة واحدة/مرحلتين، ذات تأثيرات مختلطة
Copas، PET-PEESE، منحنى p، نماذج مختارة
AMSTAR 2، ROBIS، تصحيح التداخل
CHARMS، PROBAST، تجميع الإحصائيات c
TSA، مشغلات التحديث، الطرق المختصرة
الوحدة 12 كاملة
"يجب أن تتطابق الطريقة مع السؤال. الأساليب المتقدمة تجيب على الأسئلة المتقدمة، لكن الأساسيات لا تتغير أبدًا."
لقد أتقنت سير العمل الأساسي. تستكشف الوحدات العشر التالية الحدود: الاستدلال البايزي، والتحليل التلوي للشبكة، وبيانات المرضى الفردية، ونمذجة الاستجابة للجرعة، والمتانة والهشاشة، والإنصاف، والتوليف بمساعدة الذكاء الاصطناعي، والأدلة النوعية، والأساليب متعددة المتغيرات، وقابلية التكرار.
ليست كل إشارة حقيقة.
الوحدة 13: المنعطف البايزي
ليست كل إشارة حقيقة.
الوحدة 13: المنعطف البايزي
الوحدة 13: المنعطف البايزي
🎯 أهداف التعلم
- اشرح الفرق بين الاستدلال المتكرر والاستدلال البايزي
- تفسير التوزيعات السابقة والاحتمالات والتوزيعات اللاحقة
- التمييز فواصل موثوقة من فواصل الثقة
- فهم متى يقدم التحليل التلوي بايزي المزايا
- التعرف على كيفية تأثير الاختيار المسبق على الاستنتاجات
في عام 2005، بدأت تجربة
التي لن تنتهي أبدًا.
استخدمت تجربة STAMPEDE لسرطان البروستاتا تصميم منصة متعدد الأذرع ومتعدد المراحل (MAMS). يمكن إضافة الأسلحة أو إسقاطها مع تراكم الأدلة. وعلى الرغم من أن إحصاءاتها كانت متكررة، إلا أن الفلسفة التكيفية جسدت الروح الافتراضية: تحديث القرارات مع تراكم البيانات.
النظرة العالمية المتكررة
في الإحصائيات المتكررة، يعني الاحتمال التردد على المدى الطويل. 95% CI لا يعني "احتمال 95% أن التأثير الحقيقي موجود في الداخل". يعني: لو كررنا الدراسة إلى ما لا نهاية، لكانت 95% من الفترات تحتوي على الحقيقة.
النظرة الافتراضية للعالم
في الإحصائيات الافتراضية، يمثل الاحتمال درجة الاعتقاد. نبدأ بـ قبل (ما نؤمن به قبل البيانات)، قم بالتحديث باستخدام احتمالية (ما تخبرنا به البيانات)، واحصل على أ الخلفي (الاعتقاد المحدث).
السابقة × الاحتمالية = الخلفية
نظرية بايز: P(θ|data) ∝ P(data|θ) × P(θ)
الفترات الموثوقة
الفاصل الزمني الموثوق به بنسبة 95% قابل للتفسير احتماليًا، ومشروط بالنموذج المحدد والسابق.
اختيار الأسبقية
غير معلوماتية (غامضة)
عادي(0, 10000) أو منتظم. يتيح للبيانات السيطرة. يحاكي النتائج المتكررة.
معلوماتية ضعيفة
عادية (0, 1) لسجل OR. ينظم التقديرات المتطرفة مع الحفاظ على المرونة.
إعلامية
بناءً على الأدلة السابقة. قوية ولكنها مثيرة للجدل. يجب أن تكون محددة مسبقا.
نصف كوشي لـ τ
الموصى بها لعدم التجانس. يسمح نصف كوشي (0، 0.5) بـ τ كبيرة ولكنه يركز بالقرب من الصفر.
أخذ عينات MCMC
لا يمكن حل معظم النماذج الافتراضية تحليليًا. نستخدم سلسلة ماركوف مونت كارلو (MCMC) لسحب عينات من الجزء الخلفي. الأدوات: JAGS، Stan، brms (R)، PyMC (Python).
متوسط النموذج البايزي
بدلاً من الاختيار بين نماذج التأثير الثابت والتأثيرات العشوائية، بايزي متوسط النموذج (BMA) يزن كل نموذج حسب احتماله الخلفي. وهذا يفسر عدم اليقين في النموذج في التقدير النهائي.
عوامل بايز
BF₁₀ > 10 = دليل قوي على H₁. BF₁₀ < 1/10 = دليل قوي على H₀.
التفاعلية: المتخيل الخلفي
اضبط القوة السابقة لترى كيف تؤثر على القوة الخلفية. شاهد كيف يطغى المزيد من البيانات على ما سبق.
قصة STAMPEDE
تم إطلاق STAMPEDE في عام 2005 مع 5 أذرع بحثية تقارن علاجات سرطان البروستاتا المتقدم. بحلول عام 2016، أضافت دواء أبيراتيرون وأظهر انخفاضًا بنسبة 37% في الوفيات (HR 0.63، 95% CI 0.52–0.76).
يجسد تصميم المنصة التفكير التكيفي بايزي: التحليلات المؤقتة توجه اختيار الذراع، ويمكن إدخال أذرع جديدة مع ظهور العلاجات، وإسقاط الأذرع غير المجدية مبكرًا - مما ينقذ المرضى من المرضى غير الفعالين. العلاجات.
سجل STAMPEDE أكثر من 10000 مريض في أكثر من 100 مركز وأحدث تغييرًا جذريًا في رعاية سرطان البروستاتا. تسمح العقلية الافتراضية بتراكم الأدلة واتخاذ القرارات في الوقت الفعلي.
شجرة القرار: متى يجب الانتقال إلى النظرية الافتراضية؟
هل تتذكر الوحدة 1؟
الإرسال من خلال عدسة بايزي
لو استخدم تحليل بايزي لـ CAST معلومات سابقة من العلوم الأساسية (مضادات اضطراب النظم تقمع PVCs)، فإن الجزء الخلفي سيظل يتحول بقوة نحو الأذى. ومع وجود ما يكفي من البيانات، حتى النتائج السابقة القوية تؤدي إلى الاحتمالية. الدرس المستفاد: الأساليب الافتراضية لا تحمي من المقدمات السيئة - ولكنها تضع الافتراضات شفاف.
اختبار الوحدة 13
Q1. ماذا يعني الفاصل الزمني المعقول بنسبة 95% بايزي؟
Q2. ما هو المستوى المسبق الموصى به للتغاير بين الدراسات (τ)?
الوحدة 13 كاملة
"لا يتعلق المنعطف البايزي بالرياضيات. بل يتعلق بالصدق - مما يجعل افتراضاتنا مرئية."
ليست كل إشارة حقيقة.
الوحدة 14: الشبكة
الأساليب تحمي المرضى من ثقتنا.
الوحدة 14: الشبكة
الوحدة 14: الشبكة
🎯 أهداف التعلم
- اشرح سبب عدم كفاية المقارنات الزوجية عند وجود العديد من المعالجات
- فسر هندسة الشبكة (العقد، الحواف، السُمك)
- فهم العبور والاتساق ودور الأدلة غير المباشرة
- فسر تصنيفات SUCRA وجداول الدوري
- التعرف على متى يتم انتهاك افتراضات NMA
يواجه الطبيب مريضًا
في الاكتئاب. أي دواء؟
هناك 21 مضادًا للاكتئاب موصوفة بشكل شائع. تقارن معظم التجارب المباشرة بين 2 أو 3 فقط. Cipriani et al. (2018، Lancet) ربطت 522 تجربة و116,477 مريضًا في شبكة واحدة.
منطق التحليل التلوي للشبكة
دليل مباشر
التجارب التي تقارن بشكل مباشر بين A وB تعطي التقدير الأكثر موثوقية.
الأدلة غير المباشرة
في حالة وجود A مقابل C وB مقابل C، يمكننا استنتاج A مقابل B. هذا هو "المتعد" الافتراض.
الأدلة المختلطة
يجمع NMA بين الاثنين، مرجحًا بالدقة، لتصنيف جميع المعالجات في وقت واحد.
تفاعلي: الرسم البياني للشبكة
كل عقدة هي علاج. يمثل سمك الحافة عدد الدراسات التي تقارن هاتين المعالجتين.
العبورية والاتساق
العبور: يجب أن يقترب التقدير غير المباشر (عبر المقارنة المشتركة) من التقدير المباشر. وهذا يتطلب أن يتم توزيع معدّلات التأثير بشكل مماثل عبر المقارنات.
تناسق: اختبار إحصائي لمقارنة الأدلة المباشرة وغير المباشرة. تساعد الاختبارات العالمية (التفاعل بين التصميم والمعالجة) والاختبارات المحلية (تقسيم العقدة) على تحديد حلقات عدم الاتساق.
SUCRA وP-scores
الحذر: يكون الترتيب مغريًا ولكنه مضلل عندما تكون الاختلافات بين المعالجات صغيرة أو غير مؤكدة. قم دائمًا بالإبلاغ عن فترات المصداقية/الثقة جنبًا إلى جنب مع الرتب.
مكون NMA
عندما تكون التدخلات معقدة (على سبيل المثال، السلوكية + الدوائية)، يقوم مكون NMA بتحليل المعالجات متعددة المكونات لتقدير المساهمة الفردية لكل مكون. يستخدم النماذج المضافة: التأثير (أ + ب) = التأثير (أ) + التأثير (ب) + التفاعل.
شبكة سيبرياني
وجد تحليل لانسيت لعام 2018 أن جميع مضادات الاكتئاب الـ 21 كانت أكثر فعالية من العلاج الوهمي. احتل أميتريبتيلين وميرتازابين وفينلافاكسين المرتبة الأولى من حيث الفعالية. احتل أغوميلاتين، وفلوكستين، وإسيتالوبرام المرتبة الأعلى من حيث المقبولية (أقل عدد من المتسربين).
لا يوجد دواء واحد "فاز" في جميع النتائج. كشفت الشبكة عن مقايضات غير مرئية للتحليل الزوجي.
شجرة القرار: هل NMA مناسب؟
اختبار الوحدة 14
Q1. ما الافتراض الذي يجب أن يحمله الدليل غير المباشر حتى يكون صالحًا في NMA؟
الوحدة 14 كاملة
"ترى الشبكة ما لا تستطيع المقارنات الزوجية رؤيته: المشهد الكامل لاختيار العلاج."
ليست كل إشارة حقيقة.
الوحدة 15: الفرد
ما الذي كان مخفيا على مرأى من الجميع؟
الوحدة 15: الفرد
الوحدة 15: الفرد
🎯 أهداف التعلم
- اشرح لماذا يمكن للبيانات المجمعة أن تحجب التفاعلات بين العلاج والمتغيرات
- التمييز بين المرحلة الواحدة ونماذج IPD ذات المرحلتين
- التعرف على التحيز البيئي في التحليل التلوي الكلي
- فهم التحديات العملية لجمع IPD
- تفسير مخططات التفاعل بين العلاج والمتغير
لعقود من الزمن، كانت تجارب سرطان الثدي
الملخصات المنشورة. ليس المرضى.
قامت المجموعة التعاونية لتجارب سرطان الثدي المبكر (EBCTCG) بجمع سجلات فردية من أكثر من 100.000 امرأة عبر مئات التجارب. أظهرت تحليلات IPD الخاصة بهم أن فوائد عقار تاموكسيفين تعتمد بشكل كبير على حالة مستقبلات هرمون الاستروجين، وهو أمر غير مرئي في البيانات الإجمالية.
ما أخفته الملخصات
أبلغت كل تجربة منشورة عن عقار تاموكسيفين عن نتيجة إجمالية. ومن خلال مئات الدراسات، بدا أن عقار تاموكسيفين يقدم فائدة متواضعة. لكن "الفائدة المتواضعة" كانت عبارة عن متوسط يخفي حقيقة عميقة.
انقسام المجموعة الفرعية المخفية
كان التأثير الإجمالي المجمع – أي الخلط بين المرضى المستجيبين وغير المستجيبين – مجرد خيال إحصائي. متوسط "متواضع" يبالغ في تقدير الفائدة لمجموعة واحدة ويشير إلى فائدة ضمنية حيث لا توجد فائدة للمجموعة الأخرى.
بيانات المرضى المجمعة مقابل بيانات المرضى الفردية
يسمح IPD بما يلي: (1) تعريفات نتائج متسقة، (2) تحليل المجموعات الفرعية حسب خصائص المريض، (3) النمذجة من وقت لآخر، (4) التحقق من التحيز البيئي. إنه المعيار الذهبي لاستكشاف تعديل تأثير العلاج.
مرحلة واحدة مقابل مرحلتين IPD
مرحلتين
قم بتحليل كل دراسة على حدة، ثم اجمع بين التقديرات (مثل MA القياسي). بسيطة ولكنها تفقد المعلومات.
مرحلة واحدة
تناسب نموذج واحد مختلط التأثيرات لجميع بيانات المريض في وقت واحد. أكثر قوة للتفاعلات والأحداث النادرة.
Key: كلاهما يجب أن يأخذ في الاعتبار تجميع الدراسة. لا تقم أبدًا بتجميع IPD كما لو كان من تجربة واحدة ضخمة، فهذا يؤدي إلى الإرباك (مفارقة سيمبسون).
التحيز البيئي
قد يُظهر الانحدار التلوي باستخدام متوسط العمر على مستوى الدراسة أن المرضى الأكبر سنًا يستفيدون أكثر. ولكن قد يكون هذا تحيزًا بيئيًا- الارتباط على مستوى الدراسة لا يعكس الحقيقة على مستوى المريض. يمكن لـ IPD فقط أن ينفصل داخل الدراسة from بين تأثيرات الدراسة .
عندما يكذب الكل بشأن أجزائه
مفارقة سيمبسون: الاتجاه الذي يظهر في البيانات المجمعة ينعكس عندما يتم تجميع البيانات بواسطة متغير مربك.
المفارقة في الممارسة
وجد تحليل تجريبي ضخم أن العلاج X مفيد بشكل عام. لكن داخل كل دراسة، كان ضارًا. كيف؟ خلقت الاختلافات في المخاطر الأساسية بين الدراسات وهمًا، إذ حدث أن السكان الأكثر مرضًا يتلقون المزيد من العلاج، مما يؤدي إلى تضخيم الفائدة الإجمالية.
كيتس (2002، BMJ) أظهر أن التجميع عبر الدراسات دون مراعاة التجميع يمكن أن يعكس الاتجاه الواضح للتأثير.
ولهذا السبب تتضمن نماذج IPD ذات المرحلة الواحدة الدراسة كمتغير تجميعي - لمنع الخلط بين الدراسات من التنكر كتأثير علاجي.
تراث EBCTCG
حددت التحليلات الوصفية لـ IPD الخاصة بـ EBCTCG علاج سرطان الثدي لمدة 40 عامًا. أظهر تحليلهم لعام 2005 للتاموكسيفين مقابل عدم العلاج فائدة واضحة في الأورام إيجابية الإستروجين (RR 0.59) ولكن لا فائدة في الأورام السلبية ER (RR 0.97).
وبدون وجود IPD، لكان التأثير الإجمالي الإجمالي قد تم تجميعه عبر كلا المجموعتين، مما أدى إلى إضعاف الفائدة وربما حرمان المرضى الذين لديهم ER إيجابي من حجم مكاسبهم.
شجرة القرار: متى يستحق علاج IPD المتابعة؟
هل يمكنك الحصول على IPD من أكثر من 80% من التجارب؟
هل التحيز البيئي مصدر قلق؟
قام EBCTCG بجمع البيانات من مئات التجارب على مدار 40 عامًا. تتضمن معظم التحليلات التلوية لـ IPD ما بين 5 إلى 20 تجربة. القرار يعتمد على السؤال وليس الطموح.
يتكرر النمط
تذكر الوحدة 3؟ بدا العلاج التعويضي بالهرمونات مفيدًا في الدراسات الرصدية ولكنه ضار في التجارب المعشاة ذات الشواهد. حدث نفس الإخفاء الكلي: أخفت الفائدة الإجمالية ضرر المجموعة الفرعية.
أظهر تحليل IPD لمبادرة صحة المرأة ذلك لاحقًا التوقيت مهم- النساء اللاتي بدأن العلاج التعويضي بالهرمونات خلال 10 سنوات من انقطاع الطمث كان لهن نتائج مختلفة عن تلك التي بدأنها في وقت لاحق. وكانت "فرضية التوقيت" غير مرئية في الملخصات المجمعة المنشورة.
الدرس يتكرر: يمكن للبيانات المجمعة أن تحجب التفاعلات الحرجة بين العلاج والمتغيرات. سواء كان الأمر يتعلق بحالة الطوارئ في سرطان الثدي أو التوقيت في العلاج التعويضي بالهرمونات، فإن البيانات على المستوى الفردي تكشف ما تخفيه الملخصات.
الوحدة 15 اختبار
Q1. ما هي الميزة الأساسية لـ IPD مقارنة بالتحليل التلوي للبيانات المجمعة؟
الوحدة 15 كاملة
"وراء كل تقدير مجمع هناك أفراد لا يمكن لمجموع قصصهم أن تحكي."
التباين رسالة وليس ضجيج.
الوحدة 16: الجرعة
التباين رسالة وليس ضجيج.
الوحدة 16: الجرعة
الوحدة 16: الجرعة
🎯 أهداف التعلم
- اشرح لماذا تغفل المقارنات الزوجية البسيطة العلاقات بين الجرعة والاستجابة
- التمييز بين نماذج الاستجابة للجرعة الخطية والتربيعية والخددية
- تفسير الخطوط المكعبة المقيدة بالعقد
- تحديد تأثيرات العتبة والمنحنيات على شكل J/U
- فهم مقارنة النماذج مع AIC/BIC
لعقود من الزمن، شرب معتدل
ظهرت لحماية القلب.
أظهر "المنحنى على شكل حرف J" أن الأشخاص الذين لا يشربون الخمر لديهم معدل وفيات أعلى بأمراض القلب والأوعية الدموية مقارنة بالذين يشربون الخمر بشكل معتدل. لكن ستوكويل وآخرون. (2016) أظهر أن المنحنى J كان نتيجة لتصنيف خاطئ للشاربين السابقين (الذين توقفوا عن التدخين بسبب المرض) على أنهم "ممتنعون".
إجماع علمي بني على الرمال
بحلول عام 2010، أكدت أكثر من 100 دراسة رصدية وجود منحنى J. علمته الكتب الطبية. واستشهد به أطباء القلب. قامت جماعات الضغط في صناعة النبيذ بتمويل المؤتمرات حول هذا الموضوع.
بدت الأدلة ساحقة. ولكن ماذا لو كانت مجموعة المقارنة - "الممتنعون" - ملوثة؟
المستسلم المريض
محير مخفي
المشكلة
غالبًا ما يفعل الأشخاص الذين يتوقفون عن الشرب ذلك لأنهم مرضى بالفعل- أمراض الكبد، التفاعلات الدوائية، تشخيص السرطان. تم تصنيف هؤلاء "الشاربين السابقين" على أنهم "ممتنعون" في معظم الدراسات.
التأثير: ظهرت المجموعة المرجعية (الممتنعون). أقل صحة- ليس لأن الامتناع عن ممارسة الجنس كان ضارًا، ولكن لأن المرضى انضموا إليه.
عندما ستوكويل وآخرون. (2016، J مسمار المخدرات الكحول) إزالة الشاربين السابقين وتطبيق تصحيحات جودة الدراسة المناسبة: اختفى منحنى J. وكان التأثير الوقائي وهميا.
التحليل التلوي للجرعة والاستجابة
يسأل التحليل التلوي القياسي: "هل العلاج X فعال؟" يسأل التحليل التلوي للاستجابة للجرعة: "عند أي جرعة هل العلاج X يعمل بشكل أفضل؟" فهو يجسد العلاقة بين مستوى الجرعة والنتيجة عبر دراسات متعددة.
خطوط مكعبة مقيدة
مكان RCS عقدة عند نقاط الجرعة المحددة مسبقًا وتناسب متعددات الحدود الملساء فيما بينها. عادة 3-5 عقدة في كميات توزيع الجرعة. عقدة خطية وراء الحدود. تقارن اختبارات اللاخطية نموذج الشريحة بنموذج خطي أبسط.
مقارنة النماذج
مقارنة AIC/BIC الخطية مع ملاءمة الخط. أقل = أفضل. اختبر أيضًا الابتعاد عن الخطية (القيمة p لمصطلحات الشريحة).
تفاعلية: منشئ الجرعة والاستجابة
قارن بين الخطية والتربيعية والتناسبات الخطية. شاهد كيف يتغير شكل النموذج مع اختلاف الافتراضات.
تم فضح زيف منحنى J للكحول
وجدت إعادة تحليل ستوكويل عام 2016 أنه عندما تم استبعاد شاربي الكحول السابقين بشكل صحيح من المجموعة المرجعية "الممتنعين"، اختفى التأثير الوقائي للشرب المعتدل. كان منحنى J مدفوعًا بالتحيز المرضي.
كشف التحليل التلوي للاستجابة للجرعة عن الحقيقة: يعتمد شكل المنحنى بشكل حاسم على كيفية تعريف "الجرعة الصفرية". أنشأت الفئة المرجعية الخاطئة فائدة وهمية.
عندما تكون سياسة شكل المنحنيات
أثر منحنى J الوهمي على إرشادات الكحول في جميع أنحاء العالم:
إرشادات NHS (حتى 2016)
"الشرب المعتدل قد يحمي القلب" ظهر في التوجيهات الرسمية. بعد تصحيح ستوكويل، قامت المملكة المتحدة بتعديل الحدود إلى 14 وحدة/أسبوع all يشربون (21 سابقًا للرجال). لم يتم الإعلان عن أي مبلغ "آمن".
اللجنة الاستشارية للمبادئ التوجيهية الغذائية
تم الاستشهاد بدراسات منحنى J حتى عام 2015. وأوصت لجنة عام 2020 بخفض الحدود إلى مشروب واحد يوميًا للرجال، مع الاعتراف بتحيز المجموعة المرجعية.
المبادئ التوجيهية الأسترالية
تأخرت حدود الشرب الآمن بسبب أبحاث منحنى J الممولة من الصناعة والتي تروج للاستهلاك المعتدل "الوقائي للقلب"
شجرة القرار: هل تحليل الاستجابة للجرعة مناسب؟
هل العلاقة غير خطية بشكل معقول؟
التحليل التلوي القياسي الزوجي (لا يمكن الاستجابة للجرعة بمستويين فقط)
اختبار الوحدة 16
Q1. ما الذي يجعل الخطوط المكعبة المقيدة مفيدة في التحليل التلوي للجرعة والاستجابة
اكتملت الوحدة 16
"الجرعة هي التي تصنع السم. وشكل المنحنى يكشف ما إذا كان السم حقيقيا."
غياب الدليل ليس دليلاً على الغياب.
الوحدة 17: الهشاشة
غياب الدليل ليس دليلاً على الغياب.
الوحدة 17: الهشاشة
الوحدة 17: الهشاشة
🎯 أهداف التعلم
- حساب وتفسير مؤشر الهشاشة
- استخدم مخططات GOSH لتحديد الدراسات المؤثرة وتأثيرات المجموعة الفرعية
- تفسير المخططات القمعية المحسنة
- تطبيق نماذج اختيار Copas وPET-PEESE لتحيز النشر
- فهم كيف تعزز تحليلات الحساسية استنتاجات التحليل التلوي
خزنت الحكومات المليارات
بناء على أدلة لم يتمكنوا من رؤيتها.
وبعد فيروس H1N1، أنفقت الحكومات المليارات على مخزون الأوسيلتاميفير (تاميفلو). ناضل فريق كوكرين (Jefferson et al. 2014) لسنوات للوصول إلى البيانات غير المنشورة. وعندما فعلوا ذلك أخيرًا، تبخرت الأدلة التي تساعد على منع المضاعفات.
مؤشر الهشاشة
يسأل مؤشر الهشاشة: "كم عدد المرضى الذين سيحتاجون إلى ذلك" هل تحتاج إلى تغيير النتيجة لقلب نتيجة ذات دلالة إحصائية إلى نتيجة غير مهمة؟" يقوم بشكل متكرر بإضافة الأحداث (تحويل غير الأحداث إلى أحداث) في المجموعة ذات الأحداث الأقل حتى p > 0.05.
تفاعلية: حاسبة الهشاشة
أدخل جدول 2×2 لحساب مؤشر الهشاشة. شاهد الأحداث تتغير حتى تنقلب الأهمية.
مخططات GOSH
نظرة رسومية على عدم تجانس الدراسة (GOSH) يناسب نماذج التحليل التلوي لجميع مجموعات الدراسات الفرعية الممكنة. ترسم كل نقطة التأثير المجمع مقابل I² لمجموعة فرعية واحدة. تقترح المجموعات مجموعات فرعية متميزة؛ تشير السحب الخارجية إلى دراسة واحدة تقود إلى عدم التجانس.
بالنسبة لدراسات k، هناك 2k−1 مجموعات فرعية. بالنسبة إلى k > 15، يتم استخدام أخذ العينات العشوائية.
مخططات التحويل المحسنة للخطوط الكنتورية
تُظهر مخططات التحويل القياسية حجم التأثير مقابل الخطأ القياسي. تحسين الكفاف تضيف الإصدارات مناطق مظللة لـ p <0.01، وp <0.05، وp <0.10. إذا وقعت الدراسات المفقودة في مناطق غير هامة، فمن المحتمل أن يكون هناك تحيز في النشر. إذا وقعت في مناطق مهمة، فقد تفسر أسباب أخرى (مثل جودة الدراسة) عدم التماثل.
اختيار Copas وPET-PEESE
نموذج اختيار Copas
نماذج احتمالية نشر الدراسة كدالة لـ SE وحجم التأثير. يقدر بشكل مشترك التأثير الحقيقي وآلية الاختيار.
الحيوانات الأليفة بيز
اختبار تأثير الدقة (PET): تأثيرات التراجع على SE. إذا كان التقاطع = 0، لا يوجد تأثير حقيقي. يستخدم PEESE SE² للحصول على أداء أفضل عند وجود تأثير حقيقي.
ملحمة أوسيلتاميفير
أظهر التحليل التلوي الأصلي الذي مولته شركة روش (Kaiser 2003) أن الأوسيلتاميفير قلل من مضاعفات الأنفلونزا بنسبة 67%. لكن 8 من 10 تجارب لم يتم نشرها قط. بعد أن حصلت كوكرين على تقارير الدراسة السريرية، انخفضت الفائدة من المضاعفات إلى نسبة غير ملحوظة تبلغ 11%.
ولم تكن الهشاشة إحصائية فحسب، بل كانت معلوماتية. كانت قاعدة الأدلة نفسها تفتقد معظم البيانات.
شجرة القرار: تفسير نتائج الهشاشة لديك
هشة للغاية. حفنة من الأحداث المختلفة من شأنها أن تعكس النتيجة. تفسير بحذر شديد.
هش إلى حد ما. حساسة للاضطرابات الصغيرة. هل هناك تجارب غير منشورة قد تغير هذا؟
قوي نسبيًا. ولكن تذكر: الهشاشة ليست سوى بعد واحد. إن تحيز النشر يمكن أن يقوض حتى النتائج القوية.
والش وآخرون. (2014، J Clin Epidemiol) وجدت أنه في 399 تجربة معشاة ذات شواهد منشورة في أفضل المجلات، كان متوسط مؤشر الهشاشة 8 فقط. وكان أكثر من 25% منهم FI ≥ 3. وكانت التجارب التاريخية التي تؤثر على الممارسة السريرية في كثير من الأحيان معلقة بخيط إحصائي.
ما وراء المؤشر: الهشاشة الهيكلية
كشفت ملحمة أوسيلتاميفير ثلاثة أنواع من الهشاشة- ولا يلتقط مؤشر الهشاشة سوى الحالة الأولى.
الهشاشة الإحصائية (FI)
كم عدد الأحداث التي تقلب القيمة p؟ وهذا ما يقيسه مؤشر الهشاشة. فهو يحدد مدى الحساسية لنتائج المرضى الفردية.
الهشاشة المعلوماتية
كم من الأدلة مخفية؟ ثمانية من عشر تجارب روش أوسيلتاميفير لم تُنشر. وكانت قاعدة الأدلة غير مكتملة من الناحية الهيكلية.
الهشاشة التحليلية
كم درجة حرية الباحث يمكن أن تغير النتيجة؟ تعريفات مختلفة للنتائج، أو مجموعات التحليل، أو الأساليب الإحصائية.
رد الاتصال بالوحدة 10 (الباروكستين): إعادة التحليل مع تعريفات نتائج مختلفة عكست الاستنتاج تماما. كان ذلك بمثابة هشاشة تحليلية، إذ لم يتم حساب FI أبدًا لأن نقطة النهاية نفسها كانت محل نزاع. ويفحص تقييم المتانة الكامل الأبعاد الثلاثة.
الاختبار القصير للوحدة 17
Q1. تشتمل التجربة على 200 مريض لكل ذراع، و12 حدثًا في العلاج، و25 حدثًا تحت السيطرة (قيمة الاحتمال = 0.03). مؤشر الهشاشة هو 3. ماذا يعني هذا؟
اكتملت الوحدة 17
"الرقم الذي ينجو من كل محاولة لكسره هو الرقم الذي يستحق الثقة."
ليست كل إشارة حقيقة.
الوحدة 18: حقوق الملكية
يجب اكتساب اليقين وليس افتراضه.
الوحدة 18: حقوق الملكية
الوحدة 18: حقوق الملكية
🎯 أهداف التعلم
- حدد كيفية إنشاء معايير استبعاد التجارب فجوات الأدلة
- تطبيق إطار PROGRESS-Plus لتقييم العدالة في الأدلة
- استخدم المبادئ التوجيهية لإعداد تقارير PRISMA-Equity
- فهم قابلية النقل: عندما تفشل نتائج التجارب في الممارسة
- صمم استراتيجيات بحث وتوليف تراعي العدالة
أثبت نظام SPRINT أن التحكم الدقيق في ضغط الدم
ينقذ الأرواح. لكن حياة من؟
استبعدت تجربة SPRINT التاريخية المرضى الذين يعانون من مرض السكري والسكتة الدماغية السابقة وفشل القلب. أكثر من 75% من مرضى ارتفاع ضغط الدم في الولايات المتحدة لم يكونوا مؤهلين. وكانت الأدلة قوية ولكن قابلية التطبيق كانت ضيقة.
المحاكمة التي استبعدت معظم مرضاها
سجل SPRINT 9361 مريضًا وأثبت أن التحكم المكثف في ضغط الدم (الهدف <120 مم زئبق) قلل من أحداث القلب والأوعية الدموية بنسبة 25٪ (HR 0.75، 95٪ CI 0.64-0.89). لكن معايير الاشتمال تحكي قصة مختلفة.
من تم استبعاده:
- مرض السكري – 35% من البالغين في الولايات المتحدة يعانون من ارتفاع ضغط الدم
- السكتة الدماغية السابقة — 8% من السكان المصابين بارتفاع ضغط الدم
- قصور القلب المصحوب بأعراض — 6% من البالغين المصابين بارتفاع ضغط الدم
- البقاء المتوقع <3 سنوات - أضعف المرضى
- المقيمين في دار التمريض — مستبعد تمامًا
- معدل الترشيح الكبيبي <20 مل/دقيقة — مرض الكلى المتقدم
النتيجة: أكثر من 75% من البالغين الأمريكيين المصابين بارتفاع ضغط الدم لم يكونوا مؤهلين. وكانت الأدلة قوية. ولكن لمن؟
من أين تأتي الأدلة
78%
من المشاركين في التجارب الكبرى لأمراض القلب والأوعية الدموية جاءوا من بلدان مرتفعة الدخل (2000-2020).
6%
من أفريقيا جنوب الصحراء الكبرى - حيث تتزايد أمراض القلب والأوعية الدموية بشكل أسرع.
تجارب الحبوب المتعددة: أجريت 4 من 5 تجارب على مجموعات سكانية متوسط مؤشر كتلة الجسم لديهم أقل من 25. The US mean BMI is 30. Drug metabolism, comorbidity patterns, healthcare access, and genetic variation all differ across populations. لا تضمن الفعالية في مجموعة سكانية معينة الفعالية في مجموعة أخرى.
المرجع: التجارب المتعددة الجنسيات وفجوة PROGRESS-Plus
إطار عمل PROGRESS-Plus
بالإضافة إلى: العمر والإعاقة والتوجه الجنسي والفئات الضعيفة الأخرى.
PRISMA-المساواة وقابلية النقل
PRISMA-الأسهم يوسع برنامج PRISMA ليتطلب الإبلاغ عن كيفية معالجة الإنصاف في المراجعة: الخصائص السكانية، وتحليلات المجموعات الفرعية حسب العيوب، وتقييم قابلية التطبيق على السكان المحرومين.
قابلية النقل: فعالية التجربة لا تساوي فعالية العالم الحقيقي. توجد طرق لإعادة وزن بيانات التجارب لتتناسب مع التوزيع السكاني المستهدف.
من التجربة إلى العالم الحقيقي: قابلية النقل
قابلية النقل = هل يمكن تطبيق نتائج مجموعة التجربة X على المجموعة السكانية المستهدفة Y؟ هذا ليس سؤالا فلسفيا، بل له أساليب رسمية.
الاحتمالية العكسية لترجيح المشاركة (IPPW)
إعادة وزن المشاركين في التجربة بحيث يشبهون المجموعة السكانية المستهدفة في المتغيرات المشتركة الرئيسية.
مؤشر قابلية التعميم
يحدد مدى تشابه العينة التجريبية مع المجموعة السكانية المستهدفة من حيث الخصائص المرصودة.
ستيوارت وآخرون (2015، ستات ميد): عندما تم إعادة ترجيح نتائج SPRINT لتتناسب مع سكان الولايات المتحدة الذين يعانون من ارتفاع ضغط الدم، تم تخفيف الفائدة المقدرة - HR 0.82 (مقابل 0.75 في التجربة). العلاج لا يزال يعمل. لكن الحجم يتغير عندما يتغير عدد السكان.
SPRINT والأغلبية المفقودة
كانت SPRINT تجربة جيدة التصميم شملت 9361 مريضًا. لقد غيرت نتائجها (HR 0.75 للتحكم المكثف مقابل التحكم القياسي في ضغط الدم) المبادئ التوجيهية في جميع أنحاء العالم. لكن التحليلات اللاحقة أظهرت أن الفائدة كانت أقوى في المجموعة الفرعية الأكثر تشابهًا مع مجموعة التجربة، وكانت غير مؤكدة بالنسبة للمجموعات المستبعدة.
العدالة في تركيب الأدلة لا تعني مجرد السؤال "هل ينجح؟" ولكن "لمن يعمل؟"
شجرة القرار: تقييم الأسهم للمراجعة الخاصة بك
الجذر: هل تأتي أدلة المراجعة الخاصة بك من مجموعات سكانية مماثلة لهدفك؟
YES → جيد. لكن تحقق: هل يتم الإبلاغ عن المجموعات الفرعية (العمر، الجنس، العرق، الحالة الاجتماعية والاقتصادية) بشكل منفصل؟
- Yes: استخدم تأثيرات المجموعة الفرعية للتوصيات الخاصة بالسكان
- No: ضع علامة على أنها قيد - فجوة العدالة في إعداد التقارير
NO → هل يكشف تحليل PROGRESS-Plus عن تأثيرات تفاضلية؟
- Yes: هناك حاجة إلى توصيات خاصة بالسكان. النظر في إعادة وزن قابلية النقل.
- No: تعميم حذر مع بيان الإنصاف الصريح في المناقشة
رد الاتصال: إعادة النظر في درس العلاج التعويضي بالهرمونات
تذكر الوحدة 3؟ وأظهرت قصة HRT ذلك تحيز المستخدم الصحي جعل العلاج الضار يبدو نافعا. قد يكون لـ SPRINT مشكلة معاكسة - فتأثير "المتطوع السليم" قد يؤدي إلى ظهور علاج فعال more فعال مما سيكون عليه في العالم الحقيقي.
ينبغي لكل تحليل تلوي أن يسأل: من الذي تم تضمينه؟ من تم استبعاده؟ وهل هذا مهم؟
اختبار الوحدة 18
Q1. ما الذي يساعد إطار عمل PROGRESS-Plus المراجعين على تقييمه؟
اكتملت الوحدة 18
"إن الأدلة التي تستبعد الضعفاء لا يمكن أن تدعي أنها تخدمهم."
ليست كل إشارة حقيقة.
الوحدة 19: الآلة
الرقم بدون مصدر ليس رقمًا.
الوحدة 19: الآلة
الوحدة 19: الآلة
🎯 أهداف التعلم
- وصف كيفية استخدام الذكاء الاصطناعي/التعلم الآلي في فحص المراجعة المنهجية
- شرح التعلم النشط وسير عمل الإنسان في الحلقة
- تقييم التحقق من صحة الأتمتة: الاستدعاء وتوفير أعباء العمل والمخاطر
- التعرف على القيود والتحيزات في الفحص الخوارزمي
- تطبيق أطر الاستخدام المسؤول للذكاء الاصطناعي في تجميع الأدلة
عندما ضرب فيروس كورونا، وصلت أوراق
بشكل أسرع مما يستطيع البشر قراءته.
بحلول عام 2021، كان هناك أكثر من 300000 ورقة بحثية عن فيروس كورونا. استخدمت شركة Cochrane مصنفات التعلم الآلي لفرز الدراسات من أجل مراجعاتها السريعة، مما أدى إلى تقليل عبء عمل الفحص بنسبة تصل إلى 70% مع الحفاظ على التذكر بنسبة تزيد عن 95%.
الطوفان
بحلول أبريل 2020، ظهرت 4000 نسخة أولية من فيروس كورونا كل أسبوع.
تم فهرسة PubMed 500 مقالة جديدة عن فيروس كورونا يوميًا.
وصلت قائمة انتظار فحص كوكرين 10000 عنوان لم تتم مراجعته.
زوج من المراجعين يفحصون ~ 200 عنوان في اليوم.
عند 500 مقالة جديدة في اليوم، كانوا يتأخرون أكثر مع كل ساعة.
كان الاستعراض الحي يموت قبل أن يتمكن من العيش.
المحاولات الأولى
الفكرة لم تكن جديدة. كوهين وآخرون. (2006، JAMIA) أظهر لأول مرة أن التعلم الآلي يمكن أن يقلل من عبء عمل الفحص بنسبة 50٪ - مع خسارة أقل من 5٪ في الاستدعاء.
لكن المحاكاة ليست حقيقة. سيكون فيروس كورونا أول اختبار حقيقي على نطاق واسع.
الذكاء الاصطناعي في المراجعات المنهجية
تحديد أولويات الفحص
يصنف التعلم النشط الاستشهادات حسب صلتها بالموضوع. يقوم المراجعون بفحص العناصر ذات الصلة على الأرجح أولاً.
مساعدة في استخراج البيانات
يستخرج البرمجة اللغوية العصبية عناصر PICO ونتائجها ونتائجها. Always requires human verification.
خطر تقييم التحيز
تتنبأ مصنفات ML بمجالات RoB. تجريبي – يظل الحكم البشري هو المعيار الذهبي.
التحقق من الأتمتة
التوتر الأساسي: توفر الأتمتة الوقت ولكنها تقدم مصدرًا جديدًا للخطأ. قم دائمًا بالإبلاغ عن الأداة والإصدار وبيانات التدريب ومعايير التوقف.
لمعرفة ما إذا كان الجهاز قد فاتته دراسة ذات صلة، أنت بحاجة إلى إنسان لفحص كل شيء.
ولكن إذا قام البشر بفحص كل شيء، لماذا استخدام الجهاز ؟
الحل: التحقق من صحة الرفض المحتمل.
- فحص عينة عشوائية بنسبة 10% بواسطة كل من الإنسان والآلة
- قارن: هل أخطأت الآلة ما وجده الإنسان؟
- إذا انخفض معدل الاستدعاء إلى أقل من 95%، فأعد تدريب الفحص البشري ووسعه
ثق، ولكن تحقق. تكتسب الآلة دورها، ولا ترثه.
استجابة كوكرين لفيروس كورونا
قامت شركة كوكرين ببناء سجل دراسة كوفيد-19 باستخدام مصنفات التعلم الآلي المدربة على ملايين السجلات. حقق النظام حساسية بنسبة 99% مع تقليل الفحص اليدوي من أسابيع إلى أيام.
لكن الآلة كانت أداة وليست بديلاً. تم التحقق من كل دراسة مشمولة من قبل المراجعين البشريين. الدرس المستفاد: الذكاء الاصطناعي يعزز المراجع، ولا يحل محله.
الدراسة التي لم يتم العثور عليها تقريبًا
في يونيو 2020، نشرت تجربة RECOVERY نتائجها الخاصة بالديكساميثازون:الأول ثبت أن العلاج يقلل من وفيات فيروس كورونا (الوفيات لمدة 28 يومًا: 22.9% مقابل 25.7%، RR 0.83).
ظهرت النسخة الأولية على medRxiv بعنوان غير قياسي. حدثت مثل هذه السيناريوهات بشكل متكرر أثناء الوباء: فقد صنف مصنفو تعلم الآلة، المدربون على المصطلحات الموجودة، الإطارات غير المألوفة في مرتبة منخفضة.
في العديد من المراجعات الحية، قام المراجعون البشريون بمسح العناوين المميزة بالتعرف على أسماء الأدوية الرئيسية وقاموا بتصعيد الدراسات التي قلل المصنفون من أولوياتها.
وبدون هؤلاء البشر، ربما انتظرت نتائج العلاج التاريخية أسابيع قبل أن تدخل المراجعة الحية.
الآلة تقرأ بشكل أسرع. يقرأ الإنسان بشكل أعمق. ولا يكفي أي منهما وحده.
شجرة القرار: متى يجب عليك استخدام الذكاء الاصطناعي؟
تحديد أولويات التعلم النشط. شاشة مزدوجة عشوائية بنسبة 10%. توقف عندما تسفر 3 دفعات متتالية عن 0 دراسات ذات صلة.
التقرير: نوع المصنف، بيانات التدريب، الاستدعاء عند الإيقاف، قاعدة الإيقاف.
بالنسبة لـ <5000 عنوان، يظل الفحص البشري المزدوج هو المعيار الذهبي. يضيف الذكاء الاصطناعي التعقيد دون فائدة متناسبة.
إذا كانت الإجابة بنعم ← الذكاء الاصطناعي ذو قيمة خاصة. إعادة تدريب المصنف المستمر على الأدلة الجديدة. لكن: لا تدع الجهاز أبدًا يتخذ قرار التضمين النهائي.
يتكرر النمط
تذكر الوحدة 6؟ قام بولديرمانز بتلفيق بيانات DECREASE التي وجهت المبادئ التوجيهية لحاصرات بيتا المحيطة بالجراحة لمدة عقد من الزمن.
يمكن للذكاء الاصطناعي الآن اكتشاف الحالات الشاذة الإحصائية تلقائيًا:
- اختبار GRIM: هل الوسائل المبلغ عنها متوافقة مع أحجام العينات الصحيحة؟
- SPRITE: هل يمكن إعادة بناء الإحصائيات الموجزة المبلغ عنها من بيانات فردية معقولة؟
- Statcheck: هل تتطابق القيم الاحتمالية المبلغ عنها مع إحصائيات الاختبار؟
وجدت هذه الأدوات حالات شاذة في مئات الأبحاث المنشورة— أسرع من أي مدقق بشري.
لكن الآلة تلوح. قضاة البشر. ويظل قرار التراجع إنسانيًا إلى حد كبير.
اختبار الوحدة 19
Q1. ما هو الحد الأدنى المقبول للفحص بمساعدة الذكاء الاصطناعي في المراجعات المنهجية؟
أكمل الوحدة 19
"الآلة تقرأ بشكل أسرع. والإنسان يقرأ بشكل أعمق. ومعاً، يقرأان الحقيقة."
ليست كل إشارة حقيقة.
الوحدة 20: النوعية
الأساليب تحمي المرضى من ثقتنا.
الوحدة 20: النوعية
الوحدة 20: النوعية
🎯 أهداف التعلم
- اشرح لماذا تتطلب بعض الأسئلة تركيب أدلة نوعية
- وصف الإثنوغرافيا الفوقية (نوبليت وهير) والتوليف الموضوعي
- تطبيق إطار CERQual لتقييم الثقة في النتائج النوعية
- فهم مناهج التوليف ذات الأساليب المختلطة
- التعرف على متى تغير الأدلة النوعية الممارسة
طرحت منظمة الصحة العالمية سؤالاً
لا يمكن للـ RCT الإجابة.
لماذا تعاني النساء في جميع أنحاء العالم من عدم الاحترام وسوء المعاملة أثناء الولادة؟ بوهرين وآخرون. (2015) قام بتجميع 65 دراسة نوعية من 34 دولة في إطار من سبعة مجالات لسوء المعاملة.
سؤال يتجاوز العشوائية
في عام 2014، شكلت منظمة الصحة العالمية لجنة لمعالجة الأزمة العالمية: حيث كانت النساء يتعرضن للإيذاء الجسدي، والإهانة اللفظية، وحرمانهن من الرعاية أثناء الولادة. لم يكن هذا حدثًا نادرًا، فقد جاءت التقارير من هناك 34 دولة.
كانوا بحاجة إلى فهم WHY. ما الذي يدفع إلى عدم الاحترام وسوء المعاملة في رعاية الأمومة؟
لا يمكن لأي تجربة معشاة ذات شواهد أن تجيب على هذا. لا يمكنك توزيع النساء بشكل عشوائي على الرعاية المسيئة مقابل الرعاية المحترمة. لا يمكنك أعمى القابلات. لا يمكنك قياس "الكرامة" على مقياس ليكرت. وكان يجب أن تكون الأدلة نوعية.
ميتا الاثنوغرافيا
تم تطويره بواسطة نوبليت وهير (1988)، الإثنوغرافيا الوصفية يترجم المفاهيم عبر الدراسات بدلا من تجميع الأرقام. وينتج أطر تفسيرية جديدة (بنيات من الدرجة الثالثة) من بيانات الدرجة الأولى (اقتباسات المشاركين) والبيانات من الدرجة الثانية (تفسيرات المؤلف).
الوسيطة
ما وجده بورين: تصنيف سوء المعاملة
الضرب والقرص والصفع أثناء المخاض
اللمس غير اللائق، والإجراءات غير الرضائية
الصراخ والتهديدات والتعليقات القضائية
على أساس حالة فيروس نقص المناعة البشرية، والانتماء العرقي، والعمر، والفقر
الإهمال، وعدم وجود موافقة مستنيرة
ضعف التواصل والاستخفاف
الاكتظاظ، ونقص الموظفين، ونقص الإمدادات
65 دراسة. 34 دولة. تتكرر نفس الأنماط عبر اللغات والثقافات والأنظمة. لم تكن هذه حكاية. وقد تم توليف هذا الأدلة.
CERQual: الثقة في الأدلة النوعية
يقوم CERQual بتقييم الثقة في نتائج المراجعة النوعية عبر أربعة مكونات:
القيود المنهجية
جودة الدراسات المساهمة.
التماسك
مدى دعم البيانات لهذه النتائج.
الكفاية
ثراء البيانات (وليس فقط عدد الدراسات).
الصلة
قابلية التطبيق على سياق سؤال المراجعة.
عندما تكون الأدلة النوعية ممارسة التغييرات
أفاد تجميع بورين بتوصيات منظمة الصحة العالمية لعام 2018 بشأن الرعاية أثناء الولادة لتجربة ولادة إيجابية. تغييرات محددة ترتكز على الأدلة النوعية:
وهذه التوصيات - المبنية على أدلة نوعية - توجه الآن رعاية الأمومة في 194 دولة عضو في منظمة الصحة العالمية. لا يمكن لأي قطعة أرض في الغابة أن تنتجها. لا يمكن لأي إحصائية أن تكشف عنهم.
إطار بوهرين لسوء المعاملة
حدد التوليف النوعي لعام 2015 سبعة مجالات: الاعتداء الجسدي، والاعتداء الجنسي، والإساءة اللفظية، والوصم والتمييز، وعدم تلبية المعايير المهنية، وسوء العلاقات، وظروف النظام الصحي. استرشد هذا الإطار بتوصيات منظمة الصحة العالمية بشأن الرعاية أثناء الولادة (2018).
لا يمكن لأي قيمة p أن تعبر عن تجربة الصفع أثناء المخاض. أعطى التركيب النوعي صوتًا لما لا تستطيع الأرقام تقديمه.
شجرة القرار: متى يكون التوليف النوعي مناسبًا؟
الجذر: هل سؤال بحثك يتعلق بالتجارب أو التصورات أو العوائق أو الميسرات؟
YES → هل سؤالك حول كيف أو لماذا، وليس فقط ما إذا كان؟
- Yes: تركيب الأدلة النوعية (الإثنوغرافيا التلوية، التوليف الموضوعي، أو توليف الإطار)
- No: فكر في الأساليب المختلطة: كمية لـ التأثير + النوعي للآلية
NO → هل سؤالك حول الفعالية/الفعالية؟
- Yes: التحليل التلوي الكمي
- But: استكمل المراجعة النوعية لعوائق التنفيذ (تقييم CERQual)
الرؤية الأساسية: تجيب أقوى المراجعات المنهجية على كلا الأمرين: هل تعمل؟ (كمي) ولماذا ينجح أو يفشل؟ (نوعي)
اختبار الوحدة 20
Q1. ما الذي يميز الإثنوغرافيا التلوية عن التحليل التلوي الكمي؟
الوحدة 20 كاملة
"ليس كل ما يهم يمكن إحصاؤه. ليس كل ما يتم إحصاؤه مهم."
التباين رسالة وليس ضجيج.
الوحدة 21: متعدد المتغيرات
التباين رسالة وليس ضجيج.
الوحدة 21: متعدد المتغيرات
الوحدة 21: متعدد المتغيرات
🎯 أهداف التعلم
- التعرف على الحالات التي تكون فيها النتائج مترابطة في الدراسة
- شرح نماذج التأثيرات العشوائية متعددة المتغيرات
- تطبيق تقدير التباين القوي (RVE) لأحجام التأثير التابعة
- فهم النماذج ثلاثية المستويات للنماذج المتداخلة البيانات
- اختر من بين الأساليب متعددة المتغيرات بناءً على بنية البيانات
تقرير تجارب القلب والأوعية الدموية
الوفيات، MI، والسكتة الدماغية، وأكثر من ذلك.
ترتبط هذه النتائج داخل المرضى. لا يمكن للمريض الذي يموت أن يكون لديه نقطة نهاية MI. يعالج التحليل التلوي القياسي كل نتيجة بشكل مستقل - متجاهلاً الاعتماد وأدلة العد المزدوج المحتملة.
أسئلة الافتراض لا أحد
افتح أي كتاب دراسي قياسي للتحليل التلوي. تفترض النماذج أن كل دراسة تساهم في حجم تأثير مستقل واحد. لكن الواقع مختلف.
تشير تجربة واحدة للقلب والأوعية الدموية إلى الوفيات، واحتشاء عضلة القلب، والسكتة الدماغية، وإعادة تكوين الأوعية الدموية. تشير دراسة واحدة للعلاج النفسي إلى حدوث الاكتئاب والقلق ونوعية الحياة عند 3 و6 و12 شهرًا.
معظم المحللين إما: (a) يتعاملون مع جميع الـ 120 على أنها مستقلة (تضخيم الدقة بعامل √4)، أو (b) اختر نتيجة واحدة وتجاهل الباقي. كلا النهجين خاطئان.
مشكلة التبعية
في التحليل التلوي القياسي الزوجي، تساهم كل دراسة بحجم تأثير one . لكن العديد من الدراسات تشير إلى نتائج أو مجموعات فرعية أو نقاط زمنية أو أذرع متعددة، مما يؤدي إلى إنشاء متكل أحجام التأثير. يؤدي تجاهل هذا إلى تضخيم الدقة وتشويه الاستدلال.
تقدير التباين القوي
يستخدم RVE (Hedges, Tipton & Johnson, 2010) نوع ساندويتش مقدِّر يوفر أخطاء قياسية صالحة بغض النظر عن الارتباط الحقيقي بين التأثيرات التابعة. لا حاجة لمعرفة أو تقدير الارتباط داخل الدراسة. الأفضل من أجل ≥20 دراسة.
تصحيح العينة الصغيرة: طور Tipton & Pustejovsky (2015) تصحيحات عينة صغيرة (CR2) لـ RVE، باستخدام درجات الحرية Satterthwaite عندما يكون عدد المجموعات صغيرًا.
ما تأثير الاعتماد على فترات ثقتك
إذا كانت 4 نتائج من نفس الدراسة لها ارتباط داخل الدراسة ρ = 0.5:
التعامل كمستقل
عرض CI = X
محاسبة التبعية
عرض CI = 1.58X
يجب أن يكون فاصل الثقة الخاص بك أوسع بنسبة 58%. كل تحليل تلوي تجاهل هذا نشر نتائج دقيقة بشكل خاطئ.
RVE (Hedges, Tipton & Johnson, 2010): يستخدم مقدر التباين "الساندويتش" الذي ينتج أخطاء معيارية صحيحة بدون تحتاج إلى معرفة الارتباط الدقيق داخل الدراسة.
نماذج ثلاثية المستويات: جعل الهيكل واضحًا
المستوى 1: تباين أخذ العينات
خطأ في القياس ضمن كل تقدير لحجم التأثير.
المستوى 2: التباين داخل الدراسة
تختلف النتائج والنقاط الزمنية ضمن دراسة واحدة.
المستوى 3: التباين بين الدراسة
تختلف الدراسات عن بعضها البعض في المجموعات السكانية والإعدادات والأساليب.
مثال: في التحليل التلوي للعلاج النفسي للاكتئاب (k=50 دراسة، 180 تأثير). الأحجام)، 35% كان من التباين ضمن الدراسة (نتائج مختلفة) و 65% كان بين الدراسة (علاجات مختلفة، والسكان). يكشف هذا التحليل عن مقدار عدم التجانس داخل vs بين دراسات.
نماذج ثلاثية المستويات: الإطار الرسمي
عندما تكون التأثيرات متداخلة (على سبيل المثال، نتائج متعددة داخل الدراسات، أو دراسات داخل مجموعات البحث)، نموذج ثلاثي المستويات يقسم التباين إلى: (1) تباين العينات (المستوى 1)، (2) التباين داخل الدراسة (المستوى 2)، و (3) التباين بين الدراسة (المستوى 3). يحافظ هذا على الاستدلال الصحيح أثناء استعارة القوة عبر المستويات.
تحدي القلب والأوعية الدموية
قد يتضمن التحليل التلوي للستاتينات 30 تجربة، تشير كل منها إلى الوفيات، والاحتشاء الدماغي، والسكتة الدماغية، وإعادة تكوين الأوعية الدموية. هذا هو 120 حجم تأثير من 30 مجموعة. إن التعامل معها على أنها 120 تقديرًا مستقلاً يؤدي إلى تضخيم الدقة بعامل يتعلق بالارتباط داخل الدراسة.
تتعامل نماذج RVE أو النماذج متعددة المتغيرات مع هذا بشكل صحيح - مما ينتج فترات ثقة أوسع وصادقة.
شجرة القرار: ما هي الطريقة المتبعة لأحجام التأثير التابعة؟
الجذر: هل التحليل التلوي الخاص بك له تأثيرات متعددة لكل دراسة؟
YES → هل تعرف (أو تستطيع تقدير) الارتباطات داخل الدراسة؟
- Yes: نموذج التأثيرات العشوائية متعدد المتغيرات (الأكثر كفاءة)
- No: RVE مع تصحيح العينات الصغيرة (قوي للارتباطات غير المعروفة)
NO → نموذج التأثيرات العشوائية أحادي المتغير القياسي
السؤال الفرعي: هل تأثيراتك المتعددة ناتجة عن نتائج أو نقاط زمنية أو مجموعات فرعية مختلفة؟
- نتائج مختلفة → نموذج ثلاثي المستويات أو RVE مع التجميع
- نقاط زمنية مختلفة → شبكة من النقاط الزمنية ذات الارتباط الزمني
- مجموعات فرعية مختلفة → فكر فيما إذا كانت المجموعات الفرعية ذات معنى أو يجب حساب متوسطها
اختبار الوحدة 21
Q1. ما هي المشكلة التي يحلها تقدير التباين القوي (RVE)؟
اكتملت الوحدة 21
"عندما تكون النتائج متشابكة، فإن التظاهر بأنها مستقلة هو كذبة مصلحة."
الرقم بدون مصدر ليس رقمًا.
الوحدة 22: الإثبات
الرقم بدون مصدر ليس رقمًا.
الوحدة 22: الإثبات
الوحدة 22: الإثبات
🎯 أهداف التعلم
- فهم كيفية انتشار الأخطاء الحسابية من خلال السياسة
- تعريف قابلية التكرار والتمييز عن قابلية التكرار
- تطبيق تجزئة الأدلة والأرقام الحاملة للإثبات
- استخدم قوائم التحقق من التكرار للتحليل التلوي
- التعرف على دور التسجيل المسبق والبيانات المفتوحة
فتح طالب دراسات عليا جدول بيانات
ووجدت أن عصر التقشف بني على خطأ.
في عام 2010، ادعى راينهارت وروجوف أن البلدان التي تزيد فيها نسبة الدين إلى الناتج المحلي الإجمالي عن 90% كان نموها سلبيا. وقد أثر هذا على سياسات التقشف في جميع أنحاء أوروبا. في عام 2013، اكتشف توماس هيرندون خطأً في برنامج Excel أدى إلى استبعاد 5 دول من المتوسط. وكانت النتيجة المصححة: نمو إيجابي متواضع، وليس الانهيار.
الاستنساخ مقابل قابلية النسخ المتماثل
قابلية التكرار هي المعيار الأدنى. إذا لم يتمكن الآخرون من إعادة إنتاج تقديرك المجمع من بياناتك المبلغ عنها، فلا يمكن التحقق من التحليل. يجب أن تتشارك التحليلات التلوية: البيانات المستخرجة، ونصوص التحليل، وإصدارات البرامج، والبذور العشوائية.
الأرقام الحاملة للإثبات
يجب أن يحمل كل رقم في التحليل التلوي المصدر: من أين جاء، وكيف تم تحويله، وما هو الكود الذي أنتجه. تجزئة الأدلة بصمة مشفرة للمدخلات، لذا فإن أي تغيير (عرضي أو غير مقصود) متعمد) يمكن اكتشافه.
تجزئة الإدخال
تجزئة SHA-256 للبيانات المستخرجة. إذا تغيرت خلية واحدة، يتغير التجزئة. سلسلة المصدر: البيانات → الكود → النتيجة → التجزئة.
تفاعلية: قائمة التحقق من التكرار
تحقق من كل عنصر لتقييم إمكانية تكرار نتائج التحليل التلوي. كيف تقيم تقييمك؟
خطأ Excel الذي غير الاقتصادات
وقد تم الاستشهاد بكتاب راينهارت روجوف "النمو في زمن الديون" في شهاداته أمام الكونجرس، وتقارير المفوضية الأوروبية، والموجزات السياسية لصندوق النقد الدولي. كان خطأ Excel (تم استبعاد الصفوف 30-34 من صيغة المتوسط) يعني أن خمسة بلدان - أستراليا والنمسا وبلجيكا وكندا والدنمارك - كانت مفقودة ببساطة.
ارتفع المتوسط المصحح من -0.1% إلى +2.2%. أثرت سياسات التقشف على الملايين. إن قابلية التكرار ليست سعيًا للكمال الأكاديمي، بل هي ضمانة ضد الكوارث.
تذكر الوحدة 5؟
انخفاض من خلال عدسة التكاثر
تم سحب تجارب DECREASE التي أجراها دون بولدرمانز للحصول على بيانات ملفقة. لو كانت هناك أرقام تحمل إثباتًا - مدخلات مجزأة، وسلاسل مصدر، وحسابات تم التحقق منها - لكان من الممكن اكتشاف التلفيق قبل دخلت الأدلة التحليلات التلوية وتغيير المبادئ التوجيهية الجراحية.
الوحدة 22 اختبار
Q1. ما هو خطأ راينهارت-روجوف؟
الوحدة 22 كاملة
"الرقم بدون مصدر ليس رقمًا. والتحليل بدون إمكانية التكرار ليس دليلاً."
يجب اكتساب اليقين وليس افتراضه.
الوحدة 23: أول سباق سريع لك
يجب اكتساب اليقين وليس افتراضه.
الوحدة 23: أول سباق سريع لك
الوحدة 23: أول سباق سريع لك
🎯 أهداف التعلم
- فهم سير عمل المراجعة المنهجية لمدة 40 يومًا
- قم بتخطيط المبادئ السبعة لمراحل الممارسة الحقيقية
- التعرف على بوابات تعريف الإنهاء (DoD) كنقاط تفتيش للجودة
- نقدر لماذا يمنع الهيكل حالات الفشل التي درستها
- خريج جاهز لإجراء (وليس مجرد فهم) التحليل التلوي
لقد تعلمت القصص.
الآن يجب عليك السير على الطريق.
كل عكس الأدلة التي درستها حدث بسبب الفرق knew الطرق ولكن لم يتم يتبع لهم بشكل منهجي.
إطار عمل META-SPRINT
سير عمل منظم لمدة 40 يومًا مع 5 بوابات طور. كل بوابة عبارة عن نقطة تفتيش لتعريف التنفيذ (DoD) تمنعك من المضي قدمًا حتى يتم ضمان الجودة.
لماذا 40 يوما؟ طويلة بما يكفي للدقة، وقصيرة بما يكفي لمنع زحف النطاق. تم دفن إشارات القلب روزيجليتازون لسنوات لأنه لم يكن هناك موعد نهائي يفرض الشفافية.
بوابات المرحلة الخمس
DoD-A: قفل البروتوكول (الأيام 1-3)
تم تعريف PICOS، وتم تعيين قواعد النقطة الزمنية، واختيارات النموذج محددة مسبقًا. لا يوجد هدف متحرك.
DoD-B: قفل البحث (الأيام 6-10)
تم البحث في جميع قواعد البيانات، وفحص الأدبيات الرمادية، والتحقق من صحة PRESS. لا توجد دراسات مخفية.
DoD-C: قفل الاستخراج (الأيام 10-28)
الاستخراج المزدوج، ربط المصدر، تقييم RoB. لا أرقام ملفقة.
بوابات المرحلة الخمس (تابع)
DoD-D: قفل التحليل (الأيام 21-33)
تم إنشاء قطع الغابات، وإجراء تحليلات الحساسية، واستكشاف عدم التجانس. لا قطف الكرز.
DoD-E: قفل التقديم (الأيام 33-40)
تصنيف درجة اليقين، كتابة الملخص السريري، وضع اللمسات النهائية على المخطوطة. لا ثقة زائدة.
تجميد اليوم 34: لا يمكن إجراء دراسات جديدة تمت إضافته بعد اليوم 34. وهذا يمنع "زحف النطاق المسلح" الذي ابتليت به التحليلات الوصفية لجراحة العمود الفقري لـ BMP، حيث استمرت الصناعة في "العثور" على دراسات إيجابية.
المبادئ السبعة في الممارسة
كل مبدأ تعلمته يرتبط ببوابة مرحلة محددة:
مبدأ الفريق الأحمر
فريقك الخاص يحاول تعطيل عملك.
في كل يوم، يقضي اثنان من أعضاء الفريق المتناوبين 12 دقيقة في التحقق من جودة البيانات كخصوم. هذه هي الطريقة التي تم بها اكتشاف احتيال بولدت - ليس من خلال المراجعة الودية، ولكن من خلال الفحص المتشكك الذي لاحظ معدلات توظيف مستحيلة.
CondGO: عندما تسوء الأمور
ماذا يحدث عندما تكتشف مشكلة حرجة في منتصف السباق؟
CondGO = الذهاب المشروط
بروتوكول إنقاذ محدود. لديك بالضبط 72 ساعة لإصلاح المشكلة باستخدام الإجراءات المسموح بها فقط. إذا لم تتمكن من إصلاح الأمر، فيجب عليك إيقاف المراجعة.
📖 درس أفانديا: شهدت شركة GSK إشارات القلب والأوعية الدموية في عام 2000 ولكن لم يكن لديها موعد نهائي قسري. لقد "شاهدوا وانتظروا" لمدة 7 سنوات. وتضرر عشرات الآلاف. توجد CondGO لأن عبارة "سنتعامل معها في النهاية" تقتل الأشخاص.
لقد بدأت هذه الدورة بالقصص.
لقد أنهيتها جاهزة للتمرين.
يأخذ سير عمل META-SPRINT كل ما تعلمته وينظمه في نظام مدته 40 يومًا يمنع حالات الفشل التي تمت دراستها.
عندما تكون مستعدًا لإجراء مراجعة منهجية حقيقية، افتح تطبيق META-SPRINT. ستوجهك القصص التي تعلمتها هنا، وستظهر كتذكيرات في كل خطوة.
كيف يبدو الأمر عندما يتم اتباع كل مبدأ؟
البيانات الحقيقية
يعد تعاون القائمين على تجارب علاج الكوليسترول (CTT) هو المعيار الذهبي للتحليل التلوي. لقد حصلوا على بيانات مريض فردية من أكثر من 170,000 مشارك عبر 26 تجربة ستاتين. البروتوكول المحدد مسبقًا. IPD من جميع التجارب الكبرى. نتائج موحدة. النتيجة: تقليل الستاتينات الأحداث الوعائية الكبرى بنسبة 21% لكل مليمول/لتر من تقليل LDL (RR 0.79، 95٪ CI 0.77-0.81)، بغض النظر عن المخاطر الأساسية. تم تكرار هذه النتيجة عبر 5 تحليلات تلوية على مدار 15 عامًا، منع ما يقدر بنحو من الإصابة بالنوبات القلبية والسكتات الدماغية في جميع أنحاء العالم.
اختبار Capstone
1. ما هو الغرض من "التجميد الشديد" لليوم 34 في META-SPRINT؟
2. يمنح بروتوكول CondGO الفرق المدة اللازمة لإصلاح المشكلات الحرجة؟
3. اكتشف فريق ضمان الجودة الخصوم للفريق الأحمر احتيال يواكيم بولدت من خلال ملاحظة:
القصص التي تعلمتها ليست تاريخًا.
إنها تحذيرات تحمي عملك المستقبلي.
عندما تقوم بإجراء التحليل التلوي الأول،
تذكر CAST قبل أن تثق في إشارة،
تذكر Poldermans قبل تخطي المصدر،
تذكر Reboxetine قبل أن تتجاهل مسار التحويل.
أنت الآن جاهز. الذهاب مع الهيكل. اذهب بالتواضع. اتبع المبادئ السبعة.
ليست كل إشارة حقيقة.
الوحدة 24: الاختبار النهائي
يجب اكتساب اليقين وليس افتراضه.
الاختبار النهائي
الاختبار النهائي: الجزء 1 من 2
اختبر مدى إتقانك لمبادئ التحليل التلوي. يتناول كل سؤال مفهومًا أساسيًا من الدورة.
Q1. يريد أحد الباحثين دراسة "تأثيرات التمارين الرياضية على الصحة". ما هي المشكلة الأساسية في سؤال البحث هذا؟
Q2. يُظهر المخطط القمعي عدم تناسق واضح مع الدراسات المفقودة في المنطقة السفلية اليسرى. ماذا يوحي هذا؟
Q3. يشير التحليل التلوي إلى I² = 85% وτ² = 0.42. ما هو التفسير الأكثر ملاءمة؟
Q4. في GRADE، ما هو اليقين المبدئي لمجموعة من الأدلة من التجارب المعشاة ذات الشواهد؟
Q5. في RoB 2.0، ما المجال الذي يقيم ما إذا كان مقيمو النتائج يعرفون تخصيص العلاج؟
الاختبار النهائي: الجزء 2 من 2
Q6: عكس الأدلةQ6. أظهرت تجربة CAST أن الأدوية المضادة لاضطراب النظم تزيد معدل الوفيات على الرغم من قمع عدم انتظام ضربات القلب. هذا مثال على:
Q7. متى يجب تفضيل نموذج التأثيرات العشوائية على التأثير الثابت نموذج؟
Q8. وفقًا لمعايير ICEMAN، مما يجعل تحليل المجموعة الفرعية أكثر مصداقية؟
Q9. ما الافتراض الذي يجب التحقق منه في التحليل التلوي للشبكة لضمان المقارنات غير المباشرة الصحيحة؟
Q10. في التحليل التسلسلي التجريبي (TSA)، إلى ماذا يشير تجاوز حد عدم الجدوى؟
الجزء الأول كامل - تابع إلى الجزء 2 (الوحدات المتقدمة)
الاختبار النهائي: الجزء 2 من 2 (متقدم)
الأسئلة 11-25 تغطي الوحدات 13-22 (Bayesian، NMA، IPD، الاستجابة للجرعة، الهشاشة، العدالة، الذكاء الاصطناعي، النوعي، متعدد المتغيرات، التكاثر).
Q11: بايزيQ11. في التحليل التلوي بايزي، ماذا يحدث عند استخدام سابقة غامضة مع العديد من الدراسات؟
Q12. في NMA المضاد للاكتئاب الذي طوره سيبرياني، لماذا لم يتم الإعلان عن دواء واحد "الفائز"؟
Q13. لماذا لا يجب عليك أبدًا تجميع IPD كما لو كان من تجربة واحدة ضخمة؟
Q14. ما الذي تسبب في اختفاء "منحنى J" للكحول في إعادة تحليل ستوكويل؟
Q15. في ملحمة الأوسيلتاميفير، ما الذي اكتشفه كوكرين عند الوصول إلى الأبحاث السريرية غير المنشورة تقارير الدراسة ؟
Q16. ما هي النسبة المئوية لمرضى ارتفاع ضغط الدم في الولايات المتحدة الذين لم يكونوا مؤهلين لتجربة SPRINT؟
Q17. لماذا يُعتبر الذكاء الاصطناعي "مُعززًا" وليس "بديلًا" في المراجعات المنهجية؟
Q18. ما الذي يقيمه عنصر "الملاءمة" في CERQual؟
Q19. يتضمن التحليل التلوي 30 تجربة ستاتين، تشير كل منها إلى 4 نتائج مترابطة (120 حجم تأثير). ما هو النهج الصحيح؟
Q20. في خطأ راينهارت-روجوف، ما هو متوسط معدل النمو المصحح لـ البلدان ذات الديون المرتفعة؟
درجة النجاح: 15/20 عبر كلا الجزأين
راجع أي أسئلة لم يتم الرد عليها من خلال العودة إلى الوحدة ذات الصلة. كل سؤال يختبر مفهومًا أساسيًا.
ليست كل إشارة حقيقة.
الأساليب تحمي المرضى من ثقتنا.
تهانينا
لقد أكملت عكس الأدلة: دورة التحليل التلوي.
أتمنى أن يسترشد تركيبك بالحقيقة، وتجميعك بالحكمة،
واستنتاجاتك بالتواضع.
السبعة المبادئ:
"ليست كل إشارة هي الحقيقة."
"أساليب تحمي المرضى من ثقتنا."
"ما الذي كان مخفيا على مرأى من الجميع؟"
"الرقم بدون مصدر ليس رقمًا."
"التباين هو رسالة، وليس ضجيجا."
"غياب الدليل ليس دليلاً على الغياب"
"اليقين يجب أن يُكتسب، لا أن يُفترض."
"اهدنا إلى الصراط المستقيم..."