================================== الوحدة 1: الاحتيال (ثيرانوس)
ألم تسمع حكاية المرأة
الذي وعد به غير العالم بقطرة دم,
الذي جمع المليارات في اختبار ذلك لم تعمل قط?
بالو ألتو، 2003
جامعة ستانفورد
ترك شاب في التاسعة عشرة من عمره رؤيا: مئات اختبارات الدم من قطرة واحدة.
يعتقد المستثمرون. يعتقد والجرينز. يعتقد البنتاغون.
أعطوها 9 مليارات دولار.
لكن الاختبارات أعطت نتائج خاطئة. قيل للمرضى أنهم مصابون بفيروس نقص المناعة البشرية بينما لم يكونوا كذلك. قيل للمرضى أن دمائهم كانت طبيعية عندما كانوا كذلك الموت.
كاريرو جي. الدم الفاسد. 2018
شجرة القرار في الخداع
ما فعله ثيرانوس مقابل ما يجب أن يحدث
اختبار تشخيصي جديد
↓
ينبغي أن تفعل
التحقق من صحة ضد معيار الذهب
↓
نشر TP/FP/FN/TN
↓
موافقة ادارة الاغذية والعقاقير
فعل ثيرانوس
تخطي التحقق من الصحة
↓
إخفاء حالات الفشل
↓
ضرر المرضى
"وكذب الاختبار،
ولبس الكذب يقينًا،
ولم يطلب أحد طاولة 2 × 2."
هذا هو السبب في أننا ندرس دقة الاختبار التشخيصي.
=================== الوحدة 2: النتائج الأربعة ====================
عندما يتكلم الاختبار
هناك فقط أربع حقائق محتملة.
اثنتين بركات. اثنان لعنات.
شجرة النتائج
كل نتيجة اختبار لها حقيقة وراءها
تم اختبار المريض
↓
ما هي الحقيقة؟
لديه مرض
D+
↓
TPاختبار +
FNامتحان -
لا يوجد مرض
D-
↓
FPاختبار +
TNامتحان -
المائدة المقدسة 2×2
مثال على الاختبار السريع لفيروس نقص المناعة البشرية (بيانات حقيقية)
==================== الوحدة 3: فترة نافذة فيروس نقص المناعة البشرية ====================
أما سمعتم بالدم الذي اختبر،
وجد ينظف,
وأعطيت للآلاف
بينما سبح الموت بداخلها?
أزمة إمدادات الدم، 1985
الولايات المتحدة
وعندما بدأ اختبار فيروس نقص المناعة البشرية، احتفل الأطباء: فقد أصبح بإمكانهم الآن فحص إمدادات الدم.
لكن الاختبار كان له فترة النافذة- بعد أسابيع من الإصابة عندما كان الفيروس موجودًا ولكن غير قابل للكشف.
تم اختبار الدم. كان الدم "سلبيا". تم نقل الدم.
8000-12000 أمريكي أصيبوا بالعدوى من خلال عمليات نقل الدم قبل أن تغلق الاختبارات الأفضل النافذة.
مركز السيطرة على الأمراض. معدل وفيات الأمهات. 198;36(49):833-840
شجرة قرارات فترة النافذة
لماذا السلبيات الكاذبة مميتة
الشخص المصاب مؤخرًا
↓
الوقت منذ الإصابة؟
< 2 أسابيع
اختبار سلبيفيروس موجود!
↓
تم التبرع بالدممصابون آخرون
> 4 أسابيع
اختبار إيجابيتم اكتشافه بشكل صحيح
↓
تم التخلص من الدمإمدادات آمنة
تتغير الحساسية مع مرور الوقت
0%
اليوم 1-7 فترة الكسوف
~50%
اليوم 14 التحويل المصلي
~95%
اليوم 21 تم اكتشاف أكثر
99.9%
اليوم 45+ نافذة مغلقة
الدرس
الحساسية ليست ثابتة. ذلك يعتمد على when قمت بالاختبار. قد يكون الاختبار "حساس بنسبة 99%" حساسًا بنسبة 0% في الإصابة المبكرة.
"وقال الاختبار "نظيف"
لأن الفيروس لم يظهر وجهه بعد.
والدماء كانت مشتركة
وانتشرت العدوى إلى الأبرياء".
======================================= الوحدة 4:
ألم تسمع عن حبوب منع الحمل التي تعطى للأمهات؟
to يحمون حملهم,
الذين زرعوا السرطان في بناتهم
قبل عشرين عاما من إزهاره؟
مأساة DES، 1938-1971
الولايات المتحدة وأوروبا
تم إعطاء ثنائي إيثيلستيلبيسترول (DES) لملايين النساء الحوامل لمنع الإجهاض.
لم يتم إجراء أي تجربة سريرية مناسبة على الإطلاق. الأطباء يفترض نجح الأمر لأنه بدا معقولاً.
بعد عقود، أصيبت بناتهما بسرطان نادر: سرطان غدي الخلايا الصافية في المهبل. كان السرطان نادرًا جدًا وكان بمثابة إشارة تشخيصية في حد ذاته.
5-10 مليون امرأة تعرضوا. الضرر عبر الأجيال.
هيربست آل وآخرون. ن إنجل ي ميد. 1971;284:878-881
شجرة قرار التحقق من الصحة
ما الذي كان يجب أن يحدث
تدخل طبي جديد
↓
هل تم اختباره بشكل صحيح؟
YES
تجربة عشوائية
↓
متابعة طويلة الأمد
↓
معرفة التأثيرات الحقيقيةالفوائد والأضرار
NO (DES)
الافتراض فقط
↓
الاستخدام واسع النطاق
↓
ضرر خفياكتشف بعد فوات الأوان
الإشارة التشخيصية
عندما تصبح الندرة دليلاً
كان سرطان الخلايا الغدية الشفاف في المهبل نادرًا جدًا عند النساء الشابات
7 حالات في مستشفى واحد أثار التحقيق.
كانت المجموعة نفسها هي الاختبار التشخيصي:
الحساسية للتعرض لـ DES: ما يقرب من 100% إذا كنت مصابًا بهذا السرطان في هذا العمر، فمن المؤكد تقريبًا أنك تعرضت له.
1:1000
خطر الخلية الواضحة السرطان في بنات DES
5-10M
النساء مكشوفات في جميع أنحاء العالم
"وأخذت الأمهات الحبة على أمل،
ونبتت البنات في الظل،
وبعد عشرين عاما تفشى السرطان..
التشخيص الذي اتهم جيلا من الطب."
==================== الوحدة 5: الحساسية والنوعية ==========================================
الاختبار له فضيلتان ورذيلتان.
الحساسية: هل يمكن العثور على المرضى؟
الخصوصية: هل يمكن الاستغناء عن الأصحاء؟
الحساسية: الصياد
الصيغة
الحساسية = TP / (TP + FN)
"من بين جميع المرضى، كم عدد الذين قبضنا عليهم؟"
مثال عملي: اختبار COVID PCR
منح: تم اختبار 200 مريض مصاب
TP = 196 (إيجابي بشكل صحيح)، FN = 4 (ضائع)
الحساسية = 196 / (196 + 4) = 196/200 = 98%
التفسير: الاختبار يلتقط 98 من كل 100 مصاب
الخصوصية: الجارديان
الصيغة
الخصوصية = TN / (TN + FP)
"من بين جميع الأصحاء، كم عدد الأشخاص الذين أنقذناهم؟"
مثال عملي: نفس اختبار COVID PCR
منح: تم اختبار 1000 شخص غير مصاب
TN = 999 (سلبي بشكل صحيح)، FP = 1 (إنذار كاذب)
النوعية = 999 / (999 + 1) = 999/1000 = 99.9%
التفسير: الاختبار بشكل صحيح يزيل 999 من كل 1000 شخص سليم
قواعد الذاكرة
متى يتم استخدام أي اختبار
ماذا تحتاج؟
استبعد المرض
استخدم حساسية عالية
↓
سنوتسلبي حساس = OUT
القاعدة في المرض
استخدم خصوصية عالية
↓
سبينإيجابية محددة = في
"الحساسية تصيب المرضى.
التخصيص ينقذ البئر.
ولكن لا يوجد اختبار يتقن كلاهما بشكل مثالي —
هذا هو العبء الذي نتحمله".
==================== الوحدة 6: مغالطة المعدل الأساسي ================
ألم تشاهد الطبيب
الذي رأى دقة 99%
واعتقد أن النتيجة الإيجابية تعني يقين 99%?
هذا هو الخطأ الأكثر دموية في الطب.
مغالطة المعدل الأساسي
اللغز
يصيب المرض شخصًا واحدًا من كل 1000 شخص.
الاختبار حساس بنسبة 99% ومحدد بنسبة 99%.
نتيجة اختبار المريض إيجابية.
ما هو احتمال إصابتهم بالمرض؟
يقول معظم الأطباء حوالي 99%. الجواب الحقيقي هو حوالي 9٪.
"وقال الطبيب دقيق بنسبة 99%"
وسمع المريض "مؤكد بنسبة 99%"،
وكلاهما خدع -
لأنهم نسوا أن يسألوا: ما مدى ندرة هذا المرض؟
==================== الوحدة 7: السل جينكسبرت ==================
هل لم تسمع عن الآلة
يمكنها العثور على مرض السل خلال ساعتين،
كان ذلك يسمى سلالات—
ولكن غاب عن مقاومة للأدوية ؟
قصة GeneXpert، جنوب أفريقيا
كيب تاون، 2010
وعلى مدى قرن من الزمان، تطلب تشخيص مرض السل زراعة البكتيريا لأسابيع. ثم جاء GeneXpert: النتائج ساعتان.
ونشرتها جنوب أفريقيا على الصعيد الوطني. وقد أيدته منظمة الصحة العالمية.
ولكن في المرضى الذين يعانون من الأحمال البكتيرية منخفضة- غالبًا ما تكون الإصابة بفيروس نقص المناعة البشرية - انخفضت الحساسية إلى 67%. غابت واحدة من كل ثلاث حالات.
أما بالنسبة للكشف عن مقاومة الريفامبيسين، فقد فشل 5% من الحالات المقاومة هؤلاء المرضى تلقوا العلاج الخاطئ. انتشار مرض السل المقاوم.
الإصابة بفيروس نقص المناعة البشرية (تثبيط المناعة)
الدرس
قد لا تتطابق حساسية الاختبار في التجارب السريرية مع حساسيته لدى مرضاك.
تعرف على عدد سكانك.
"وقالت الآلة" سلبي "،
وصدق الطبيب الآلة،
وعاد المريض إلى منزله مصابًا بالسل في رئتيه،
مقاومة السعال في العالم."
================================== الوحدة 8: الجدل حول دعم البرامج والإدارة
هل سمعت عن الاختبار للرجال
التي وجدت السرطانات التي من شأنها لا تقتل أبدًا,
وأدى إلى العلاجات التي تدمر حياة الناس?
مأساة فحص PSA
الولايات المتحدة، 1990-2010
يمكن لـ PSA (مستضد البروستاتا النوعي) اكتشاف سرطان البروستاتا مبكرًا.
قام الأطباء بفحص ملايين الرجال. تم العثور على السرطان. تمت إزالة البروستاتا.
لكن العديد من هذه "السرطانات" لم تكن لتتسبب في ظهور أعراض على الإطلاق. تسببت الجراحة العجز الجنسي وسلس البول في الرجال الذين
كان سيموت بسبب الشيخوخة، وليس السرطان.
موير فا. آن المتدرب ميد. 2012;157:120-134
أرقام الضرر
1
الحياة أنقذت من سرطان البروستاتا لكل 1000 فحص
30-40
جعل الرجال عاجزين أو منفلت لكل 1000 فحص
100+
إيجابيات كاذبة (الخزعات والقلق) لكل 1000 فحص
الانعكاس
وفي عام 2012، أوصت فرقة العمل المعنية بالخدمات الوقائية بالولايات المتحدة ضد
فحص PSA الروتيني. كان الاختبار هو العثور على الكثير مما لا يحتاج إلى العثور عليه.
مساعدة المريض على اتخاذ القرار: فحص PSA
إذا تم فحص 1000 رجل تتراوح أعمارهم بين 55 و69 عامًا لمدة 13 عامًا
تم منع الوفيات الناجمة عن سرطان البروستاتا
1-2 رجال
الرجال الذين سيكون لديهم نتائج إيجابية كاذبة يحتاجون إلى خزعة
100-120 رجل
الرجال الذين تم تشخيص إصابتهم بالسرطان لن يؤذيهم أبدًا
20-50 رجل
ترك الرجال عاجزين أو سلس البول من العلاج
30-40 رجل
هل هذه المقايضة مقبولة بالنسبة لك؟
"ووجد الاختبار الظل،
و قطع الجراح
وعاش الرجل — عاجزًا، وسلسًا —
من السرطان الذي لم يكن ليستيقظ أبداً."
==================== الوحدة 9: التروبونين والنوبات القلبية =====================
ألم تسمع عن الرجل الذي يعاني من ألم في الصدر
الذي كان أول تروبونين عادي,
الذي تم إرساله إلى المنزل -
ومات قبل الصباح؟
مشكلة توقيت التروبونين
أقسام الطوارئ في جميع أنحاء العالم
التروبونين هو المعيار الذهبي لتشخيص النوبات القلبية. ولكن الأمر يتطلب 3-6 ساعات للارتفاع بعد إصابة عضلة القلب.
يصل المريض بعد ساعة من بدء ألم الصدر. يتم اختبار التروبونين: عادي. "أنت بخير. اذهب إلى المنزل."
كان القلب يموت. البروتين لم يتسرب بعد
تظهر الدراسات 2-5% من مرضى احتشاء عضلة القلب الذين يتم إرسالهم إلى المنزل من قسم الطوارئ يموتون في غضون 30 يومًا.
البابا ج.ه. وآخرون. ن إنجل ي ميد. 2000;342:1163-1170
شجرة قرار الاختبار التسلسلي
بروتوكول ثنائي التروبونين
مريض آلام الصدر
↓
التروبونين الأول
↓
مرتفع
↓
تعامل على أنها MI
عادي
↓
متى بدأ الألم؟
<6 ساعات
انتظر 3 ساعاتكرر التروبونين
>6 hrs
مخاطر منخفضةفكر في d/c
تروبونين عالي الحساسية
~70%
التروبونين التقليدي حساسية عند 0 ساعة
~95%
hs-Troponin حساسية عند 0 ساعة
99%
hs-Troponin في 3 ساعات مسلسل
المقايضة
يلتقط التروبونين عالي الحساسية المزيد من النوبات القلبية مبكرًا. ولكن لديها أيضًا نتائج إيجابية كاذبة أكثر، حيث ترتفع في أمراض الكلى، وفشل القلب، والإنتان، والعدائين في الماراثون.
"والإختبار قال عادي"
لأن القلب قد بدأ للتو في الموت.
واطمأن المريض
وذهب إلى المنزل لينتهي من الموت."
==================== الوحدة 10: نسب الاحتمال ================
الحساسية تصف الاختبار.
تصف الخصوصية الاختبار.
لكن المريض يسأل: "لقد كانت نتيجة اختباري إيجابية. ما هي فرصي؟"
نسب الاحتمالية
نسبة الاحتمالية الإيجابية
LR+ = الحساسية / (1 - النوعية)
ما مدى احتمالية أن تكون النتيجة + مريضة مقابل صحية؟
نسبة الاحتمالية السلبية
LR- = (1 - الحساسية) / الخصوصية
ما مدى احتمالية حدوث نتيجة مريضة مقابل صحية؟
مخطط فاجان
من ما قبل الاختبار إلى احتمال ما بعد الاختبار
اختبار مسبق الاحتمالية
99%
50%
20%
5%
1%
الاحتمالية النسبة
100
10
1
0.1
0.01
بعد الاختبار الاحتمالية
99%
80%
50%
20%
1%
ارسم خطًا من الاختبار القبلي إلى LR لإيجاد احتمالية ما بعد الاختبار
تفسير نسب الاحتمال
ما مدى قوة هذا الاختبار؟
قيمة LR+؟
LR+ > 10قاعدة قوية
5-10معتدل
2-5Weak
1-2عديمة الفائدة
LR- القيمة؟
< 0.1استبعاد قوي
0.1-0.2معتدل
0.2-0.5Weak
0.5-1عديمة الفائدة
"الحساسية تحكي عن المرضى.
الخصوصية تحكي عن البئر.
لكن نسبة الاحتمال تجيب: ماذا تعني هذه النتيجة بالنسبة لهذا المريض؟"
====================================================================================================================== الوحدة 11
ألم ترَ الطفل المصاب بالحمى في القرية،
الاختبار السريع الذي قال سلبية,
و المتصورة التي ظلت تتضاعف؟
مشكلة الملاريا RDT
أفريقيا جنوب الصحراء الكبرى
وتقتل الملاريا 600 ألف شخص سنويا، معظمهم من الأطفال دون سن الخامسة.
كان الهدف من اختبارات التشخيص السريع هو توجيه العلاج في المناطق النائية دون مجاهر أو مختبرات.
ولكن عندما يكون طفيل الدم منخفضًايفتقد RDT الحالات. ومتى P. falciparum يحذف الجين HRP2
لا يرى RDT شيئًا على الإطلاق.
من. أداء اختبار الملاريا RDT. 2022
شجرة القرار السريري
طفل يعاني من الحمى في منطقة تتوطن فيها الملاريا
طفل محموم
↓
أداء RDT
↓
RDT إيجابي
↓
علاج الملاريا
RDT سلبي
↓
الشك السريري؟
High
علاج على أي حالأو الفحص المجهري
Low
بحثسبب آخر
تختلف الحساسية حسب طفيل الدم
95%
ارتفاع طفيل الدم (>200/μL)
75%
انخفاض طفيل الدم (100-200/μL)
50%
منخفض جدًا (<100/μL)
الدرس السريري
لا يستبعد اختبار RDT السلبي وجود الملاريا في المناطق الموبوءة.
يجب أن يتجاوز الحكم السريري الاختبار عندما يكون الشك عاليا
"وقال الاختبار "سلبي"،
وأرسل الطفل إلى المنزل،
وتكاثرت الطفيليات في الظلام،
وبحلول الصباح لم يستطع الطفل أن يستيقظ."
============================================================================================================ الوحدة 12
في عام الوباء،
كان العالم بحاجة إلى اختبار كان fast.
ولكن سريع ليس هو نفسه دقيق.
حكم كوكرين
اختبارات المستضدات السريعة لكوفيد-19 (155 دراسة)
سكان
الحساسية
غاب
بدون أعراض
73%
27%
بدون أعراض
55%
45%
أول 7 أيام
80%
20%
Dinnes J et al. Cochrane Database Syst Rev. 2022;7:CD013705
شجرة القرارات الأمنية الزائفة
عيد الشكر 2020: ما حدث
اختبارات أفراد العائلة سلبية
↓
سلبي حقا؟
55% إذا لم تظهر عليك أعراض
صحيح سلبيآمن للتجمع
45% إذا لم تظهر عليك أعراض
خطأ سلبيمعدي!
↓
يجتمع مع العائلةالأجداد مصابون
"وقال الاختبار "سلبي"،
و احتضنت العائلة
و بنهاية الشتاء
لقد دفن الجد".
==================== الوحدة 13: تصوير الثدي بالأشعة السينية =================
هل لم تسمع عن الفحص
التي وجدت السرطانات التي لن يقتل أبدًا,
وأدى إلى العلاجات التي يسبب ضررًا أكبر من المرض?
مشكلة الإفراط في التشخيص
3-4
إنقاذ حياة لكل 10000 تم فحصها
~15
تم تشخيصه بشكل مفرط (معالجة دون داعٍ)
~500
إنذارات كاذبة (قلق، خزعات)
السؤال
لإنقاذ 3-4 أرواح، تتلقى حوالي 15 امرأة الجراحة والإشعاع والعلاج الكيميائي لسرطانات لم تكن لتؤذيهن أبدًا.
فهل تستحق هذه المقايضة كل هذا العناء؟
مساعدة المريض على اتخاذ القرار: التصوير الشعاعي للثدي
إذا تم فحص 10000 امرأة تتراوح أعمارهن بين 50 و69 عامًا لمدة 10 سنوات
منع الوفيات الناجمة عن سرطان الثدي
3-4 نساء
اتصلت النساء مرة أخرى للحصول على إنذارات كاذبة
~ 500 امرأة
خزعات غير ضرورية
~200 امرأة
نساء يعالجن من سرطان لا يضرهن أبدا
~ 15 امرأة
هل الفحص مناسب لك؟
شجرة القرار المتتالية للفحص
تم فحص 10000 امرأة على مدى 10 سنوات
10,000 امرأة
↓
تم استدعاء 1000 تقريبًاغير طبيعي
↓
~500 خطأ إنذار
~500 خزعة ~50 السرطان
تم مسح 9000 تقريبًا
من بين 50 حالة سرطان تقريبًا
~ 35 سيقتل3-4 تم حفظه
~ 15 لن يقتل أبدًاتم تشخيصه بشكل مفرط
"ووجد الاختبار الظل،
وأطلقوا عليه اسم السرطان،
والمرأة قطعت وأحرقت
لظل لن يظلمها أبدًا أيام."
==================== الوحدة 14: أميلويد الزهايمر =====================
هل لم تسمع عن المسح
الذي يجد اللويحات في الدماغ،
ولكن لا أستطيع أن أقول لك
إذا كان العقل سوف fade?
مفارقة الأميلويد
أبحاث مرض الزهايمر، 2010-2020
يمكن الآن لفحوصات التصوير المقطعي بالإصدار البوزيتروني اكتشاف لويحات الأميلويد، وهي السمة المميزة لمرض الزهايمر.
But 30% من كبار السن ذوي القدرات المعرفية الطبيعية لديك لويحات اميلويد. وقد لا يصابون بالخرف أبدًا.
And 10-20% من المصابين بالخرف ليس لديهم أميلويد.
الاختبار يجد اللوحات. لكن اللويحات ليست المرض.
نحن نختبر البديل، وليس النتيجة.
جاك كر وآخرون. لانسيت نيورول. 2018;17:760-773
البديل مقابل شجرة القرار النتيجة
ما الذي نختبره حقًا؟
اختبار تشخيصي
↓
ماذا يكشف؟
النتيجة نفسها
التشخيص المباشرعلى سبيل المثال، خزعة للسرطان
↓
قيمة سريرية عالية
علامة بديلة
إشارة غير مباشرةعلى سبيل المثال، اميلويد للخرف
↓
الرابط مصدق؟
Yesاستخدم بحذر
Noقيمة محدودة
"ووجد المسح اللوحات،
وأطلق عليه الطبيب اسم الزهايمر،
والمريض يعيش في رعب
من النسيان الذي قد لا يأتي أبدًا."
============================================================================= الوحدة 15:
لا يتم إنشاء جميع الدراسات على قدم المساواة.
البعض كذلك متحيز.
البعض كذلك تصميم سيء.
البعض لا ينبغي أن يكون موثوق.
كيف نفصل القمح عن القشر؟
QUADAS-2: قائمة فحص الجودة
أربعة مجالات لخطر التحيز
1
اختيار المريض
هل تم تسجيل عينة متتالية أم عشوائية؟ هل تم تجنب تصميم الحالات والشواهد؟
2
اختبار الفهرس
هل تم تفسير الاختبار دون معرفة المعيار المرجعي؟ هل تم تحديد العتبة مسبقًا؟
3
المعيار المرجعي
هل من المحتمل أن يصنف المعيار المرجعي الحالة بشكل صحيح؟ هل تم تفسيره بشكل أعمى؟
4
التدفق والتوقيت
هل كانت هناك فترة زمنية مناسبة بين الاختبارات؟ هل حصل جميع المرضى على نفس المعيار المرجعي؟
QUADAS-2 شجرة القرار
هل يجب أن تثق بهذه الدراسة؟
دراسة DTA
↓
تحقق من جميع المجالات الأربعة
جميع المخاطر منخفضة
جودة عاليةنتائج الثقة
بعض غير واضح
معتدلاستخدم بحذر
أي مخاطر عالية
جودة منخفضةقد تكون النتائج متحيزة
التحيزات الشائعة في دراسات DTA
!
تحيز التحقق
الاختبارات الإيجابية فقط هي التي تحصل على المعيار المرجعي → تضخم الحساسية
!
التحيز الطيفي
يختلف مجتمع الدراسة عن الواقع السريري ← النتائج لا تعمم
!
التحيز التأسيسي
يعد اختبار الفهرس جزءًا من المعيار المرجعي → دقة عالية بشكل مصطنع
!
مراجعة التحيز
يتم تفسير اختبار الفهرس لمعرفة النتيجة المرجعية → يضخم كلا المقياسين
"قبل أن تثق بالأرقام،
اسأل: كيف تم جمعهم؟
دراسة متحيزة تتحدث بثقة -
لكن ثقتها كذبة."
==================== الوحدة 16: التحليل التلوي وSROC ================
دراسة واحدة قد تخدع.
دراسة واحدة قد تملق.
ولكن عندما تجمع كل الأدلة—
يصبح إخفاء الحقيقة أكثر صعوبة.
لماذا يختلف التحليل التلوي DTA
المشكلة
الحساسية والنوعية هي مرتبطة. وعندما يرتفع أحدهما، يميل الآخر إلى النزول.
لا يمكنك تجميعها بشكل منفصل مثل تأثيرات العلاج. أنت بحاجة إلى نموذج ثنائي المتغير.
منحنى SROC
ملخص خصائص تشغيل جهاز الاستقبال
الحساسية
1 - النوعية (المعدل الإيجابي الكاذب)
نقاط الدراسة
الدراسات الفردية
تقدير موجز
قراءة SROC
ماذا يخبرك المنحنى؟
موقف منحنى SROC
↓
الزاوية العلوية اليسرى
اختبار ممتازحواس عالية + المواصفات
بالقرب من قطري
اختبار عديمة الفائدةليس أفضل من الصدفة
نقاط متناثرة
عدم التجانس العاليالتحقيق في المصادر
"قد تخدع إحدى الدراسات.
العديد من الدراسات، وزنها معا،
تتبع طريق الحقيقة -
منحنى SROC الذي يكشف عما يمكن أن يفعله الاختبار حقًا."
==================== الوحدة 17: عدم التجانس ==============================================================================
ولكن ماذا لو كانت الدراسات لا توافق?
يقول أحدهم أن الحساسية هي 95%.
آخر يقول 60%.
ما هي الحقيقة التي تصدقها؟
مصادر عدم التجانس
لماذا تختلف الدراسات
نفس الاختبار ونتائج مختلفة؟
العتبةقطع مختلفة
سكانالشدة، العمر
الإعدادالابتدائي مقابل المتخصص
الجودةالتحيز، التعمية
قياس عدم الاتفاق: I²
I² < 25%
Low توافق الدراسات
I² 25-75%
معتدل بعض الاختلاف
I² > 75%
High خلاف كبير
التحذير
عندما يكون I² > 75%، قد يكون التقدير المجمع لا معنى له. اشرح الخلاف قبل المتوسط.
"عندما تختلف الدراسات،
لا تسكت المعارضة.
اسأل: لماذا يرون بشكل مختلف؟
الخلاف بحد ذاته يعلم."
==================== الوحدة 18: مجموعة الأدوات ====================
مجموعة أدوات DTA الخاصة بك
التدابير الأساسية ومتى استخدامها
القائمة المرجعية
✓
هل كان هناك معيار مرجعي صالح؟
هل يتم تطبيق المعيار الذهبي على جميع المرضى؟
✓
هل كان المترجمون أعمى؟
قراء الاختبار غير مدركين للتشخيص؟
✓
هل كان الطيف مناسبًا؟
المرضى مماثلة لسكانك؟
✓
هل تم تحديد العتبة مسبقًا؟
أو تم اختياره لتعظيم النتائج؟
عندما لا تتطابق النتائج مع الشك
شجرة قرارات التجاوز السريرية
اختبار سلبي، شك كبير
↓
ما هو LR-؟
LR- < 0.1
استبعاد قويتقبل السلبية
LR- 0.1-0.5
كرر الاختبارأو اختبار مختلف
LR- > 0.5
الثقة في الحكمالاختبار ضعيف
شجرة قرار الاختبار المتسلسل
عندما لا يكفي اختبار واحد
اختبار الفحص الأولي
↓
إيجابي
↓
اختبار تأكيديخصوصية عالية
↓
إيجابيتشخيص
سلبيإنذار كاذب
سلبي
↓
من المحتمل أن تكون سلبيةإذا فحص الاستشعار العالي
"مسلحين بالحساسية، والنوعية، والاحتمالية،
مسلح بـ SROC وقياس الاتفاق،
يمكنك أن ترى من خلال كذبة الاختبار -
واحكم على حقيقتها بنفسك."
==================== الوحدة 19: أخطاء نقل الدم ================
ألم تسمع عن المريض
الذي حصل على دم خاطئ,
ليس لأن الاختبار كان خاطئا،
ولكن لأن لم يقم به أحد?
الاختبار الذي لم يتم
المستشفيات في جميع أنحاء العالم
تكون فصيلة الدم ABO دقيقة بنسبة 100% تقريبًا عند إجرائها.
Yet لا تزال تفاعلات نقل الدم تقتل- ليس من الفشل في الاختبار، ولكن من الفشل البشري:
• سحب دم خاطئ من مريض خاطئ
• تم تبديل التسميات في المختبر
• تخطي فحص السرير في حالات الطوارئ
في المملكة المتحدة، 1 في 13000 عملية نقل دم يذهب إلى المريض الخطأ. نجح الاختبار. فشل النظام.
Bolton-Maggs PHB. ترانسفوس ميد. 2016;26:303-311
الاختبار مقابل شجرة قرار النظام
أين يمكن أن تسوء الأمور؟
عملية التشخيص
↓
مصدر الخطأ؟
اختبار نفسه
خطأ تحليليمشكلة Sens/Spec
↓
مطلوب اختبار أفضل
خطأ في معرف ما قبل التحليل
عينة خاطئةID error
↓
يلزم إصلاح النظام
انحياز ما بعد التحليل
عمل خاطئالإبلاغ عن خطأ
↓
إصلاح العملية اللازمة
"الاختبار المثالي لا يعني شيئًا
إذا تم سحب الدم الخطأ،
تم تطبيق التسمية الخاطئة،
الحقيبة الخاطئة معلقة."
تقيس دراسات DTA دقة الاختبار. أنها لا تقيس دقة النظام.
============================================================================================= الوحدة 20:
هل لم تشاهد الخوارزمية
التي تعلمت منها بيانات متحيزة,
ونشر هذا التحيز
to كل مريض لمسته?
ثورة التشخيص بالذكاء الاصطناعي
ستانفورد آند بيوند، 2017 إلى الوقت الحاضر
تتطابق خوارزميات التعلم العميق الآن مع أطباء الجلد في اكتشاف سرطان الجلد.
لكن بيانات التدريب كانت البشرة الفاتحة في الغالب. على البشرة الداكنة، انخفض الأداء بشكل ملحوظ.
لقد تعلمت الخوارزمية الأنماط، ولكنها تعلمت أيضًا biases.
وعندما تم نشره دون التحقق من الصحة الخارجية، كان أداؤه أسوأ من المتوقع لأن لم يتطابق مجتمع التدريب مع المجتمع السريري.
التمييز (AUC/ROC): هل يستطيع الذكاء الاصطناعي تصنيف المرضى حسب المخاطر؟
المعايرة: عندما يقول الذكاء الاصطناعي "خطر بنسبة 80%"، هل يعاني 80% من المرض بالفعل؟
العديد من أدوات الذكاء الاصطناعي لديها AUC جيد ولكن معايرة سيئة. هذه هي مغالطة المعدل الأساسي في شكل خوارزمي.
AUC
هل يمكن أن يحصل على التصنيف؟ (يتم الإبلاغ عنه عادةً)
CAL
هل الاحتمال دقيق؟ (غالبًا ما يتم تجاهله)
"وتعلمت الخوارزمية من البيانات،
وكانت البيانات متحيزة،
وانتشر التحيز إلى كل تنبؤ -
ولم يسأل أحد: من الذي غاب عن مجموعة التدريب؟
==================== الوحدة 21: التواصل مع المريض ================
يسأل المريض: "هل اختباري إيجابي؟"
لكن ما يقصدونه هو: "هل أنا مصاب بالمرض؟"
كيف يمكنك سد هذه الفجوة؟
نصوص الاتصال
النص 1: شرح نتيجة إيجابية
"جاء اختبارك إيجابيًا. لكني أريد أن أشرح ما يعنيه ذلك."
"هذا الاختبار جيد في العثور على الأشخاص الذين يعانون من هذه الحالة، ولكنه يحتوي أيضًا على إنذارات كاذبة."
"استنادًا إلى عوامل الخطر لديك، هناك حوالي [X]% فرصة أن يكون هذا أمرًا إيجابيًا حقيقيًا."
"سنجري اختبارًا تأكيديًا للتأكد قبل أي علاج."
نصوص الاتصال
النص 2: شرح نتيجة سلبية (شك كبير)
"جاء اختبارك سلبيًا، لكنني لا أزال أشعر بالقلق."
"هذا الاختبار يمكن أن يغيب عن الحالات، وخاصة في وقت مبكر من المرض."
"نظرًا للأعراض التي تعاني منها، أود إما تكرار الاختبار في غضون أيام قليلة، أو تجربة اختبار مختلف."
"لا يعني الاختبار السلبي دائمًا أنك سليم -الأعراض الخاصة بك مهمة أيضا."
شجرة قرارات الاتصال
كيفية شرح نتائج الاختبار
نتيجة الاختبار
↓
إيجابي
↓
PPV?
>90%"من المحتمل جدًا أن يكون هذا صحيحًا"
<90%"بحاجة إلى تأكيد"
سلبي
↓
NPV?
>95%"مطمئن للغاية"
<95%"ما زلت تراقب الأعراض"
أسئلة لطرحها على طبيبك
1
"ما مدى دقة هذا الاختبار؟"
اطلب الحساسية والنوعية بلغة واضحة
2
"ماذا لو كانت النتيجة خاطئة؟"
فهم عواقب الإيجابيات والسلبيات الكاذبة
3
"ماذا سيحدث بعد ذلك؟"
هل سيكون هناك اختبار تأكيدي؟
4
"ماذا لو لم أخضع للاختبار على الإطلاق؟"
افهم المفاضلات بين الاختبار وعدم الاختبار
"الاختبار يتحدث بالأرقام.
يسمع المريض في المخاوف والآمال.
مهمة المعالج هي الترجمة
لسد الفجوة بين الإحصاء والروح."
==================== الوحدة 22: فعالية التكلفة والدرجة ===============
قد يكون الاختبار دقيقًا.
ولكن هل يستحق كل هذا العناء?
ما هي التكلفة — من المال،
من القلق، والأذى؟
عتبة الاختبار والعلاج
متى يكون الاختبار مفيدًا؟
احتمالية ما قبل الاختبار
↓
منخفضة جدًا
أقل من حد الاختبارلا تختبر، طمأن
متوسط
منطقة الاختبارسيغير الاختبار الإدارة
مرتفع جدًا
فوق عتبة العلاجلا تختبر، عالج
المبدأ
اختبر فقط عندما تكون النتيجة تغيير ما تفعله. إذا كنت ستعالج بغض النظر عن ذلك، أو لا تعالج بغض النظر عن ذلك، فلماذا تجرى الاختبار؟
درجة جودة الأدلة
تصنيف أدلة DTA
⊕⊕⊕⊕
HIGH
دراسات متعددة عالية الجودة، نتائج متسقة، قابلة للتطبيق مباشرة
⊕⊕⊕○
متوسط
بعض القيود في جودة الدراسة أو اتساقها أو قابليتها للتطبيق
⊕⊕○○
LOW
قيود خطيرة - قد تحتاج إلى خفض مستوى التوصيات
⊕○○○
منخفض جدًا
قيود خطيرة جدًا - الأدلة غير مؤكدة
تحليل عواقب التكلفة
مثال: الفحص الشامل مقابل الفحص المستهدف
التكلفة لكل حالة تم اكتشافها (عالمي)
$50,000
التكلفة لكل حالة تم اكتشافها (عالية الخطورة فقط)
$5,000
الحالات التي غاب عنها النهج المستهدف
~10%
إيجابيات كاذبة تجنبها المستهدفة
~90%
ما هو النهج المناسب لسكانك؟
"الاختبار ليس دقيقًا أو غير دقيق فقط.
لها تكاليف – في المال، في القلق، في الأذى.
والطبيب الحكيم يزن كل هذه الأمور:
والاختبارات فقط عندما يخدم الاختبار المريض."
==================== الوحدة 23: SROC المتقدم =================
يظهر منحنى SROC حيث ينفذ الاختبار.
لكن كيف معين هل نحن كذلك؟
وكم سيكون ذلك vary عمليا؟
مناطق الثقة مقابل مناطق التنبؤ
نوعان من عدم اليقين
95% CI (تقدير موجز)
95% التنبؤ (الدراسات المستقبلية)
ما تخبرك به كل منطقة
CI
منطقة الثقة (شكل ناقص أصغر)
حيث أننا واثقون بنسبة 95% من أن المتوسط الحقيقي تكمن في الحساسية/النوعية. عدم اليقين بشأن ملخص التقدير.
PI
منطقة التنبؤ (القطع الناقص الأكبر)
حيث نتوقع 95% من الدراسات المستقبلية للهبوط. حسابات عدم التجانس بين الدراسات.
الآثار السريرية
إذا كانت منطقة التنبؤ كبيرة، فقد يؤدي الاختبار بشكل مختلف تمامًا في الإعداد الخاص بك عما يقترحه المتوسط.
التنبؤ الواسع = عدم التجانس العالي = التحقيق في المصادر.
تفسير النموذج ثنائي المتغير
قراءة نتائج التحليل التلوي
ملخص الاستشعار/المواصفات
↓
تحقق من المناطق
CI ضيق، PI ضيق
متسقالوثوق بالمتوسط
CI ضيق، PI واسع
غير متجانسقد لا يكون المتوسط تطبيق
CI واسع
غير مؤكدبحاجة إلى مزيد من الدراسات
"تخبرك منطقة الثقة: ما مدى تأكدنا؟
تخبرك منطقة التنبؤ: إلى أي مدى ستختلف؟
كلا السؤالين مهمين -
قد لا يكون الاختبار الذي تستخدمه غدًا هو الاختبار متوسط."