================================== الوحدة 1: الاحتيال (ثيرانوس)
ألم تسمع حكاية المرأة
الذي وعد به غير العالم بقطرة دم,
الذي جمع المليارات في اختبار ذلك لم تعمل قط?
بالو ألتو، 2003
جامعة ستانفورد
ترك شاب في التاسعة عشرة من عمره رؤيا: مئات اختبارات الدم من قطرة واحدة.

يعتقد المستثمرون. يعتقد والجرينز. يعتقد البنتاغون.

أعطوها 9 مليارات دولار.

لكن الاختبارات أعطت نتائج خاطئة. قيل للمرضى أنهم مصابون بفيروس نقص المناعة البشرية بينما لم يكونوا كذلك. قيل للمرضى أن دمائهم كانت طبيعية عندما كانوا كذلك الموت.
كاريرو جي. الدم الفاسد. 2018
شجرة القرار في الخداع

ما فعله ثيرانوس مقابل ما يجب أن يحدث

اختبار تشخيصي جديد
ينبغي أن تفعل
التحقق من صحة ضد معيار الذهب
نشر TP/FP/FN/TN
موافقة ادارة الاغذية والعقاقير
فعل ثيرانوس
تخطي التحقق من الصحة
إخفاء حالات الفشل
ضرر المرضى
"وكذب الاختبار،
ولبس الكذب يقينًا،
ولم يطلب أحد طاولة 2 × 2."

هذا هو السبب في أننا ندرس دقة الاختبار التشخيصي.

=================== الوحدة 2: النتائج الأربعة ====================
عندما يتكلم الاختبار
هناك فقط أربع حقائق محتملة.

اثنتين بركات. اثنان لعنات.
شجرة النتائج

كل نتيجة اختبار لها حقيقة وراءها

تم اختبار المريض
ما هي الحقيقة؟
لديه مرض
D+
TPاختبار +
FNامتحان -
لا يوجد مرض
D-
FPاختبار +
TNامتحان -
المائدة المقدسة 2×2

مثال على الاختبار السريع لفيروس نقص المناعة البشرية (بيانات حقيقية)

HIV+HIV-المجموع
اختبار +983101
امتحان -2895897
المجموع100898998
من هذا الجدول تأتي كل الحقيقة
الحساسية = 98/100 = 98%
الخصوصية = 895/898 = 99.7%
"نتيجتان تنقذان، ونتيجتان تضران.
TP, TN: الاختبار تحدث صحيح.
FP، FN: كذب الاختبار.
اعرفهم بالاسم، فإنهم يحددون المصير".
==================== الوحدة 3: فترة نافذة فيروس نقص المناعة البشرية ====================
أما سمعتم بالدم الذي اختبر،
وجد ينظف,
وأعطيت للآلاف
بينما سبح الموت بداخلها?
أزمة إمدادات الدم، 1985
الولايات المتحدة
وعندما بدأ اختبار فيروس نقص المناعة البشرية، احتفل الأطباء: فقد أصبح بإمكانهم الآن فحص إمدادات الدم.

لكن الاختبار كان له فترة النافذة- بعد أسابيع من الإصابة عندما كان الفيروس موجودًا ولكن غير قابل للكشف.

تم اختبار الدم. كان الدم "سلبيا". تم نقل الدم.

8000-12000 أمريكي أصيبوا بالعدوى من خلال عمليات نقل الدم قبل أن تغلق الاختبارات الأفضل النافذة.
مركز السيطرة على الأمراض. معدل وفيات الأمهات. 198;36(49):833-840
شجرة قرارات فترة النافذة

لماذا السلبيات الكاذبة مميتة

الشخص المصاب مؤخرًا
الوقت منذ الإصابة؟
< 2 أسابيع
اختبار سلبيفيروس موجود!
تم التبرع بالدممصابون آخرون
> 4 أسابيع
اختبار إيجابيتم اكتشافه بشكل صحيح
تم التخلص من الدمإمدادات آمنة
تتغير الحساسية مع مرور الوقت
0%
اليوم 1-7
فترة الكسوف
~50%
اليوم 14
التحويل المصلي
~95%
اليوم 21
تم اكتشاف أكثر
99.9%
اليوم 45+
نافذة مغلقة
الدرس
الحساسية ليست ثابتة. ذلك يعتمد على when قمت بالاختبار. قد يكون الاختبار "حساس بنسبة 99%" حساسًا بنسبة 0% في الإصابة المبكرة.
"وقال الاختبار "نظيف"
لأن الفيروس لم يظهر وجهه بعد.
والدماء كانت مشتركة
وانتشرت العدوى إلى الأبرياء".
======================================= الوحدة 4:
ألم تسمع عن حبوب منع الحمل التي تعطى للأمهات؟
to يحمون حملهم,
الذين زرعوا السرطان في بناتهم
قبل عشرين عاما من إزهاره؟
مأساة DES، 1938-1971
الولايات المتحدة وأوروبا
تم إعطاء ثنائي إيثيلستيلبيسترول (DES) لملايين النساء الحوامل لمنع الإجهاض.

لم يتم إجراء أي تجربة سريرية مناسبة على الإطلاق. الأطباء يفترض نجح الأمر لأنه بدا معقولاً.

بعد عقود، أصيبت بناتهما بسرطان نادر: سرطان غدي الخلايا الصافية في المهبل. كان السرطان نادرًا جدًا وكان بمثابة إشارة تشخيصية في حد ذاته.

5-10 مليون امرأة تعرضوا. الضرر عبر الأجيال.
هيربست آل وآخرون. ن إنجل ي ميد. 1971;284:878-881
شجرة قرار التحقق من الصحة

ما الذي كان يجب أن يحدث

تدخل طبي جديد
هل تم اختباره بشكل صحيح؟
YES
تجربة عشوائية
متابعة طويلة الأمد
معرفة التأثيرات الحقيقيةالفوائد والأضرار
NO (DES)
الافتراض فقط
الاستخدام واسع النطاق
ضرر خفياكتشف بعد فوات الأوان
الإشارة التشخيصية
عندما تصبح الندرة دليلاً
كان سرطان الخلايا الغدية الشفاف في المهبل نادرًا جدًا عند النساء الشابات 7 حالات في مستشفى واحد أثار التحقيق.

كانت المجموعة نفسها هي الاختبار التشخيصي:
الحساسية للتعرض لـ DES: ما يقرب من 100%
إذا كنت مصابًا بهذا السرطان في هذا العمر، فمن المؤكد تقريبًا أنك تعرضت له.
1:1000
خطر الخلية الواضحة
السرطان في بنات DES
5-10M
النساء مكشوفات
في جميع أنحاء العالم
"وأخذت الأمهات الحبة على أمل،
ونبتت البنات في الظل،
وبعد عشرين عاما تفشى السرطان..
التشخيص الذي اتهم جيلا من الطب."
==================== الوحدة 5: الحساسية والنوعية ==========================================
الاختبار له فضيلتان ورذيلتان.

الحساسية: هل يمكن العثور على المرضى؟

الخصوصية: هل يمكن الاستغناء عن الأصحاء؟
الحساسية: الصياد
الصيغة
الحساسية = TP / (TP + FN)
"من بين جميع المرضى، كم عدد الذين قبضنا عليهم؟"

مثال عملي: اختبار COVID PCR

منح: تم اختبار 200 مريض مصاب
TP = 196 (إيجابي بشكل صحيح)، FN = 4 (ضائع)
الحساسية = 196 / (196 + 4) = 196/200 = 98%
التفسير: الاختبار يلتقط 98 من كل 100 مصاب
الخصوصية: الجارديان
الصيغة
الخصوصية = TN / (TN + FP)
"من بين جميع الأصحاء، كم عدد الأشخاص الذين أنقذناهم؟"

مثال عملي: نفس اختبار COVID PCR

منح: تم اختبار 1000 شخص غير مصاب
TN = 999 (سلبي بشكل صحيح)، FP = 1 (إنذار كاذب)
النوعية = 999 / (999 + 1) = 999/1000 = 99.9%
التفسير: الاختبار بشكل صحيح يزيل 999 من كل 1000 شخص سليم
قواعد الذاكرة

متى يتم استخدام أي اختبار

ماذا تحتاج؟
استبعد المرض
استخدم حساسية عالية
سنوتسلبي حساس = OUT
القاعدة في المرض
استخدم خصوصية عالية
سبينإيجابية محددة = في
"الحساسية تصيب المرضى.
التخصيص ينقذ البئر.
ولكن لا يوجد اختبار يتقن كلاهما بشكل مثالي —
هذا هو العبء الذي نتحمله".
==================== الوحدة 6: مغالطة المعدل الأساسي ================
ألم تشاهد الطبيب
الذي رأى دقة 99%
واعتقد أن النتيجة الإيجابية تعني يقين 99%?

هذا هو الخطأ الأكثر دموية في الطب.
مغالطة المعدل الأساسي
اللغز
يصيب المرض شخصًا واحدًا من كل 1000 شخص.
الاختبار حساس بنسبة 99% ومحدد بنسبة 99%.
نتيجة اختبار المريض إيجابية.

ما هو احتمال إصابتهم بالمرض؟

يقول معظم الأطباء حوالي 99%. الجواب الحقيقي هو حوالي 9٪.
كشفت الرياضيات

اختبار 100000 شخص (الانتشار 1/1000)

الخطوة 1: 100 مصابون بالمرض، 99900 سليم
الخطوة 2: من 100 مريض: 99 اختبار إيجابي (TP)، 1 سلبي (FN)
الخطوة 3: من 99900 سليم: 999 اختبار إيجابي (FP)، 98,901 سلبي (TN)
الخطوة 4: إجمالي الإيجابيات = 99 + 999 = 1,098
PPV = TP / جميع الإيجابيات = 99 / 1,098 = 9%
91% من النتائج الإيجابية هي نتائج إيجابية كاذبة!
حاسبة المعدل الأساسي التفاعلية

انظر كيف يغير الانتشار PPV

الانتشار:
1%
الحساسية:
99%
الخصوصية:
99%
9%
القيمة التنبؤية الإيجابية (PPV)
91% من النتائج الإيجابية هي إنذارات كاذبة
شجرة القرار للانتشار

نفس الاختبار، إعدادات مختلفة

الاختبار: 99% Sens، 99% Spec
أين يتم الاختبار؟
جنرال بوب
0.1%
PPV = 9%91% خطأ +
عالي المخاطر
10%
PPV = 92%8% خطأ +
تأكيدي
50%
PPV = 99%1% كاذبة +
"وقال الطبيب دقيق بنسبة 99%"
وسمع المريض "مؤكد بنسبة 99%"،
وكلاهما خدع -
لأنهم نسوا أن يسألوا: ما مدى ندرة هذا المرض؟
==================== الوحدة 7: السل جينكسبرت ==================
هل لم تسمع عن الآلة
يمكنها العثور على مرض السل خلال ساعتين،
كان ذلك يسمى سلالات
ولكن غاب عن مقاومة للأدوية ؟
قصة GeneXpert، جنوب أفريقيا
كيب تاون، 2010
وعلى مدى قرن من الزمان، تطلب تشخيص مرض السل زراعة البكتيريا لأسابيع. ثم جاء GeneXpert: النتائج ساعتان.

ونشرتها جنوب أفريقيا على الصعيد الوطني. وقد أيدته منظمة الصحة العالمية.

ولكن في المرضى الذين يعانون من الأحمال البكتيرية منخفضة- غالبًا ما تكون الإصابة بفيروس نقص المناعة البشرية - انخفضت الحساسية إلى 67%. غابت واحدة من كل ثلاث حالات.

أما بالنسبة للكشف عن مقاومة الريفامبيسين، فقد فشل 5% من الحالات المقاومة هؤلاء المرضى تلقوا العلاج الخاطئ. انتشار مرض السل المقاوم.
ستينجارت KR وآخرون. Cochrane Database Syst Rev. 2014;1:CD009593
شجرة قرارات تشخيص مرض السل

عندما لا يكون GeneXpert كافيًا

مريض السل المشتبه به
اختبار جين اكسبرت
إيجابي
ريفامبيسين؟
حساسقياسي Tx
مقاومMDR-TB Tx
سلبي
فيروس نقص المناعة البشرية + أو اشتباه كبير؟
Yesالثقافة مطلوبة
Noمن المحتمل أن تكون سلبية
الحساسية حسب نوع المريض
98%
مسحة إيجابية
(حمولة بكتيرية عالية)
67%
مسحة سلبية
(حمولة بكتيرية منخفضة)
61%
الإصابة بفيروس نقص المناعة البشرية
(تثبيط المناعة)
الدرس
قد لا تتطابق حساسية الاختبار في التجارب السريرية مع حساسيته لدى مرضاك. تعرف على عدد سكانك.
"وقالت الآلة" سلبي "،
وصدق الطبيب الآلة،
وعاد المريض إلى منزله مصابًا بالسل في رئتيه،
مقاومة السعال في العالم."
================================== الوحدة 8: الجدل حول دعم البرامج والإدارة
هل سمعت عن الاختبار للرجال
التي وجدت السرطانات التي من شأنها لا تقتل أبدًا,
وأدى إلى العلاجات التي تدمر حياة الناس?
مأساة فحص PSA
الولايات المتحدة، 1990-2010
يمكن لـ PSA (مستضد البروستاتا النوعي) اكتشاف سرطان البروستاتا مبكرًا.

قام الأطباء بفحص ملايين الرجال. تم العثور على السرطان. تمت إزالة البروستاتا.

لكن العديد من هذه "السرطانات" لم تكن لتتسبب في ظهور أعراض على الإطلاق. تسببت الجراحة العجز الجنسي وسلس البول في الرجال الذين كان سيموت بسبب الشيخوخة، وليس السرطان.
موير فا. آن المتدرب ميد. 2012;157:120-134
أرقام الضرر
1
الحياة أنقذت من
سرطان البروستاتا
لكل 1000 فحص
30-40
جعل الرجال عاجزين
أو منفلت
لكل 1000 فحص
100+
إيجابيات كاذبة
(الخزعات والقلق)
لكل 1000 فحص
الانعكاس
وفي عام 2012، أوصت فرقة العمل المعنية بالخدمات الوقائية بالولايات المتحدة ضد فحص PSA الروتيني. كان الاختبار هو العثور على الكثير مما لا يحتاج إلى العثور عليه.
مساعدة المريض على اتخاذ القرار: فحص PSA

إذا تم فحص 1000 رجل تتراوح أعمارهم بين 55 و69 عامًا لمدة 13 عامًا

تم منع الوفيات الناجمة عن سرطان البروستاتا
1-2 رجال
الرجال الذين سيكون لديهم نتائج إيجابية كاذبة يحتاجون إلى خزعة
100-120 رجل
الرجال الذين تم تشخيص إصابتهم بالسرطان لن يؤذيهم أبدًا
20-50 رجل
ترك الرجال عاجزين أو سلس البول من العلاج
30-40 رجل
هل هذه المقايضة مقبولة بالنسبة لك؟
"ووجد الاختبار الظل،
و قطع الجراح
وعاش الرجل — عاجزًا، وسلسًا —
من السرطان الذي لم يكن ليستيقظ أبداً."
==================== الوحدة 9: التروبونين والنوبات القلبية =====================
ألم تسمع عن الرجل الذي يعاني من ألم في الصدر
الذي كان أول تروبونين عادي,
الذي تم إرساله إلى المنزل -
ومات قبل الصباح؟
مشكلة توقيت التروبونين
أقسام الطوارئ في جميع أنحاء العالم
التروبونين هو المعيار الذهبي لتشخيص النوبات القلبية. ولكن الأمر يتطلب 3-6 ساعات للارتفاع بعد إصابة عضلة القلب.

يصل المريض بعد ساعة من بدء ألم الصدر. يتم اختبار التروبونين: عادي. "أنت بخير. اذهب إلى المنزل."

كان القلب يموت. البروتين لم يتسرب بعد

تظهر الدراسات 2-5% من مرضى احتشاء عضلة القلب الذين يتم إرسالهم إلى المنزل من قسم الطوارئ يموتون في غضون 30 يومًا.
البابا ج.ه. وآخرون. ن إنجل ي ميد. 2000;342:1163-1170
شجرة قرار الاختبار التسلسلي

بروتوكول ثنائي التروبونين

مريض آلام الصدر
التروبونين الأول
مرتفع
تعامل على أنها MI
عادي
متى بدأ الألم؟
<6 ساعات
انتظر 3 ساعاتكرر التروبونين
>6 hrs
مخاطر منخفضةفكر في d/c
تروبونين عالي الحساسية
~70%
التروبونين التقليدي
حساسية عند 0 ساعة
~95%
hs-Troponin
حساسية عند 0 ساعة
99%
hs-Troponin
في 3 ساعات مسلسل
المقايضة
يلتقط التروبونين عالي الحساسية المزيد من النوبات القلبية مبكرًا. ولكن لديها أيضًا نتائج إيجابية كاذبة أكثر، حيث ترتفع في أمراض الكلى، وفشل القلب، والإنتان، والعدائين في الماراثون.
"والإختبار قال عادي"
لأن القلب قد بدأ للتو في الموت.
واطمأن المريض
وذهب إلى المنزل لينتهي من الموت."
==================== الوحدة 10: نسب الاحتمال ================
الحساسية تصف الاختبار.
تصف الخصوصية الاختبار.

لكن المريض يسأل:
"لقد كانت نتيجة اختباري إيجابية. ما هي فرصي؟"
نسب الاحتمالية
نسبة الاحتمالية الإيجابية
LR+ = الحساسية / (1 - النوعية)
ما مدى احتمالية أن تكون النتيجة + مريضة مقابل صحية؟
نسبة الاحتمالية السلبية
LR- = (1 - الحساسية) / الخصوصية
ما مدى احتمالية حدوث نتيجة مريضة مقابل صحية؟
مخطط فاجان

من ما قبل الاختبار إلى احتمال ما بعد الاختبار

اختبار مسبق
الاحتمالية
99%
50%
20%
5%
1%
الاحتمالية
النسبة
100
10
1
0.1
0.01
بعد الاختبار
الاحتمالية
99%
80%
50%
20%
1%
ارسم خطًا من الاختبار القبلي إلى LR لإيجاد احتمالية ما بعد الاختبار
تفسير نسب الاحتمال

ما مدى قوة هذا الاختبار؟

قيمة LR+؟
LR+ > 10قاعدة قوية
5-10معتدل
2-5Weak
1-2عديمة الفائدة
LR- القيمة؟
< 0.1استبعاد قوي
0.1-0.2معتدل
0.2-0.5Weak
0.5-1عديمة الفائدة
"الحساسية تحكي عن المرضى.
الخصوصية تحكي عن البئر.
لكن نسبة الاحتمال تجيب:
ماذا تعني هذه النتيجة بالنسبة لهذا المريض؟"
====================================================================================================================== الوحدة 11
ألم ترَ الطفل المصاب بالحمى في القرية،
الاختبار السريع الذي قال سلبية,
و المتصورة التي ظلت تتضاعف؟
مشكلة الملاريا RDT
أفريقيا جنوب الصحراء الكبرى
وتقتل الملاريا 600 ألف شخص سنويا، معظمهم من الأطفال دون سن الخامسة.

كان الهدف من اختبارات التشخيص السريع هو توجيه العلاج في المناطق النائية دون مجاهر أو مختبرات.

ولكن عندما يكون طفيل الدم منخفضًايفتقد RDT الحالات. ومتى P. falciparum يحذف الجين HRP2 لا يرى RDT شيئًا على الإطلاق.
من. أداء اختبار الملاريا RDT. 2022
شجرة القرار السريري

طفل يعاني من الحمى في منطقة تتوطن فيها الملاريا

طفل محموم
أداء RDT
RDT إيجابي
علاج الملاريا
RDT سلبي
الشك السريري؟
High
علاج على أي حالأو الفحص المجهري
Low
بحثسبب آخر
تختلف الحساسية حسب طفيل الدم
95%
ارتفاع طفيل الدم
(>200/μL)
75%
انخفاض طفيل الدم
(100-200/μL)
50%
منخفض جدًا
(<100/μL)
الدرس السريري
لا يستبعد اختبار RDT السلبي وجود الملاريا في المناطق الموبوءة. يجب أن يتجاوز الحكم السريري الاختبار عندما يكون الشك عاليا
"وقال الاختبار "سلبي"،
وأرسل الطفل إلى المنزل،
وتكاثرت الطفيليات في الظلام،
وبحلول الصباح لم يستطع الطفل أن يستيقظ."
============================================================================================================ الوحدة 12
في عام الوباء،
كان العالم بحاجة إلى اختبار كان fast.

ولكن سريع ليس هو نفسه دقيق.
حكم كوكرين

اختبارات المستضدات السريعة لكوفيد-19 (155 دراسة)

سكانالحساسيةغاب
بدون أعراض73%27%
بدون أعراض55%45%
أول 7 أيام80%20%

Dinnes J et al. Cochrane Database Syst Rev. 2022;7:CD013705

شجرة القرارات الأمنية الزائفة

عيد الشكر 2020: ما حدث

اختبارات أفراد العائلة سلبية
سلبي حقا؟
55% إذا لم تظهر عليك أعراض
صحيح سلبيآمن للتجمع
45% إذا لم تظهر عليك أعراض
خطأ سلبيمعدي!
يجتمع مع العائلةالأجداد مصابون
"وقال الاختبار "سلبي"،
و احتضنت العائلة
و بنهاية الشتاء
لقد دفن الجد".
==================== الوحدة 13: تصوير الثدي بالأشعة السينية =================
هل لم تسمع عن الفحص
التي وجدت السرطانات التي لن يقتل أبدًا,
وأدى إلى العلاجات التي يسبب ضررًا أكبر من المرض?
مشكلة الإفراط في التشخيص
3-4
إنقاذ حياة
لكل 10000 تم فحصها
~15
تم تشخيصه بشكل مفرط
(معالجة دون داعٍ)
~500
إنذارات كاذبة
(قلق، خزعات)
السؤال
لإنقاذ 3-4 أرواح، تتلقى حوالي 15 امرأة الجراحة والإشعاع والعلاج الكيميائي لسرطانات لم تكن لتؤذيهن أبدًا.

فهل تستحق هذه المقايضة كل هذا العناء؟
مساعدة المريض على اتخاذ القرار: التصوير الشعاعي للثدي

إذا تم فحص 10000 امرأة تتراوح أعمارهن بين 50 و69 عامًا لمدة 10 سنوات

منع الوفيات الناجمة عن سرطان الثدي
3-4 نساء
اتصلت النساء مرة أخرى للحصول على إنذارات كاذبة
~ 500 امرأة
خزعات غير ضرورية
~200 امرأة
نساء يعالجن من سرطان لا يضرهن أبدا
~ 15 امرأة
هل الفحص مناسب لك؟
شجرة القرار المتتالية للفحص

تم فحص 10000 امرأة على مدى 10 سنوات

10,000 امرأة
تم استدعاء 1000 تقريبًاغير طبيعي
~500 خطأ
إنذار
~500 خزعة
~50 السرطان
تم مسح 9000 تقريبًا
من بين 50 حالة سرطان تقريبًا
~ 35 سيقتل3-4 تم حفظه
~ 15 لن يقتل أبدًاتم تشخيصه بشكل مفرط
"ووجد الاختبار الظل،
وأطلقوا عليه اسم السرطان،
والمرأة قطعت وأحرقت
لظل لن يظلمها أبدًا أيام."
==================== الوحدة 14: أميلويد الزهايمر =====================
هل لم تسمع عن المسح
الذي يجد اللويحات في الدماغ،
ولكن لا أستطيع أن أقول لك
إذا كان العقل سوف fade?
مفارقة الأميلويد
أبحاث مرض الزهايمر، 2010-2020
يمكن الآن لفحوصات التصوير المقطعي بالإصدار البوزيتروني اكتشاف لويحات الأميلويد، وهي السمة المميزة لمرض الزهايمر.

But 30% من كبار السن ذوي القدرات المعرفية الطبيعية لديك لويحات اميلويد. وقد لا يصابون بالخرف أبدًا.

And 10-20% من المصابين بالخرف ليس لديهم أميلويد.

الاختبار يجد اللوحات. لكن اللويحات ليست المرض. نحن نختبر البديل، وليس النتيجة.
جاك كر وآخرون. لانسيت نيورول. 2018;17:760-773
البديل مقابل شجرة القرار النتيجة

ما الذي نختبره حقًا؟

اختبار تشخيصي
ماذا يكشف؟
النتيجة نفسها
التشخيص المباشرعلى سبيل المثال، خزعة للسرطان
قيمة سريرية عالية
علامة بديلة
إشارة غير مباشرةعلى سبيل المثال، اميلويد للخرف
الرابط مصدق؟
Yesاستخدم بحذر
Noقيمة محدودة
"ووجد المسح اللوحات،
وأطلق عليه الطبيب اسم الزهايمر،
والمريض يعيش في رعب
من النسيان الذي قد لا يأتي أبدًا."
============================================================================= الوحدة 15:
لا يتم إنشاء جميع الدراسات على قدم المساواة.

البعض كذلك متحيز.
البعض كذلك تصميم سيء.
البعض لا ينبغي أن يكون موثوق.

كيف نفصل القمح عن القشر؟
QUADAS-2: قائمة فحص الجودة

أربعة مجالات لخطر التحيز

1
اختيار المريض

هل تم تسجيل عينة متتالية أم عشوائية؟ هل تم تجنب تصميم الحالات والشواهد؟

2
اختبار الفهرس

هل تم تفسير الاختبار دون معرفة المعيار المرجعي؟ هل تم تحديد العتبة مسبقًا؟

3
المعيار المرجعي

هل من المحتمل أن يصنف المعيار المرجعي الحالة بشكل صحيح؟ هل تم تفسيره بشكل أعمى؟

4
التدفق والتوقيت

هل كانت هناك فترة زمنية مناسبة بين الاختبارات؟ هل حصل جميع المرضى على نفس المعيار المرجعي؟

QUADAS-2 شجرة القرار

هل يجب أن تثق بهذه الدراسة؟

دراسة DTA
تحقق من جميع المجالات الأربعة
جميع المخاطر منخفضة
جودة عاليةنتائج الثقة
بعض غير واضح
معتدلاستخدم بحذر
أي مخاطر عالية
جودة منخفضةقد تكون النتائج متحيزة
التحيزات الشائعة في دراسات DTA
!

تحيز التحقق

الاختبارات الإيجابية فقط هي التي تحصل على المعيار المرجعي → تضخم الحساسية

!

التحيز الطيفي

يختلف مجتمع الدراسة عن الواقع السريري ← النتائج لا تعمم

!

التحيز التأسيسي

يعد اختبار الفهرس جزءًا من المعيار المرجعي → دقة عالية بشكل مصطنع

!

مراجعة التحيز

يتم تفسير اختبار الفهرس لمعرفة النتيجة المرجعية → يضخم كلا المقياسين

"قبل أن تثق بالأرقام،
اسأل: كيف تم جمعهم؟
دراسة متحيزة تتحدث بثقة -
لكن ثقتها كذبة."
==================== الوحدة 16: التحليل التلوي وSROC ================
دراسة واحدة قد تخدع.
دراسة واحدة قد تملق.

ولكن عندما تجمع كل الأدلة
يصبح إخفاء الحقيقة أكثر صعوبة.
لماذا يختلف التحليل التلوي DTA
المشكلة
الحساسية والنوعية هي مرتبطة. وعندما يرتفع أحدهما، يميل الآخر إلى النزول.

لا يمكنك تجميعها بشكل منفصل مثل تأثيرات العلاج. أنت بحاجة إلى نموذج ثنائي المتغير.
منحنى SROC

ملخص خصائص تشغيل جهاز الاستقبال

الحساسية
1 - النوعية (المعدل الإيجابي الكاذب)
خط قطري (اختبار عديم الفائدة) منحنى سروك منطقة الثقة (القطع الناقص المبسط) نقاط الدراسة
الدراسات الفردية
تقدير موجز
قراءة SROC

ماذا يخبرك المنحنى؟

موقف منحنى SROC
الزاوية العلوية اليسرى
اختبار ممتازحواس عالية + المواصفات
بالقرب من قطري
اختبار عديمة الفائدةليس أفضل من الصدفة
نقاط متناثرة
عدم التجانس العاليالتحقيق في المصادر
"قد تخدع إحدى الدراسات.
العديد من الدراسات، وزنها معا،
تتبع طريق الحقيقة -
منحنى SROC الذي يكشف عما يمكن أن يفعله الاختبار حقًا."
==================== الوحدة 17: عدم التجانس ==============================================================================
ولكن ماذا لو كانت الدراسات لا توافق?

يقول أحدهم أن الحساسية هي 95%.
آخر يقول 60%.

ما هي الحقيقة التي تصدقها؟
مصادر عدم التجانس

لماذا تختلف الدراسات

نفس الاختبار ونتائج مختلفة؟
العتبةقطع مختلفة
سكانالشدة، العمر
الإعدادالابتدائي مقابل المتخصص
الجودةالتحيز، التعمية
قياس عدم الاتفاق: I²
I² < 25%
Low
توافق الدراسات
I² 25-75%
معتدل
بعض الاختلاف
I² > 75%
High
خلاف كبير
التحذير
عندما يكون I² > 75%، قد يكون التقدير المجمع لا معنى له. اشرح الخلاف قبل المتوسط.
"عندما تختلف الدراسات،
لا تسكت المعارضة.
اسأل: لماذا يرون بشكل مختلف؟
الخلاف بحد ذاته يعلم."
==================== الوحدة 18: مجموعة الأدوات ====================
مجموعة أدوات DTA الخاصة بك
التدابير الأساسية ومتى استخدامها
القائمة المرجعية

هل كان هناك معيار مرجعي صالح؟

هل يتم تطبيق المعيار الذهبي على جميع المرضى؟

هل كان المترجمون أعمى؟

قراء الاختبار غير مدركين للتشخيص؟

هل كان الطيف مناسبًا؟

المرضى مماثلة لسكانك؟

هل تم تحديد العتبة مسبقًا؟

أو تم اختياره لتعظيم النتائج؟

عندما لا تتطابق النتائج مع الشك

شجرة قرارات التجاوز السريرية

اختبار سلبي، شك كبير
ما هو LR-؟
LR- < 0.1
استبعاد قويتقبل السلبية
LR- 0.1-0.5
كرر الاختبارأو اختبار مختلف
LR- > 0.5
الثقة في الحكمالاختبار ضعيف
شجرة قرار الاختبار المتسلسل

عندما لا يكفي اختبار واحد

اختبار الفحص الأولي
إيجابي
اختبار تأكيديخصوصية عالية
إيجابيتشخيص
سلبيإنذار كاذب
سلبي
من المحتمل أن تكون سلبيةإذا فحص الاستشعار العالي
"مسلحين بالحساسية، والنوعية، والاحتمالية،
مسلح بـ SROC وقياس الاتفاق،
يمكنك أن ترى من خلال كذبة الاختبار -
واحكم على حقيقتها بنفسك."
==================== الوحدة 19: أخطاء نقل الدم ================
ألم تسمع عن المريض
الذي حصل على دم خاطئ,
ليس لأن الاختبار كان خاطئا،
ولكن لأن لم يقم به أحد?
الاختبار الذي لم يتم
المستشفيات في جميع أنحاء العالم
تكون فصيلة الدم ABO دقيقة بنسبة 100% تقريبًا عند إجرائها.

Yet لا تزال تفاعلات نقل الدم تقتل- ليس من الفشل في الاختبار، ولكن من الفشل البشري:

• سحب دم خاطئ من مريض خاطئ
• تم تبديل التسميات في المختبر
• تخطي فحص السرير في حالات الطوارئ

في المملكة المتحدة، 1 في 13000 عملية نقل دم يذهب إلى المريض الخطأ. نجح الاختبار. فشل النظام.
Bolton-Maggs PHB. ترانسفوس ميد. 2016;26:303-311
الاختبار مقابل شجرة قرار النظام

أين يمكن أن تسوء الأمور؟

عملية التشخيص
مصدر الخطأ؟
اختبار نفسه
خطأ تحليليمشكلة Sens/Spec
مطلوب اختبار أفضل
خطأ في معرف ما قبل التحليل
عينة خاطئةID error
يلزم إصلاح النظام
انحياز ما بعد التحليل
عمل خاطئالإبلاغ عن خطأ
إصلاح العملية اللازمة
"الاختبار المثالي لا يعني شيئًا
إذا تم سحب الدم الخطأ،
تم تطبيق التسمية الخاطئة،
الحقيبة الخاطئة معلقة."

تقيس دراسات DTA دقة الاختبار. أنها لا تقيس دقة النظام.

============================================================================================= الوحدة 20:
هل لم تشاهد الخوارزمية
التي تعلمت منها بيانات متحيزة,
ونشر هذا التحيز
to كل مريض لمسته?
ثورة التشخيص بالذكاء الاصطناعي
ستانفورد آند بيوند، 2017 إلى الوقت الحاضر
تتطابق خوارزميات التعلم العميق الآن مع أطباء الجلد في اكتشاف سرطان الجلد.

لكن بيانات التدريب كانت البشرة الفاتحة في الغالب. على البشرة الداكنة، انخفض الأداء بشكل ملحوظ.

لقد تعلمت الخوارزمية الأنماط، ولكنها تعلمت أيضًا biases.

وعندما تم نشره دون التحقق من الصحة الخارجية، كان أداؤه أسوأ من المتوقع لأن لم يتطابق مجتمع التدريب مع المجتمع السريري.
إستيفا أ وآخرون. طبيعة. 2017;542:115-118; أدامسون أس. جاما ديرماتول. 2018
شجرة قرار التحقق من صحة الذكاء الاصطناعي

هل هذا الذكاء الاصطناعي جاهز للاستخدام السريري؟

أداة تشخيص الذكاء الاصطناعي
نوع التحقق؟
داخلي فقط
مخاطر عاليةمن المحتمل أن يكون هناك فرط في التجهيز
غير جاهز
التحقق الخارجي
أفضللكن تحقق من عدد السكان
يطابق مرضاك؟
Yesالنظر في الاستخدام
Noالحذر
المضبوطة المحتملين
المعيار الذهبينتائج المرضى
معايرة الذكاء الاصطناعي: المشكلة الخفية
التمييز مقابل. المعايرة
التمييز (AUC/ROC): هل يستطيع الذكاء الاصطناعي تصنيف المرضى حسب المخاطر؟

المعايرة: عندما يقول الذكاء الاصطناعي "خطر بنسبة 80%"، هل يعاني 80% من المرض بالفعل؟

العديد من أدوات الذكاء الاصطناعي لديها AUC جيد ولكن معايرة سيئة. هذه هي مغالطة المعدل الأساسي في شكل خوارزمي.
AUC
هل يمكن أن يحصل على التصنيف؟
(يتم الإبلاغ عنه عادةً)
CAL
هل الاحتمال دقيق؟
(غالبًا ما يتم تجاهله)
"وتعلمت الخوارزمية من البيانات،
وكانت البيانات متحيزة،
وانتشر التحيز إلى كل تنبؤ -
ولم يسأل أحد: من الذي غاب عن مجموعة التدريب؟
==================== الوحدة 21: التواصل مع المريض ================
يسأل المريض: "هل اختباري إيجابي؟"

لكن ما يقصدونه هو:
"هل أنا مصاب بالمرض؟"

كيف يمكنك سد هذه الفجوة؟
نصوص الاتصال
النص 1: شرح نتيجة إيجابية
"جاء اختبارك إيجابيًا. لكني أريد أن أشرح ما يعنيه ذلك."

"هذا الاختبار جيد في العثور على الأشخاص الذين يعانون من هذه الحالة، ولكنه يحتوي أيضًا على إنذارات كاذبة."

"استنادًا إلى عوامل الخطر لديك، هناك حوالي [X]% فرصة أن يكون هذا أمرًا إيجابيًا حقيقيًا."

"سنجري اختبارًا تأكيديًا للتأكد قبل أي علاج."
نصوص الاتصال
النص 2: شرح نتيجة سلبية (شك كبير)
"جاء اختبارك سلبيًا، لكنني لا أزال أشعر بالقلق."

"هذا الاختبار يمكن أن يغيب عن الحالات، وخاصة في وقت مبكر من المرض."

"نظرًا للأعراض التي تعاني منها، أود إما تكرار الاختبار في غضون أيام قليلة، أو تجربة اختبار مختلف."

"لا يعني الاختبار السلبي دائمًا أنك سليم -الأعراض الخاصة بك مهمة أيضا."
شجرة قرارات الاتصال

كيفية شرح نتائج الاختبار

نتيجة الاختبار
إيجابي
PPV?
>90%"من المحتمل جدًا أن يكون هذا صحيحًا"
<90%"بحاجة إلى تأكيد"
سلبي
NPV?
>95%"مطمئن للغاية"
<95%"ما زلت تراقب الأعراض"
أسئلة لطرحها على طبيبك
1

"ما مدى دقة هذا الاختبار؟"

اطلب الحساسية والنوعية بلغة واضحة

2

"ماذا لو كانت النتيجة خاطئة؟"

فهم عواقب الإيجابيات والسلبيات الكاذبة

3

"ماذا سيحدث بعد ذلك؟"

هل سيكون هناك اختبار تأكيدي؟

4

"ماذا لو لم أخضع للاختبار على الإطلاق؟"

افهم المفاضلات بين الاختبار وعدم الاختبار

"الاختبار يتحدث بالأرقام.
يسمع المريض في المخاوف والآمال.
مهمة المعالج هي الترجمة
لسد الفجوة بين الإحصاء والروح."
==================== الوحدة 22: فعالية التكلفة والدرجة ===============
قد يكون الاختبار دقيقًا.
ولكن هل يستحق كل هذا العناء?

ما هي التكلفة — من المال،
من القلق، والأذى؟
عتبة الاختبار والعلاج

متى يكون الاختبار مفيدًا؟

احتمالية ما قبل الاختبار
منخفضة جدًا
أقل من حد الاختبارلا تختبر، طمأن
متوسط
منطقة الاختبارسيغير الاختبار الإدارة
مرتفع جدًا
فوق عتبة العلاجلا تختبر، عالج
المبدأ
اختبر فقط عندما تكون النتيجة تغيير ما تفعله. إذا كنت ستعالج بغض النظر عن ذلك، أو لا تعالج بغض النظر عن ذلك، فلماذا تجرى الاختبار؟
درجة جودة الأدلة

تصنيف أدلة DTA

⊕⊕⊕⊕
HIGH

دراسات متعددة عالية الجودة، نتائج متسقة، قابلة للتطبيق مباشرة

⊕⊕⊕○
متوسط

بعض القيود في جودة الدراسة أو اتساقها أو قابليتها للتطبيق

⊕⊕○○
LOW

قيود خطيرة - قد تحتاج إلى خفض مستوى التوصيات

⊕○○○
منخفض جدًا

قيود خطيرة جدًا - الأدلة غير مؤكدة

تحليل عواقب التكلفة

مثال: الفحص الشامل مقابل الفحص المستهدف

التكلفة لكل حالة تم اكتشافها (عالمي)
$50,000
التكلفة لكل حالة تم اكتشافها (عالية الخطورة فقط)
$5,000
الحالات التي غاب عنها النهج المستهدف
~10%
إيجابيات كاذبة تجنبها المستهدفة
~90%
ما هو النهج المناسب لسكانك؟
"الاختبار ليس دقيقًا أو غير دقيق فقط.
لها تكاليف – في المال، في القلق، في الأذى.
والطبيب الحكيم يزن كل هذه الأمور:
والاختبارات فقط عندما يخدم الاختبار المريض."
==================== الوحدة 23: SROC المتقدم =================
يظهر منحنى SROC حيث ينفذ الاختبار.

لكن كيف معين هل نحن كذلك؟
وكم سيكون ذلك vary عمليا؟
مناطق الثقة مقابل مناطق التنبؤ

نوعان من عدم اليقين

خط قطري منطقة التنبؤ (أكبر، خارجية) منطقة الثقة (أصغر، داخلية) نقطة التلخيص منحنى سروك
95% CI (تقدير موجز)
95% التنبؤ (الدراسات المستقبلية)
ما تخبرك به كل منطقة
CI

منطقة الثقة (شكل ناقص أصغر)

حيث أننا واثقون بنسبة 95% من أن المتوسط الحقيقي تكمن في الحساسية/النوعية. عدم اليقين بشأن ملخص التقدير.

PI

منطقة التنبؤ (القطع الناقص الأكبر)

حيث نتوقع 95% من الدراسات المستقبلية للهبوط. حسابات عدم التجانس بين الدراسات.

الآثار السريرية
إذا كانت منطقة التنبؤ كبيرة، فقد يؤدي الاختبار بشكل مختلف تمامًا في الإعداد الخاص بك عما يقترحه المتوسط. التنبؤ الواسع = عدم التجانس العالي = التحقيق في المصادر.
تفسير النموذج ثنائي المتغير

قراءة نتائج التحليل التلوي

ملخص الاستشعار/المواصفات
تحقق من المناطق
CI ضيق، PI ضيق
متسقالوثوق بالمتوسط
CI ضيق، PI واسع
غير متجانسقد لا يكون المتوسط تطبيق
CI واسع
غير مؤكدبحاجة إلى مزيد من الدراسات
"تخبرك منطقة الثقة: ما مدى تأكدنا؟
تخبرك منطقة التنبؤ: إلى أي مدى ستختلف؟
كلا السؤالين مهمين -
قد لا يكون الاختبار الذي تستخدمه غدًا هو الاختبار متوسط."
==================================================================
مراجع

المصادر الرئيسية

  1. كاريرو جي. الدم الفاسد. كنوبف، 2018. [ثيرانوس]
  2. مركز السيطرة على الأمراض. معدل وفيات الأمهات. 198;36(49):833-840. [إمدادات الدم لفيروس نقص المناعة البشرية]
  3. هيربست آل وآخرون. ن إنجل ي ميد. 1971;284:878-881. [ديس]
  4. موير فا. آن المتدرب ميد. 2012;157:120-134. [دعم البرامج والإدارة]
  5. البابا ج.ه. وآخرون. ن إنجل ي ميد. 2000;342:1163-1170. [تروبونين]
  6. ستينجارت KR وآخرون. كوكرين 201;1:CD009593. [جينيكسبيرت]
  7. دينيس J وآخرون. كوكرين 202؛7:CD013705. [فأر كوفيد]
  8. لوحة المملكة المتحدة. لانسيت. 2012;380:1778-1786. [تصوير الثدي الشعاعي]
  9. جاك كر وآخرون. لانسيت نيورول. 2018;17:760-773. [الأميلويد]
  10. من. أداء اختبار الملاريا RDT. 2022.
  11. رييتسما جي بي وآخرون. J كلين Epidemiol. 2005;58:982-990. [ثنائي المتغير]
  12. البياض PF وآخرون. آن المتدرب ميد. 2011;155:529-536. [كواداس-2]
  13. بولتون ماجز PHB. ترانسفوس ميد. 2016;26:303-311.
الاختبار حساس بنسبة 99% ومحدد بنسبة 99%. معدل انتشار المرض هو 1/1000. اختبار المريض إيجابي. ما هو احتمال إصابتهم بالمرض؟
99%
90%
حوالي 9%
50%
ماذا يعني "SnNout"؟
اختبار شديد الحساسية، عندما يكون سلبيًا، يستبعد المرض
اختبار محدد للغاية، عندما يكون سلبيًا، يستبعد المرض
وينبغي استخدام الحساسية للفحص
يجب أن تكون الخصوصية أعلى من 90٪
لماذا أصبح إمداد الدم ملوثًا بفيروس نقص المناعة البشرية على الرغم من إجراء الاختبارات؟
وكانت الاختبارات خصوصية منخفضة
كانت للاختبارات فترة نافذة مع حساسية صفرية للعدوى المبكرة
لم يتم إجراء الاختبارات بشكل صحيح
كانت الاختبارات باهظة الثمن
وهو المجال QUADAS-2 الذي يقيم ما إذا كان قد تم تفسير الاختبار دون معرفة التشخيص؟
اختيار المريض
اختبار الفهرس
المعيار المرجعي
التدفق والتوقيت
اكتملت الدورة
"الآن أنت تعرف النتائج الأربع،
فضيلتان للاختبار،
مغالطة القاعدة معدل،
فن تجميع الأدلة،
والتحيزات التي تخفي الحقيقة.

عندما يكذب عليك الاختبار التالي —
سوف تعرف."