الذي وعد به غير العالم بقطرة دم,
الذي جمع المليارات في اختبار ذلك لم تعمل قط?
لا مزيد من الإبر. لا مزيد من القوارير. لا مزيد من الانتظار.
يعتقد المستثمرون. يعتقد والجرينز. يعتقد البنتاغون.
أعطوها 9 مليارات دولار.
كان الاختبار خاطئًا. كان الطفل بصحة جيدة.
ولكن كم عدد النساء اللاتي تلقين نفس الأخبار قرارات مختلفة?
ولبس الكذب يقينًا،
ولم يشكك أحد في الأرقام."
هذا هو السبب في أننا ندرس دقة الاختبار التشخيصي.
هناك فقط أربع حقائق محتملة.
اثنتين بركات. اثنان لعنات.
كل نتيجة اختبار لها حقيقة وراءها
الاختبار: إيجابي
الاختبار: إيجابي
الاختبار: سلبي
الاختبار: سلبي
إيجابي حقيقي (TP)
تم تحديد شخص مريض بشكل صحيح.
الاختبار قال الحقيقة.
نتيجة إيجابية كاذبة (FP)
انزعج الشخص السليم بشكل خاطئ.
الاختبار كذب.
سلبي كاذب (FN)
شخص مريض مطمئن بالخطأ.
الكذبة الأكثر دموية.
صحيح سلبي (TN)
تم مسح الشخص السليم بشكل صحيح.
الاختبار قال الحقيقة.
مصفوفة الارتباك 2x2
| المرض موجود | المرض غائب | |
|---|---|---|
| الاختبار إيجابي | TP إيجابي حقيقي |
FP إيجابي كاذب |
| اختبار سلبي | FN سلبية كاذبة |
TN صحيح سلبي |
تعرف عليهم بالاسم.
TP, TN: الاختبار تحدث صحيح.
FP, FN: الاختبار كذب."
الحساسية يسأل: هل يمكن العثور على المرضى؟
الخصوصية يسأل: هل يمكن أن يستغني عن الأصحاء؟
حساسية عالية = عدد قليل من السلبيات الكاذبة = عدد قليل من الحالات الضائعة.
خصوصية عالية = عدد قليل من الإيجابيات الكاذبة = عدد قليل من الإنذارات الكاذبة.
خفض العتبة للقبض على المزيد من المرضى؟ سوف تنبه المزيد من الأشخاص الأصحاء.
رفع العتبة لتجنيب الأشخاص الأصحاء؟ سوف تفتقد المزيد من المرضى.
هذا هو تأثير العتبة تأثير العتبة— تأرجح التشخيص.
SnNout: الاختبارات الحساسة تستبعد
اختبار حساس للغاية، عندما يكون سلبيًا، يستبعد المرض. إذا لم يتم العثور عليه، فمن المحتمل أنه ليس هناك.
SpPin: قاعدة اختبارات محددة في
اختبار محدد للغاية، عندما تكون إيجابية، يحكم المرض. إذا قيل أنك تمتلكه، فمن المحتمل أن تفعله.
SpPin: قواعد إيجابية محددة في
التخصيص ينقذ البئر.
ولكن لا يوجد اختبار يتقن كلاهما بشكل مثالي —
هذا هو العبء الذي يجب علينا bear."
العالم بحاجة إلى اختبار يمكنه العثور على المصابين بسرعة.
ولكن ماذا لو كان الاختبار السريع غاب الكثير?
في الأشخاص الذين يعانون من الأعراض:
الحساسية: 73% (تم تجاهل 27% من الحالات)
في الأشخاص الذين لا تظهر عليهم أعراض:
الحساسية: 55% (تم تجاهل 45% من الحالات)
ما يقرب من نصف تم إخبار الأشخاص المصابين بدون أعراض أن نتائجهم كانت واضحة.
عشاء عيد الشكر
كانت نتيجة اختبار العائلات سلبية في الصباح، وتجمعوا في الداخل، وأصابوا الأجداد دون علمهم
تفشي المرض في مكان العمل
جاءت نتيجة اختبار العمال سلبية، وجاءوا إلى العمل، وأصابوا زملاءهم في غرفة الاستراحة
نقل المرضى إلى المستشفى
كانت نتيجة اختبار المرضى سلبية، وتم قبولهم في العنابر، وأصيب المرضى الضعفاء
والعائلة تجمعوا،
واحتضن الجد أحفاده،
وبحلول نهاية الشتاء، كان قد رحل."
لكن المريض يطرح سؤالاً مختلفًا:
"لقد كانت نتيجة اختباري إيجابية. ما هي فرصي؟"
نتائج اختبار مريضك إيجابية بالنسبة لمرض نادر (معدل الانتشار 1 في 1000).
السؤال: ما هو احتمال إصابته بالفعل بالمرض؟
يقول معظم الأطباء 95%. الإجابة الحقيقية؟ حوالي 2%.
الخصوصية تخبرنا بعدد المرضى الذين سيوفرون.
لكن نسبة الاحتمالية فقط هي التي تجيب:
ماذا تعني هذه النتيجة بالنسبة لهذا المريض؟"
that أكثر من اللازم?
متى يصبح اكتشاف المرض مسببًا للضرر?
يمكن لتصوير الثدي الشعاعي اكتشاف الأورام الصغيرة جدًا بحيث لا يمكن الشعور بها
قيل للنساء: "تصوير الثدي بالأشعة السينية سنويًا ينقذ الأرواح
ولكن ماذا لو لم تكن بعض هذه "السرطانات" تقتل أبدًا؟"
يتم تشخيص المرأة وعلاجها بالجراحة والإشعاع والعلاج الكيميائي — لمرض لن يؤذيها أبدًا.
هيئة بريطانية مستقلة لفحص سرطان الثدي، 2012;380:1778-1786
من سرطان الثدي
(معالجة دون داعٍ)
(قلق، خزعات)
هل هذه تجارة جيدة؟ الجواب يعتمد على القيم، وليس مجرد أرقام.
وأطلق عليه اسم المرض،
وقُطعت المرأة وأحرقت وتسممت —
لظل لن يظلمها أبدًا أيام."
هذه هي مشكلة التشخيص الزائد.
ولكن عندما تجمع كل الدراسات,
عندما تزن أدلتها معًا—
يصبح إخفاء الحقيقة أكثر صعوبة.
مزيد من الدقة
يعطي الجمع بين الدراسات فترات ثقة أضيق، مما يقلل من عدم اليقين
اكتشاف عدم التجانس
لماذا تعطي الدراسات المختلفة إجابات مختلفة؟ جلسة؟ سكان؟ عتبة؟
كشف تحيز النشر
هل يتم إخفاء الدراسات السلبية؟ تكشف المخططات القمعية عن عدم التماثل
استكشاف العتبات
أنشئ منحنيات SROC لفهم المفاضلة بين الحساسية والخصوصية
فهي مرتبطة: عندما يرتفع أحدهما، يميل الآخر إلى النزول (العتبة) التأثير).
The نموذج ثنائي المتغير يمثل هذا الارتباط، مما يوفر تقديرات مجمعة صالحة.
Reitsma JB et al. J كلين Epidemiol. 2005;58:982-990
مساحة ROC
يُظهر المنحنى المفاضلة
أعلى = اختبار أفضل
خط قطري = اختبار عديم الفائدة (تخمين عشوائي)
المنحنى = ملخص أداء جميع الدراسات
تبدأ في الكشف عن الحقيقة.
منحنى SROC هو مسار الأدلة —
يوضح ما يمكن أن يفعله الاختبار حقًا."
تقول إحدى الدراسات أن الحساسية تبلغ 95٪.
آخر يقول 60%.
ما هي الحقيقة التي تصدقها؟
يعني عدم التجانس العالي الدراسات تقيس أشياء مختلفة- أو أداء الاختبار بشكل مختلف في إعدادات مختلفة
عتبة الاختلافات
حدود مختلفة للنتيجة "الإيجابية" (على سبيل المثال، عتبات HbA1c المختلفة لمرض السكري)
الاختلافات السكانية
تختلف شدة المرض والعمر والأمراض المصاحبة بين الدراسات
اختلافات الإعداد
الرعاية الأولية مقابل العيادة المتخصصة مقابل غرفة الطوارئ
اختلافات الجودة
خطر التحيز، تحيز التحقق، تحيز الطيف
توافق الدراسات
بعض الخلاف
خلاف كبير
لا يمكنك متوسط التفاح والبرتقال. يجب عليك أن شرح سبب اختلاف الدراسات قبل تجميعها.
لا تسكت المعارضة.
اسأل: لماذا يرون بشكل مختلف؟
الخلاف بحد ذاته يعلم."
الحساسية والنوعية
مدى جودة أداء الاختبار على المرضى مقابل الأشخاص الأصحاء
نسب الاحتمال (LR+, LR-)
مدى تغير النتيجة في احتمالية المرض
التشخيص نسبة الأرجحية (DOR)
مقياس واحد لتمييز الاختبار (DOR = LR+ / LR-)
المنطقة الواقعة تحت منحنى SROC (AUC)
أداء الاختبار الشامل عبر جميع العتبات (0.5 = عديم الفائدة، 1.0 = مثالي)
التحليل التلوي ثنائي المتغير
لمراجعات DTA
أداة الوصول المفتوح
Rutter & Gatsonis 2001 - نموذج HSROC
دليل كوكرين الفصل. 10 - طرق DTA
هل كان هناك معيار مرجعي صالح؟
هل يتم تطبيق اختبار المعيار الذهبي على جميع المرضى؟
هل كان المترجمون أعمى؟
قراء الاختبار غير مدركين للتشخيص، والعكس صحيح؟
هل كان الطيف مناسبًا؟
المرضى المشابهين لمجموعتك السريرية؟
هل تم تحديد العتبة مسبقًا؟
أم أنه تم اختياره لتعظيم النتائج؟
مسلح بـ SROC وقياس الاتفاق،
يمكنك أن ترى من خلال كذبة الاختبار -
واحكم على حقيقتها بنفسك."
عندما تدعي آلة أنها ترى ما لا تستطيع آلة أخرى رؤيته،
ولا أحد يسأل: "أرني الدليل"?
وجدت ادارة الاغذية والعقاقير:
• النتائج تختلف حسب 146% بين يعمل على نفس العينة
• تعطلت آلات إديسون 87% من اختبارات الكفاءة
• Zero تم نشر دراسات التحقق من الصحة التي راجعها النظراء
• تلقى المرضى نتائج إيجابية لفيروس نقص المناعة البشرية للعينات التي كانت سلبية
المصادر: رسالة تحذير إدارة الغذاء والدواء الأمريكية لعام 2016؛ كاريرو جي. الدم الفاسد. 2018; تقارير التفتيش CMS.
ماذا تختار؟
مواجهة الدعاوى القضائية
إيذاء المرضى
حماية مرضاك
تجنب فضيحة
A 9 مليارات دولار تقييم أصبح إدانة الاحتيال الجنائي.
كل مستشفى طلبت بيانات التحقق قبل التوقيع
كانت محمية من كذبة.
كل مستشفى وثق في التسويق
أصبحت متواطئة في إيذاء المرضى.
لا يمثل غياب الأدلة مشكلة تسويقية.
It is a حالة طوارئ تتعلق بسلامة المرضى.
من يدفع الثمن؟
تأتي نتيجة الاختبار خلال 15 دقيقة.
ولكن ماذا لو كانت النتيجة 15 دقيقة من الثقة الزائفة?
الأداء في العالم الحقيقي (كوكرين 2022):
• الأفراد الذين تظهر عليهم الأعراض: حساسية 73% (ضائعة 27%)
• الأفراد الذين لا تظهر عليهم أعراض: حساسية 58% (ضائعة 42%)
• العدوى المبكرة (الأيام 0-3): ~50% حساسية
تم إخبار ما يقرب من نصف الأشخاص المصابين الذين لا تظهر عليهم أعراض أنهم "شُفيوا".
المصدر: Dinnes J وآخرون. Cochrane Database Syst Rev. 2022;7:CD013705
ماذا تختار؟
إغلاق المدرسة
ثلاث حالات دخول إلى المستشفى
عزل المعلم
منع تفشي المرض
ويعني: "لم يتم اكتشافه".
الفرق بين هاتين العبارتين
يتم قياسه بعدد من حياة.
is لا معنى لها تقريبًا.
يعمل SnNout فقط عندما تكون الحساسية عالية.
تعرف على حدود الاختبار الخاص بك قبل أن تثق بحكمه.
لا يزال يسبب ضررًا?
ماذا لو وجد السرطان
لن يؤذيك أبدًا؟
الحساسية: ~85% | النوعية: ~90%
لـ 1000 امرأة يتم فحصهن سنويًا لمدة 10 سنوات:
• تم منع وفاة واحدة من سرطان الثدي
• 5 نساء أفرطن في العلاج للسرطانات التي لم تكن لتؤذيهن أبدًا
• 100-500 إنذار كاذب مما أدى إلى إجراء خزعات، والقلق، وتكرار التصوير
معدل التشخيص الزائد: 19-30% من حالات السرطان المكتشفة بالفحص
المصدر: لجنة المملكة المتحدة المستقلة المعنية بسرطان الثدي الفحص. لانسيت. 2012;380:1778-1786
ماذا تختار؟
كان الورم خاملًا (DCIS)
لم يكن من الممكن أن يؤذيها
يفهم الفوائد والأضرار
الحفاظ على الاستقلالية
يمكن أن يكون الاختبار دقيق وما زال السبب harm.
عندما يتجاوز التشخيص الزائد عدد الأرواح التي تم إنقاذها،
يجب أن نسأل: هل البحث يساعد دائمًا؟
الفائدة من الإيجابيات الحقيقية.
قم دائمًا بموازنة الفوائد مقابل الأضرار.
لا يتم حفظ الفحص دائمًا.
أسوأ من مفتقد it?
ماذا لو تسبب العلاج في معاناة
أكثر من المرض على الإطلاق؟
• الحساسية للسرطان عالي الدرجة: 21%
• يكتشف العديد من أنواع السرطان الخاملة التي لن تضر أبدًا
قطع أقل إلى 2.5 نانوغرام/مل:
• ترتفع الحساسية إلى: 40%
• لكن الإفراط في التشخيص الزوجي
عواقب العلاج:
• يعاني 20-30% من الرجال من سلس البول بعد استئصال البروستاتا
• 30-70% يعانون من ضعف الانتصاب
المصدر: فرقة العمل المعنية بالخدمات الوقائية بالولايات المتحدة. جاما. 2018;319(18):1901-1913
ما العتبة التي تختارها؟
الآلاف من لا لزوم لها
الخزعات والعلاجات
لكن معظم المفقودين هم كسالى
علاجات أقل غير ضرورية
بعض الوفيات التي يمكن الوقاية منها
لا ضرر من المعالجة الزائدة
كل عتبة تتداول حساسية للخصوصية,
الكشف عن التشخيص الزائد.
الاختيار ليس طبيا. إنها أخلاقية.
يعتمد الأمر على الضرر الذي ترغب في قبوله.
إنها مشكلة القيم.
قبل اختيار القطع، اسأل:
ما هو الأسوأ: فقدان المرض أو المبالغة في علاج الأصحاء؟
حقائق مختلفة.
كيف يمكن أرقام متطابقة
يعني أشياء متضادة؟
الحساسية: ~80% | النوعية: ~95%
في بيئة الانتشار المرتفعة (انتشار السل 10%):
• القيمة التنبؤية الإيجابية: 85%
• الاختبار الإيجابي يعني عادةً مرض السل
في بيئة الانتشار المنخفضة (انتشار السل 0.1%):
• القيمة التنبؤية الإيجابية: 15%
• الاختبار الإيجابي هو عادةً نتيجة إيجابية كاذبة
المصدر: Pai M et al. لانسيت العدوى ديس. 2014;14(8):765-773
ماذا تستنتج؟
مريض يصيب بالعدوى الأسرة
يؤخر التشخيص لعدة أشهر
الأشعة السينية للصدر والبلغم
العلاج مبكرًا إذا تم التأكد
PPV و NPV هي خصائص السكان.
نفس النتيجة يعني أشياء مختلفة
في أشخاص مختلفين.
الاختبار الإيجابي لدى مريض شديد الخطورة يعني المرض.
نفس الإيجابية في وسائل المريض منخفضة المخاطر ربما لا شيء.
السياق هو كل شيء.
ثيرانوس: التحقق من صحة الطلب
لا توجد بيانات راجعها النظراء = لا ثقة، بغض النظر عن ادعاءات التسويق
اختبارات فيروس كورونا السريعة: تعرف على حدود الحساسية
"لم يتم الكشف عنه" ليس مثل "غير مصاب"
التصوير الشعاعي للثدي: وزن الفوائد مقابل الأضرار
العثور على الأشياء لا يساعد دائمًا؛ الإفراط في التشخيص يسبب ضررا حقيقيا
PSA: العتبة هي اختيار القيم
كل قطع يتاجر بالحساسية للخصوصية؛ لا توجد إجابة "صحيحة".
اختبار السل: السياق يحدد المعنى
نفس النتيجة تعني أشياء مختلفة في مجموعات سكانية مختلفة
المصادر الرئيسية المذكورة في هذه الدورة
- كاريرو ج. الدم الفاسد: أسرار وأكاذيب في شركة ناشئة في وادي السيليكون. كنوبف، 2018.
- دينيس J، وآخرون. اختبارات مستضد سريعة في نقطة الرعاية لتشخيص عدوى SARS-CoV-2. مراجعة نظام قاعدة بيانات كوكرين. 2022;7:CD013705.
- لجنة بريطانية مستقلة لفحص سرطان الثدي. فوائد ومضار فحص سرطان الثدي. لانسيت. 2012;380:1778-1786.
- رييتسما جي بي، وآخرون. التحليل ثنائي المتغير للحساسية والنوعية ينتج عنه مقاييس موجزة مفيدة في المراجعات التشخيصية. J كلين Epidemiol. 2005;58:982-990.
- روتر سم، جاتسونيس كاليفورنيا. نهج الانحدار الهرمي للتحليل التلوي لتقييمات دقة الاختبار التشخيصي. ستات ميد. 2001;20:2865-2884.
- ديكس جي جي، وآخرون. أداء اختبارات تحيز النشر في المراجعات المنهجية لدقة الاختبار التشخيصي. J كلين Epidemiol. 2005;58:882-893.
- ماكاسكيل ف، وآخرون. دليل كوكرين للمراجعات المنهجية لدقة الاختبار التشخيصي. الفصل 10. 2023.
- هيغينز JPT، طومسون SG. قياس عدم التجانس في التحليل التلوي. ستات ميد. 2002;21:1539-1558.
- إدارة الغذاء والدواء الأمريكية. رسالة تحذير إلى شركة Theranos Inc. 2016.
- فرقة عمل الخدمات الوقائية الأمريكية. فحص سرطان البروستاتا. جاما. 2018;319(18):1901-1913.
- باي إم، وآخرون. مرض الدرن. لانسيت إنفيكت دي. 2014;14(8):765-773.
فضيلتان للاختبار،
المقايضة القاسية للعتبة،
وفن التجميع الأدلة.
عندما يكذب عليك الاختبار التالي —
ستعرف كيفية فهمها."
عندما يكذب الاختبار — الآن أنت تعرف.