who promised to changer le monde avec une goutte de sang,
who raised billions on a test that never worked?
No more needles. No more vials. No more waiting.
Investors believed. Walgreens believed. The Pentagon believed.
They gave her $9 billion.
Le test était erroné. Le bébé était en bonne santé.
But how many women, receiving the same news, made different decisions?
et le mensonge a été habillé avec certitude,
et personne n'a remis en question le numéros."
C'est pourquoi nous étudions la précision des tests de diagnostic.
il y a seulement four possible truths.
Deux sont des bénédictions. Deux sont des malédictions.
Every Test Result Has a Reality Behind It
Test: Positive
Test: Positive
Test: Negative
Test: Negative
True Positive (TP)
Sick person correctly identified.
Le test a dit la vérité.
False Positive (FP)
Healthy person wrongly alarmed.
Le test a menti.
False Negative (FN)
Sick person wrongly reassured.
Le mensonge le plus meurtrier.
True Negative (TN)
Healthy person correctly cleared.
Le test a dit la vérité.
La matrice de confusion 2x2
| Disease Present | Disease Absent | |
|---|---|---|
| Test Positive | TP True Positive |
FP False Positive |
| Test Negative | FN False Negative |
TN True Negative |
Know them by name.
TP, TN : le test parlait vrai.
FP, FN : le test a menti."
Sensitivity asks: Can it find the sick?
Specificity asks: Can it spare the healthy?
High sensitivity = few false negatives = few missed cases.
High specificity = few false positives = few false alarms.
Lower the threshold to catch more sick people? You'll alarm more healthy people.
Raise the threshold to spare healthy people? You'll miss more sick people.
This is the threshold effect— la bascule du diagnostic.
SnNout: Sensitive tests rule OUT
A highly sensitive test, when negative, rules out disease. If it didn't find it, it's probably not there.
SpPin: Specific tests rule IN
Un test très spécifique, lorsqu’il est positif, détermine la maladie. S'il est indiqué que vous l'avez, c'est probablement le cas.
SpPin: Specific Positive rules IN
La spécificité épargne le bien.
But no test masters both perfectly—
C'est le fardeau que nous devons porter. »
le monde avait besoin d'un test qui pourrait trouver rapidement les infectés.
But what if the rapid test missed too many?
Chez les personnes PRÉSENTANT des symptômes :
Sensitivity: 73% (missed 27% of cases)
In people WITHOUT symptoms:
Sensitivity: 55% (missed 45% of cases)
Près de la moitié des personnes infectées asymptomatiques ont appris qu’elles étaient guéries.
Thanksgiving Dinners
Families tested negative in the morning, gathered indoors, unknowingly infected grandparents
Workplace Outbreaks
Workers tested negative, came to work, infected colleagues in the break room
Hospital Transmission
Patients tested negative, admitted to wards, infected vulnerable patients
et la famille s'est réunie,
et le grand-père embrassa ses petits-enfants,
et à la fin de l'hiver, il était parti."
Mais le patient pose une autre question :
"I tested positive. What are my chances?"
Votre patient est testé positif pour une maladie rare (prévalence 1 sur 1000).
Question: Quelle est la probabilité qu’ils soient réellement atteints de la maladie ?
La plupart des médecins disent 95 %. La vraie réponse ? About 2%.
Specificity tells how many well it will spare.
But only the likelihood ratio answers:
Que signifie ce résultat pour CE patient ?"
that found too much?
When does finding disease become causing harm?
Mammography could detect tumors too small to feel.
On disait aux femmes : "Annual mammograms save lives."
But what if some of those "cancers" would never have killed?
La femme est diagnostiquée, traitée par chirurgie, radiothérapie, chimiothérapie— pour une maladie qui ne lui aurait jamais fait de mal.
Independent UK Panel on Breast Cancer Screening. Lancet. 2012;380:1778-1786
du cancer du sein
(treated unnecessarily)
(anxiety, biopsies)
Est-ce un bon métier ? La réponse dépend des valeurs, pas seulement des chiffres.
et l'a appelé maladie,
et la femme a été coupée, brûlée et empoisonnée—
pour une ombre qui ne l'aurait jamais obscurcie jours."
C'est le problème du surdiagnostic.
Mais lorsque vous rassemblez toutes les études,
lorsque vous évaluez leurs preuves ensemble—
The truth becomes harder to hide.
More Precision
Combining studies gives narrower confidence intervals, reducing uncertainty
Detect Heterogeneity
Why do different studies give different answers? Setting? Population? Threshold?
Expose Publication Bias
Les études négatives sont-elles cachées ? Les tracés en entonnoir révèlent une asymétrie
Explore Thresholds
Build SROC curves to understand the sensitivity-specificity trade-off
They are correlated: quand l'une monte, l'autre a tendance à baisser (le seuil
The bivariate model prend en compte cette corrélation, donnant des estimations groupées valides.
Reitsma JB et al. J Clin Epidemiol. 2005;58:982-990
ROC Space
La courbe montre le compromis
Higher = better test
Diagonal line = useless test (random guessing)
The curve = résumé des performances de toutes les études
commencent à révéler la vérité.
La courbe SROC est le chemin de preuves—
showing what the test can truly do."
Une étude indique que la sensibilité est de 95 %.
Another says 60%.
À quelle vérité croyez-vous ?
High heterogeneity means les études mesurent différentes choses— or the test performs differently in different settings.
Threshold Differences
Différents seuils pour un résultat « positif » (par exemple, différents seuils d'HbA1c pour le diabète)
Population Differences
Disease severity, age, comorbidities differ between studies
Setting Differences
Primary care vs. specialist clinic vs. emergency room
Quality Differences
Risk of bias, verification bias, spectrum bias
Studies agree
Some disagreement
Major disagreement
Vous ne pouvez pas faire la moyenne des pommes et des oranges. Vous devez explain why studies differ before pooling them.
ne faites pas taire la dissidence.
Ask: Why do they see differently?
Le désaccord lui-même est instructif. »
Sensitivity & Specificity
How well the test performs on sick vs. healthy people
Likelihood Ratios (LR+, LR-)
How much a result changes the probability of disease
Diagnostic Odds Ratio (DOR)
Single measure of test discrimination (DOR = LR+ / LR-)
Aire sous la courbe SROC (AUC)
Overall test performance across all thresholds (0.5 = useless, 1.0 = perfect)
bivariate meta-analysis
pour les examens DTA
outil en libre accès
Rutter & Gatsonis 2001 - HSROC model
Cochrane Handbook Ch. 10 - DTA methods
Was there a valid reference standard?
Gold standard test applied to all patients?
Les interprètes étaient-ils aveuglés ?
Test readers unaware of diagnosis, and vice versa?
Le spectre était-il approprié ?
Patients similar to your clinical population?
Le seuil était-il prédéfini ?
Ou a-t-il été choisi pour maximiser les résultats ?
armé du SROC et de la mesure d’accord,
vous pouvez voir à travers le mensonge du test—
et juge par toi-même de sa vérité. »
When a machine claims to see what no other machine can see,
et personne ne demande : "Montre-moi la preuve"?
FDA found:
• Results varied by 146% between runs on the same sample
• Edison machines failed 87% of proficiency tests
• Zero Publication d'études de validation évaluées par des pairs
• Les patients ont reçu des résultats séropositifs pour des échantillons négatifs.
Sources: FDA Warning Letter 2016; Carreyrou J. Bad Blood. 2018; CMS Inspection Reports.
Que choisissez-vous ?
Face lawsuits
Harm patients
Protégez vos patients
Avoid Scandal
A $9 billion valuation became a criminal fraud conviction.
Chaque hôpital qui exigeait des données de validation avant de signer
était protégé du mentir.
Tous les hôpitaux qui ont fait confiance au marketing
became complicit in harming patients.
L'absence de preuves n'est pas un problème de marketing.
It is a patient safety emergency.
qui paie le prix ?
The test result comes in 15 minutes.
Mais que se passe-t-il si le résultat est 15 minutes of false confidence?
Real-world performance (Cochrane 2022):
• Symptomatic individuals: 73% sensitivity (missed 27%)
• Asymptomatic individuals: 58% sensitivity (missed 42%)
• Early infection (days 0-3): ~50% sensitivity
Près de la moitié des personnes asymptomatiques infectées se sont fait dire qu'elles étaient « indemnes ».
Source: Dinnes J et al. Cochrane Database Syst Rev. 2022;7:CD013705
Que choisissez-vous ?
School closure
Three hospitalizations
Teacher isolates
Outbreak prevented
It means: "not detected."
La différence entre ces deux phrases
is measured in lives.
is almost meaningless.
SnNout only works when sensitivity is HIGH.
Know your test's limits before trusting its verdict.
still cause harm?
Et si le cancer est détecté
would never have hurt you?
Sensitivity: ~85% | Specificity: ~90%
Pour 1 000 femmes dépistées annuellement pendant 10 ans :
• 1 death prevented du cancer du sein
• 5 women overtreated pour des cancers qui ne leur auraient jamais fait de mal
• 100-500 false alarms leading to biopsies, anxiety, repeat imaging
Overdiagnosis rate: 19-30% of screen-detected cancers
Source: Independent UK Panel on Breast Cancer Screening. Lancet. 2012;380:1778-1786
Que choisissez-vous ?
La tumeur était indolente (DCIS)
Would never have harmed her
Comprend les avantages ET les inconvénients
Autonomy preserved
A test can be accurate et cause toujours harm.
When overdiagnosis exceeds lives saved,
we must ask: Is finding always helping?
peuvent dépasser les avantages de true positives.
Always weigh benefits against harms.
Le dépistage ne sauve pas toujours.
is worse than missing it?
What if the treatment causes more suffering
than the disease ever would?
• Sensibilité au cancer de haut grade : 21%
• Detects many indolent cancers that would never harm
Lower cutoff to 2.5 ng/mL:
• Sensitivity rises to: 40%
• But overdiagnosis doubles
Treatment consequences:
• 20-30% of men experience incontinence after prostatectomy
• 30-70% experience erectile dysfunction
Source: US Preventive Services Task Force. JAMA. 2018;319(18):1901-1913
Quel seuil choisissez-vous ?
Thousands of unnecessary
biopsies et traitements
But most missed are indolent
Fewer unnecessary treatments
Some preventable deaths
No overtreatment harm
Every threshold trades sensibilité pour spécificité,
détection de surdiagnostic.
Le choix n'est pas médical. C'est ethical.
Cela dépend des préjudices que vous êtes prêt à accepter.
It is a values problem.
Before choosing a cutoff, ask:
What is worse: missing disease or overtreating the healthy?
Different truths.
How can identical numbers
mean opposite things?
Sensitivity: ~80% | Specificity: ~95%
In high-prevalence setting (TB prevalence 10%):
• Positive Predictive Value: 85%
• A positive test usually means TB
In low-prevalence setting (TB prevalence 0.1%):
• Positive Predictive Value: 15%
• A positive test is usually a false positive
Source: Pai M et al. Lancet Infect Dis. 2014;14(8):765-773
Que concluez-vous ?
Patient infects family
Retarde le diagnostic de plusieurs mois
Chest X-ray, sputum
Treat early if confirmed
PPV et NPV are properties of the population.
Le même résultat signifie different things
in different people.
A positive test in a high-risk patient means disease.
The same positive in a low-risk patient means probably nothing.
Context is everything.
Theranos: Demand Validation
No peer-reviewed data = no trust, regardless of marketing claims
COVID Rapid Tests: Know Sensitivity Limits
"Non détecté" n'est pas la même chose que "non infecté"
Mammography: Weigh Benefits vs. Harms
Finding is not always helping; overdiagnosis causes real harm
PSA: The Threshold is a Values Choice
Chaque seuil échange la sensibilité contre la spécificité; il n'y a pas de "bonne" réponse
TB Test: Context Determines Meaning
The same result means different things in different populations
Sources clés citées dans ce document Cours
- Carreyrou J. Bad Blood: Secrets and Lies in a Silicon Valley Startup. Knopf, 2018.
- Dinnes J, et al. Rapid, point-of-care antigen tests for diagnosis of SARS-CoV-2 infection. Cochrane Database Syst Rev. 2022;7:CD013705.
- Panel britannique indépendant sur le dépistage du cancer du sein. Les avantages et les inconvénients du dépistage du cancer du sein. Lancet. 2012;380:1778-1786.
- Reitsma JB, et al. L'analyse bivariée de la sensibilité et de la spécificité produit des mesures récapitulatives informatives dans les revues diagnostiques. J Clin Epidemiol. 2005;58:982-990.
- Rutter CM, Gatsonis CA. A hierarchical regression approach to meta-analysis of diagnostic test accuracy evaluations. Stat Med. 2001;20:2865-2884.
- Deeks JJ, et al. The performance of tests of publication bias in systematic reviews of diagnostic test accuracy. J Clin Epidemiol. 2005;58:882-893.
- Macaskill P, et al. Cochrane Handbook for Systematic Reviews of Diagnostic Test Accuracy. Chapter 10. 2023.
- Higgins JPT, Thompson SG. Quantifying heterogeneity in a meta-analysis. Stat Med. 2002;21:1539-1558.
- US Food and Drug Administration. Warning Letter to Theranos Inc. 2016.
- US Preventive Services Task Force. Screening for Prostate Cancer. JAMA. 2018;319(18):1901-1913.
- Pai M, et al. Tuberculosis. Lancet Infect Dis. 2014;14(8):765-773.
les deux vertus d'un test,
le compromis cruel du seuil,
et l'art de la mutualisation preuve.
Quand le prochain test vous mentira—
you will know how to see through it."
Quand le test vous mentira — Vous le savez maintenant.