who promised to Verändere die Welt mit einem Tropfen Blut,
who raised billions on a test that never worked?
No more needles. No more vials. No more waiting.
Investors believed. Walgreens believed. The Pentagon believed.
They gave her $9 billion.
Der Test war falsch. Das Baby war gesund.
But how many women, receiving the same news, made different decisions?
und die Lüge wurde mit Gewissheit gekleidet,
und niemand hat die Zahlen in Frage gestellt.
Aus diesem Grund untersuchen wir die Genauigkeit diagnostischer Tests.
es gibt nur four possible truths.
Zwei sind Segen. Zwei sind Flüche.
Every Test Result Has a Reality Behind It
Test: Positive
Test: Positive
Test: Negative
Test: Negative
True Positive (TP)
Sick person correctly identified.
Der Test hat die Wahrheit gesagt.
False Positive (FP)
Healthy person wrongly alarmed.
Der Test hat gelogen.
False Negative (FN)
Sick person wrongly reassured.
Die tödlichste Lüge.
True Negative (TN)
Healthy person correctly cleared.
Der Test hat die Wahrheit gesagt.
Die 2x2-Verwirrungsmatrix
| Disease Present | Disease Absent | |
|---|---|---|
| Test Positive | TP True Positive |
FP False Positive |
| Test Negative | FN False Negative |
TN True Negative |
Know them by name.
TP, TN: Der Test hat die Wahrheit gesagt.
FP, FN: Der Test hat gelogen.“
Sensitivity asks: Can it find the sick?
Specificity asks: Can it spare the healthy?
High sensitivity = few false negatives = few missed cases.
High specificity = few false positives = few false alarms.
Lower the threshold to catch more sick people? You'll alarm more healthy people.
Raise the threshold to spare healthy people? You'll miss more sick people.
This is the threshold effect– die Wippe der Diagnose.
SnNout: Sensitive tests rule OUT
A highly sensitive test, when negative, rules out disease. If it didn't find it, it's probably not there.
SpPin: Specific tests rule IN
Ein hochspezifischer Test entscheidet, wenn er positiv ist, über die Erkrankung. Wenn dort steht, dass Sie es haben, dann haben Sie es wahrscheinlich.
SpPin: Specific Positive rules IN
Spezifität schont den Brunnen.
But no test masters both perfectly—
Das ist die Last, die wir tragen müssen.“
Die Welt brauchte einen Test, der das konnte Finden Sie die Infizierten schnell.
But what if the rapid test missed too many?
Bei Menschen MIT Symptomen:
Sensitivity: 73% (missed 27% of cases)
In people WITHOUT symptoms:
Sensitivity: 55% (missed 45% of cases)
Fast der Hälfte der asymptomatischen Infizierten wurde mitgeteilt, dass sie gesund seien.
Thanksgiving Dinners
Families tested negative in the morning, gathered indoors, unknowingly infected grandparents
Workplace Outbreaks
Workers tested negative, came to work, infected colleagues in the break room
Hospital Transmission
Patients tested negative, admitted to wards, infected vulnerable patients
und die Familie versammelte sich,
und der Großvater umarmte seine Enkel,
und am Ende des Winters war er weg.
Doch der Patient stellt eine andere Frage:
"I tested positive. What are my chances?"
Ihr Patient wurde positiv auf eine seltene Krankheit getestet (Prävalenz 1 von 1000).
Question: Wie groß ist die Wahrscheinlichkeit, dass sie tatsächlich an der Krankheit leiden?
Die meisten Ärzte sagen 95 %. Die wahre Antwort? About 2%.
Specificity tells how many well it will spare.
But only the likelihood ratio answers:
Was bedeutet dieses Ergebnis für DIESEN Patienten?"
that found too much?
When does finding disease become causing harm?
Mammography could detect tumors too small to feel.
Frauen wurde gesagt: "Annual mammograms save lives."
But what if some of those "cancers" would never have killed?
Bei der Frau wird eine Krankheit diagnostiziert, die mit Operation, Bestrahlung, Chemotherapie behandelt wird – für eine Krankheit, die ihr niemals geschadet hätte.
Independent UK Panel on Breast Cancer Screening. Lancet. 2012;380:1778-1786
auf Brustkrebs untersucht
(treated unnecessarily)
(anxiety, biopsies)
Ist das ein guter Handel? Die Antwort hängt von Werten ab, nicht nur Zahlen.
und nannte es Krankheit,
und die Frau wurde verletzt und verbrannt und vergiftet –
für einen Schatten, der sie niemals verdunkelt hätte Tage.“
Das ist das Problem der Überdiagnose.
Aber wenn man alle Studien zusammenfasst,
wenn man ihre Beweise zusammen wägt –
The truth becomes harder to hide.
More Precision
Combining studies gives narrower confidence intervals, reducing uncertainty
Detect Heterogeneity
Why do different studies give different answers? Setting? Population? Threshold?
Expose Publication Bias
Werden negative Studien ausgeblendet? Trichterdiagramme offenbaren Asymmetrie
Explore Thresholds
Build SROC curves to understand the sensitivity-specificity trade-off
They are correlated: Wenn das eine steigt, sinkt das andere tendenziell (der Schwellenwert). Effekt).
The bivariate model berücksichtigt diese Korrelation und liefert gültige gepoolte Schätzungen.
Reitsma JB et al. J Clin Epidemiol. 2005;58:982-990
ROC Space
Die Kurve zeigt den Kompromiss
Higher = better test
Diagonal line = useless test (random guessing)
The curve = Zusammenfassung der Leistung aller Studien
beginnen, die Wahrheit zu enthüllen.
Die SROC-Kurve ist der Weg von Beweise –
showing what the test can truly do."
Eine Studie besagt, dass die Sensitivität 95 % beträgt.
Another says 60%.
An welche Wahrheit glauben Sie?
High heterogeneity means Die Studien messen unterschiedlich Dinge— or the test performs differently in different settings.
Threshold Differences
Unterschiedliche Grenzwerte für „positive“ Ergebnisse (z. B. unterschiedliche HbA1c-Grenzwerte für Diabetes)
Population Differences
Disease severity, age, comorbidities differ between studies
Setting Differences
Primary care vs. specialist clinic vs. emergency room
Quality Differences
Risk of bias, verification bias, spectrum bias
Studies agree
Some disagreement
Major disagreement
Sie können Äpfel und Birnen nicht mitteln. Sie müssen explain why studies differ before pooling them.
den Dissens nicht zum Schweigen bringen.
Ask: Why do they see differently?
Die Meinungsverschiedenheit selbst lehrt.“
Sensitivity & Specificity
How well the test performs on sick vs. healthy people
Likelihood Ratios (LR+, LR-)
How much a result changes the probability of disease
Diagnostic Odds Ratio (DOR)
Single measure of test discrimination (DOR = LR+ / LR-)
Bereich Unter dem SROC-Kurve (AUC)
Overall test performance across all thresholds (0.5 = useless, 1.0 = perfect)
bivariate meta-analysis
für DTA-Reviews
Open-Access-Tool
Rutter & Gatsonis 2001 - HSROC model
Cochrane Handbook Ch. 10 - DTA methods
Was there a valid reference standard?
Gold standard test applied to all patients?
Wurden Dolmetscher geblendet?
Test readers unaware of diagnosis, and vice versa?
War das Spektrum angemessen?
Patients similar to your clinical population?
War das Schwellenwert vorab festgelegt?
Oder wurde er gewählt, um die Ergebnisse zu maximieren?
Mit dem SROC und dem Maß der Übereinstimmung bewaffnet,
können Sie die Lüge des Tests durchschauen –
und seine Wahrheit beurteilen sich selbst.“
When a machine claims to see what no other machine can see,
und niemand fragt: "Zeigen Sie mir den Beweis"?
FDA found:
• Results varied by 146% between runs on the same sample
• Edison machines failed 87% of proficiency tests
• Zero peer-reviewte Validierungsstudien veröffentlicht
• Patienten erhielten HIV-positive Ergebnisse für Proben, die negativ waren
Sources: FDA Warning Letter 2016; Carreyrou J. Bad Blood. 2018; CMS Inspection Reports.
Was wählen Sie?
Face lawsuits
Harm patients
Schützen Sie Ihre Patienten
Avoid Scandal
A $9 billion valuation became a criminal fraud conviction.
Jedes Krankenhaus, das vor der Unterzeichnung Validierungsdaten verlangte
war vor der Lüge geschützt.
Jedes Krankenhaus, das dem Marketing vertraut hat
became complicit in harming patients.
Das Fehlen von Beweisen ist kein Marketingproblem.
It is a patient safety emergency.
Wer zahlt den Preis?
The test result comes in 15 minutes.
Aber was ist, wenn das Ergebnis ist 15 minutes of false confidence?
Real-world performance (Cochrane 2022):
• Symptomatic individuals: 73% sensitivity (missed 27%)
• Asymptomatic individuals: 58% sensitivity (missed 42%)
• Early infection (days 0-3): ~50% sensitivity
Fast der Hälfte der asymptomatischen Infizierten wurde mitgeteilt, dass sie „frei“ seien.
Source: Dinnes J et al. Cochrane Database Syst Rev. 2022;7:CD013705
Was wählen Sie?
School closure
Three hospitalizations
Teacher isolates
Outbreak prevented
It means: "not detected."
Der Unterschied zwischen diesen beiden Sätzen
is measured in lives.
is almost meaningless.
SnNout only works when sensitivity is HIGH.
Know your test's limits before trusting its verdict.
still cause harm?
Was ist, wenn der Krebs gefunden wird?
would never have hurt you?
Sensitivity: ~85% | Specificity: ~90%
Für 1.000 Frauen, die 10 Jahre lang jährlich untersucht werden:
• 1 death prevented auf Brustkrebs untersucht
• 5 women overtreated für Krebserkrankungen, die ihnen nie geschadet hätten
• 100-500 false alarms leading to biopsies, anxiety, repeat imaging
Overdiagnosis rate: 19-30% of screen-detected cancers
Source: Independent UK Panel on Breast Cancer Screening. Lancet. 2012;380:1778-1786
Was wählen Sie?
Tumor war indolent (DCIS)
Would never have harmed her
Versteht Nutzen UND Schaden
Autonomy preserved
A test can be accurate und immer noch verursachen harm.
When overdiagnosis exceeds lives saved,
we must ask: Is finding always helping?
kann den Nutzen übersteigen true positives.
Always weigh benefits against harms.
Screening spart nicht immer.
is worse than missing it?
What if the treatment causes more suffering
than the disease ever would?
• Empfindlichkeit für hochgradigen Krebs: 21%
• Detects many indolent cancers that would never harm
Lower cutoff to 2.5 ng/mL:
• Sensitivity rises to: 40%
• But overdiagnosis doubles
Treatment consequences:
• 20-30% of men experience incontinence after prostatectomy
• 30-70% experience erectile dysfunction
Source: US Preventive Services Task Force. JAMA. 2018;319(18):1901-1913
Welche Schwelle wählen Sie?
Thousands of unnecessary
Biopsien und Behandlungen
But most missed are indolent
Fewer unnecessary treatments
Some preventable deaths
No overtreatment harm
Every threshold trades Sensibilität für Spezifität,
Erkennung einer Überdiagnose.
Die Auswahl ist nicht medizinisch. Es ist ethical.
Es hängt davon ab, welche Schäden Sie bereit sind zu akzeptieren.
It is a values problem.
Before choosing a cutoff, ask:
What is worse: missing disease or overtreating the healthy?
Different truths.
How can identical numbers
mean opposite things?
Sensitivity: ~80% | Specificity: ~95%
In high-prevalence setting (TB prevalence 10%):
• Positive Predictive Value: 85%
• A positive test usually means TB
In low-prevalence setting (TB prevalence 0.1%):
• Positive Predictive Value: 15%
• A positive test is usually a false positive
Source: Pai M et al. Lancet Infect Dis. 2014;14(8):765-773
War Schließen Sie daraus?
Patient infects family
Verzögert die Diagnose um Monate
Chest X-ray, sputum
Treat early if confirmed
PPV und NPV are properties of the population.
Das gleiche Ergebnis bedeutet different things
in different people.
A positive test in a high-risk patient means disease.
The same positive in a low-risk patient means probably nothing.
Context is everything.
Theranos: Demand Validation
No peer-reviewed data = no trust, regardless of marketing claims
COVID Rapid Tests: Know Sensitivity Limits
„Nicht erkannt“ ist nicht dasselbe wie „nicht infiziert“
Mammography: Weigh Benefits vs. Harms
Finding is not always helping; overdiagnosis causes real harm
PSA: The Threshold is a Values Choice
Alle Cutoff tauscht Sensitivität gegen Spezifität; Es gibt keine „richtige“ Antwort
TB Test: Context Determines Meaning
The same result means different things in different populations
Hier zitierte wichtige Quellen Kurs
- Carreyrou J. Bad Blood: Secrets and Lies in a Silicon Valley Startup. Knopf, 2018.
- Dinnes J, et al. Rapid, point-of-care antigen tests for diagnosis of SARS-CoV-2 infection. Cochrane Database Syst Rev. 2022;7:CD013705.
- Unabhängiges britisches Gremium für Brustkrebs-Screening. Nutzen und Schaden des Brustkrebs-Screenings. Lancet. 2012;380:1778-1786.
- Reitsma JB, et al. Die bivariate Analyse von Sensitivität und Spezifität liefert aussagekräftige zusammenfassende Messungen in diagnostischen Überprüfungen. J Clin Epidemiol. 2005;58:982-990.
- Rutter CM, Gatsonis CA. A hierarchical regression approach to meta-analysis of diagnostic test accuracy evaluations. Stat Med. 2001;20:2865-2884.
- Deeks JJ, et al. The performance of tests of publication bias in systematic reviews of diagnostic test accuracy. J Clin Epidemiol. 2005;58:882-893.
- Macaskill P, et al. Cochrane Handbook for Systematic Reviews of Diagnostic Test Accuracy. Chapter 10. 2023.
- Higgins JPT, Thompson SG. Quantifying heterogeneity in a meta-analysis. Stat Med. 2002;21:1539-1558.
- US Food and Drug Administration. Warning Letter to Theranos Inc. 2016.
- US Preventive Services Task Force. Screening for Prostate Cancer. JAMA. 2018;319(18):1901-1913.
- Pai M, et al. Tuberculosis. Lancet Infect Dis. 2014;14(8):765-773.
die beiden Vorzüge eines Tests,
den grausamen Kompromiss des Schwellenwerts
und die Kunst des Poolings Beweise.
Wenn der nächste Test Sie belügt –
you will know how to see through it."
Wenn der Test lügt – Jetzt wissen Sie es.