==================== MODUL 1: DER BETRUG (Theranos) ====================
Haben Sie die Geschichte der Frau nicht gehört?
who promised to Verändere die Welt mit einem Tropfen Blut,
who raised billions on a test that never worked?
Palo Alto, 2003
STANFORD UNIVERSITY
Ein Neunzehnjähriger brach mit einer Vision ab: Hunderte Blutuntersuchungen aus einem einzigen Tropfen.

Investors believed. Walgreens believed. The Pentagon believed.

They gave her $9 billion.

Doch die Tests ergaben falsche Ergebnisse. Den Patienten wurde gesagt, sie hätten HIV, obwohl dies nicht der Fall war. Den Patienten wurde mitgeteilt, dass ihr Blut zu diesem Zeitpunkt normal sei dying.
Carreyrou J. Bad Blood. 2018
Der Entscheidungsbaum der Täuschung

What Theranos Did vs. What Should Happen

New Diagnostic Test
SHOULD DO
Validate Against Gold Standard
Publish TP/FP/FN/TN
FDA Approval
THERANOS DID
Skip Validation
Hide Failures
Harm Patients
„Und der Test hat gelogen,
und die Lüge wurde mit Gewissheit gekleidet,
und niemand fragte nach dem 2×2-Tisch.“

Aus diesem Grund untersuchen wir die Genauigkeit diagnostischer Tests.

==================== MODUL 2: DIE VIER ERGEBNISSE ====================
When a test speaks,
es gibt nur four possible truths.

Zwei sind Segen. Zwei sind Flüche.

Was passiert, wenn eine systematische Überprüfung jeder Studie gleichermaßen vertraut?

REAL DATA

Sensitivitätsanalysen in systematischen DTA-Überprüfungen zeigen durchweg, dass der Ausschluss von Studien mit hohem Bias-Risiko die gepoolten Schätzungen verändert. Beim Mammographie-Screening neigen Fall-Kontroll-Designs mit unverblindeter Interpretation dazu, die Empfindlichkeit zu erhöhen. Das allgemeine Prinzip ist gut dokumentiert: Die QUADAS-2-Qualitätsbewertung kann die gepoolte Empfindlichkeit um 10-15 percentage points verschieben, wenn voreingenommene Studien entfernt werden.

Das QUADAS-2-Mammographie-Audit
Ein Prüfteam bündelt 15 Mammographie-DTA-Studien. Bei fünf besteht aufgrund des Fall-Kontroll-Designs und der unverblindeten Interpretation ein hohes Verzerrungsrisiko.
PFAD A: Alle Studien bündeln
Include all 15 studies regardless of quality
Biased 2x2 tables inflate TP counts, producing a pooled sensitivity of 87%
OUTCOME: Overconfidence in screening accuracy
PATH B: Apply Quality Assessment
Exclude high risk-of-bias studies using QUADAS-2
Remaining 10 low-RoB studies yield sensitivity of approximately 75%
OUTCOME: Honest numbers guide honest decisions
THE REVELATION
Die vier Ergebnisse (TP, FP, FN, TN) sind nur vertrauenswürdig, wenn die Studie, die sie hervorgebracht hat, vertrauenswürdig ist. Eine voreingenommene Studie verunreinigt die gesamte 2x2-Tabelle.
Der Baum der Ergebnisse

Every Test Result Has a Reality Behind It

Patient Tested
Was ist die WAHRHEIT?
Has Disease
D+
TPTest +
FNTest -
No Disease
D-
FPTest +
TNTest -
Der heilige 2×2-Tisch

HIV Rapid Test Example (Real Data)

HIV+HIV-Total
Test +983101
Test -2895897
Total100898998
AUS DIESER TABELLE KOMMT ALLE WAHRHEIT
Sensitivity = 98/100 = 98%
Specificity = 895/898 = 99.7%
"Two outcomes save. Two outcomes harm.
TP, TN: Der Test hat die Wahrheit gesagt.
FP, FN: Der Test hat gelogen.
Know them by name, for they determine fate."
==================== MODUL 3: HIV-FENSTERZEIT ====================
Haben Sie noch nichts von dem untersuchten Blut gehört?
found clean,
und an Tausende gegeben –
while death swam within it?
Die Blutversorgungskrise, 1985
UNITED STATES
When HIV testing began, doctors celebrated: they could now screen the blood supply.

Aber der Test hatte eine window period– Wochen nach der Infektion, als das Virus vorhanden war, aber undetectable.

Blut wurde getestet. Das Blut war „negativ“. Es wurde Blut transfundiert.

8,000-12,000 Americans wurden durch Transfusionen infiziert, bevor bessere Tests das Fenster schlossen.
CDC. MMWR. 1987;36(49):833-840
The Window Period Decision Tree

Why False Negatives Are Deadly

Person Recently Infected
Time Since Infection?
< 2 weeks
Test NEGATIVEVirus present!
Blood DonatedOthers infected
> 4 weeks
Test POSITIVECorrectly detected
Blood DiscardedSupply safe
Die Empfindlichkeit ändert sich im Laufe der Zeit
0%
Day 1-7
Eclipse period
~50%
Day 14
Seroconversion
~95%
Day 21
Most detected
99.9%
Day 45+
Window closed
THE LESSON
Die Empfindlichkeit ist nicht festgelegt. It depends on when you test. A "99% sensitive" test may be 0% sensitive in early infection.
„Und der Test sagte ‚sauber‘,
denn das Virus hatte sein Gesicht noch nicht gezeigt.
Und das Blut wurde geteilt,
und die Infektion breitete sich auf Unschuldige aus.“
==================== MODUL 4: DES TRAGEDY ====================
Haben Sie noch nie von der Pille gehört, die Müttern verabreicht wird?
to protect their pregnancies,
that planted cancer in their daughters
twenty years before it bloomed?
Die DES-Tragödie, 1938-1971
UNITED STATES & EUROPE
Diethylstilbestrol (DES) was given to millions of pregnant women to prevent miscarriage.

No proper clinical trial was ever conducted. Doctors assumed it worked because it seemed reasonable.

Decades later, their daughters developed a rare cancer: clear cell adenocarcinoma of the vagina. A cancer so rare it was a diagnostic signal in itself.

5-10 million women wurden entlarvt. Der Schaden ging über Generationen hinweg.
Herbst AL et al. N Engl J Med. 1971;284:878-881
Der Validierungsentscheidungsbaum

What Should Have Happened

New Medical Intervention
Wurde es ordnungsgemäß getestet?
YES
Randomized Trial
Long-term Follow-up
Know True EffectsNutzen UND Schaden
NO (DES)
Assumption Only
Widespread Use
Hidden HarmDiscovered too late
Das Diagnosesignal
WENN SELTENHEIT ZUM BEWEIS WIRD
Klarzelliges Adenokarzinom der Vagina war bei jungen Frauen so selten, dass 7 cases in one hospital triggered an investigation.

Der Cluster selbst war der Diagnosetest:
Sensitivity to DES exposure: nearly 100%
Wenn Sie in diesem Alter an dieser Krebserkrankung erkrankt sind, waren Sie mit an Sicherheit grenzender Wahrscheinlichkeit exponiert.
1:1000
Risk of clear cell
cancer in DES daughters
5-10M
Women exposed
worldwide
„Und die Mütter nahmen die Pille in der Hoffnung,
und die Töchter wuchsen im Schatten,
und zwanzig Jahre später blühte der Krebs –
a diagnosis that indicted a generation of medicine."
==================== MODUL 5: SENSITIVITÄT & SPEZIFIZITÄT ====================
A test has two virtues and two vices.

Sensitivity: Kann es die Kranken finden?

Specificity: Kann es die Gesunden verschonen?

Kann man einer Sensitivitätszahl eines Labors vertrauen, wenn der Test in der Praxis angewendet wird?

REAL DATA

The BinaxNOW COVID-19 rapid antigen test reported sensitivity of approximately 84-97% in symptomatic individuals in manufacturer studies. However, real-world evaluations found sensitivity as low as 35-64% bei asymptomatischen Personen, abhängig von Viruslast und Zeitpunkt. Die Cochrane-Überprüfung von Antigen-Schnelltests (Dinnes 2022) bestätigte in über 100 Studienauswertungen eine durchschnittliche Sensitivität von 73% bei symptomatischen und nur 55% bei asymptomatischen Populationen.

The COVID Rapid Test Paradox: 2020-2021
A university plans to screen asymptomatic students weekly before allowing campus access. They read the manufacturer's claim of high sensitivity.
PATH A: Trust Lab Sensitivity
Rely on manufacturer's high sensitivity figure
Asymptomatische Träger mit geringer Viruslast testen negativ und nehmen an Kursen teil, wodurch sich die Verbreitung ausbreitet Virus
OUTCOME: False sense of safety; campus outbreaks
PFAD B: Fordern Sie reale Daten an
Suchen Sie Studien in der tatsächlichen Zielgruppe (asymptomatische Studenten)
Discover sensitivity is roughly 55% in asymptomatic people; add serial testing and other safeguards
OUTCOME: Layered safety catches more cases
THE REVELATION
Sensitivität ist keine feste Eigenschaft eines Tests. Sie ändert sich je nach Population, Krankheitsstadium und Umgebung. Fragen Sie immer: Empfindlichkeit bei whom?
Sensibilität: Der Jäger
THE FORMULA
Sensitivity = TP / (TP + FN)
"Of all the sick, how many did we catch?"

Worked Example: COVID PCR Test

Given: 200 infected patients tested
TP = 196 (correctly positive), FN = 4 (missed)
Sensitivity = 196 / (196 + 4) = 196/200 = 98%
Interpretation: Test catches 98 of every 100 infected people
Besonderheit: Der Wächter
THE FORMULA
Specificity = TN / (TN + FP)
"Of all the healthy, how many did we spare?"

Worked Example: Same COVID PCR Test

Given: 1000 uninfected people tested
TN = 999 (correctly negative), FP = 1 (false alarm)
Specificity = 999 / (999 + 1) = 999/1000 = 99.9%
Interpretation: Test correctly clears 999 of every 1000 healthy people
Die Gedächtnisregeln

When to Use Which Test

Was brauchen Sie?
RULE OUT disease
Use HIGH SENSITIVITY
SnNoutSensitive Negative = OUT
RULE IN disease
Use HIGH SPECIFICITY
SpPinSpecific Positive = IN
„Sensibilität fängt die Kranken ein.
Spezifität schont den Brunnen.
But no test masters both perfectly—
Das ist die Last, die wir tragen.“
==================== MODUL 6: DER BASISRATE-FALLACY ====================
Haben Sie den Arzt nicht gesehen?
who saw 99% accurate
and believed a positive result meant 99% certainty?

Dies ist der tödlichste Fehler in der Medizin.
Der Basiszins-Irrtum
THE PUZZLE
A disease affects 1 in 1000 people.
Ein Test ist zu 99 % empfindlich und zu 99 % spezifisch.
A patient tests positive.

Wie hoch ist die Wahrscheinlichkeit, dass sie an der Krankheit leiden?

Most doctors say ~99%. Die tatsächliche Antwort liegt bei etwa 9 %.
Die Mathematik enthüllt

Testing 100,000 People (Prevalence 1/1000)

Step 1: 100 have disease, 99,900 healthy
Step 2: Of 100 sick: 99 test positive (TP), 1 negative (FN)
Step 3: Of 99,900 healthy: 999 test positive (FP), 98,901 negative (TN)
Step 4: Total positives = 99 + 999 = 1,098
PPV = TP / All Positives = 99 / 1,098 = 9%
91 % der positiven Ergebnisse sind FALSCH-POSITIVE!
Interactive Base Rate Calculator

See How Prevalence Changes PPV

Prevalence:
1%
Sensitivity:
99%
Specificity:
99%
9%
Positive Predictive Value (PPV)
91 % der positiven Ergebnisse sind Fehlalarme
Der Entscheidungsbaum der Prävalenz

Same Test, Different Settings

Test: 99% Sens, 99% Spec
Where Is Testing Done?
General Pop
0.1%
PPV = 9%91% false +
High-Risk
10%
PPV = 92%8% false +
Confirmatory
50%
PPV = 99%1% false +
„Und der Arzt sagte ‚zu 99 % zutreffend‘“
und der Patient hörte „99 % sicher“
und beide wurden getäuscht –
denn sie haben vergessen zu fragen: Wie selten ist diese Krankheit?“
Haben Sie noch nie von der Maschine gehört?
that could find TB in two hours,
das hieß revolutionary
habe aber das verpasst drug-resistant strains?
Die GeneXpert-Geschichte, Südafrika
CAPE TOWN, 2010
Ein Jahrhundert lang erforderte die TB-Diagnose das wochenlange Wachstum von Bakterien. Dann kam GeneXpert: Ergebnisse 2 hours.

South Africa deployed it nationwide. The WHO endorsed it.

Aber bei Patienten mit low bacterial loads—often HIV co-infected— sensitivity dropped to 67%. One in three cases missed.

Und beim Nachweis einer Rifampicin-Resistenz hat es gefehlt 5% von resistenten Fällen. Diese Patienten erhielten die falsche Behandlung. Die resistente Tuberkulose breitete sich aus.
Steingart KR et al. Cochrane Database Syst Rev. 2014;1:CD009593
TB Diagnosis Decision Tree

Wenn GeneXpert nicht ausreicht

Suspected TB Patient
GeneXpert Test
Positive
Rifampicin?
SensitiveStandard Tx
ResistantMDR-TB Tx
Negative
HIV+ or High Suspicion?
YesCulture needed
NoLikely negative
Sensitivity by Patient Type
98%
Smear-positive
(high bacterial load)
67%
Smear-negative
(low bacterial load)
61%
HIV co-infected
(immune suppressed)
THE LESSON
Die Empfindlichkeit eines Tests in klinischen Studien entspricht möglicherweise nicht der Empfindlichkeit bei Ihren Patienten. Kennen Sie Ihre Bevölkerung.
„Und die Maschine sagte ‚Negativ‘
und der Arzt glaubte der Maschine,
und der Patient ging mit Tuberkulose in der Lunge nach Hause,
Hustenwiderstand in die Welt.“
==================== MODUL 8: PSA-KONTROVERSE ====================
Haben Sie noch nie von dem Test für Männer gehört?
das fand Krebsarten, die das tun würden never kill,
und führte zu Behandlungen, die destroyed lives?
Die PSA-Screening-Tragödie
UNITED STATES, 1990s-2010s
PSA (Prostate-Specific Antigen) could detect prostate cancer early.

Ärzte untersuchten Millionen Männer. Es wurden Krebserkrankungen gefunden. Prostata wurde entfernt.

Aber viele dieser „Krebsarten“ hätten nie Symptome verursacht. Die Operation verursacht Impotenz und Inkontinenz in men who would have died of old age, not cancer.
Moyer VA. Ann Intern Med. 2012;157:120-134
Das PSA-Screening-Dilemma: 2012
Ein 60-jähriger Mann fragt seinen Arzt nach dem PSA-Screening. PSA bei einem Grenzwert von 4,0 ng/ml hat eine Sensitivität von etwa 21 % für hochgradigen Krebs, erkennt aber viele indolente Krebsarten.
PATH A: Screen All Men
Routinemäßiges PSA-Screening für alle Männer über 50
Pro 1.000 untersuchten Personen über 13 Jahre: 1–2 Todesfälle verhindert, aber mehr als 100 Fehlalarme und 30–40 Männer wurden durch die Behandlung indolenter Krebserkrankungen impotent oder inkontinent.
OUTCOME: Net harm exceeds benefit at population level
PATH B: Shared Decision-Making
Diskutieren Sie Schaden vs. Nutzen; Individualisierung mit Risikofaktoren, Lebenserwartung und Patientenwerten
High-risk men can choose screening; low-risk men can decline; active surveillance replaces immediate surgery for low-grade findings
OUTCOME: Fewer unnecessary treatments; patient autonomy preserved
THE REVELATION
Ein Test mit hohen Erkennungsraten kann mehr schaden als nützen, wenn er Bedingungen findet, die nicht gefunden werden müssen. Überdiagnose ist der versteckte Preis einer hohen Sensitivität bei indolenten Erkrankungen.
Die Zahlen des Schadens
1
Leben gerettet
prostate cancer
per 1000 screened
30-40
Men made impotent
or incontinent
per 1000 screened
100+
False positives
(biopsies, anxiety)
per 1000 screened
THE REVERSAL
In 2012, the US Preventive Services Task Force recommended against routinemäßiges PSA-Screening. Der Test ergab zu viel, was nicht gefunden werden musste.
Patient Decision Aid: PSA Screening

Wenn 1.000 Männer im Alter von 55 bis 69 Jahren 13 Jahre lang untersucht werden

Deaths from prostate cancer prevented
1-2 men
Men who will have false positive requiring biopsy
100-120 men
Männer, bei denen Krebs diagnostiziert wurde, der ihnen niemals schaden würde
20-50 men
Men left impotent or incontinent from treatment
30-40 men
Ist dieser Kompromiss für Sie akzeptabel?
„Und der Test fand den Schatten,
und der Chirurg schnitt,
und der Mann lebte – machtlos, inkontinent –
von einem Krebs, der niemals aufgewacht wäre.
==================== MODUL 9: TROPONIN & HERZANGRIFFE ===================
Haben Sie noch nicht von dem Mann mit Brustschmerzen gehört
dessen erstes Troponin war normal,
der nach Hause geschickt wurde –
und vorher starb Morgen?
Das Troponin-Timing-Problem
EMERGENCY DEPARTMENTS WORLDWIDE
Troponin ist der Goldstandard für die Herzinfarktdiagnose. Aber es dauert 3-6 hours to rise after myocardial injury.

A patient arrives one hour after chest pain begins. Troponin is tested: normal. "You're fine. Go home."

Das Herz starb. Das Protein war noch nicht ausgetreten.

Studies show 2-5% of MI patients sent home from ED die within 30 days.
Pope JH et al. N Engl J Med. 2000;342:1163-1170
Serial Testing Decision Tree

Das Zwei-Troponin-Protokoll

Chest Pain Patient
First Troponin
Elevated
Treat as MI
Normal
When Did Pain Start?
<6 hrs
Wait 3 hrsRepeat troponin
>6 hrs
Low riskConsider d/c
High-Sensitivity Troponin
~70%
Conventional troponin
sensitivity at 0 hrs
~95%
hs-Troponin
sensitivity at 0 hrs
99%
hs-Troponin
at 3 hrs serial
THE TRADE-OFF
High-sensitivity troponin catches more heart attacks early. But it also has more false positives—elevated in kidney disease, heart failure, sepsis, and marathon runners.
„Und der Test ergab ‚normal‘
denn das Herz hatte gerade begonnen zu sterben.
Und der Patient war es beruhigt,
and went home to finish dying."
==================== MODUL 10: LIKELIHOOD-VERHÄLTNISSE ====================
Die Empfindlichkeit beschreibt den Test.
Spezifität beschreibt den Test.

Aber der Patient fragt:
"I tested positive. What are MY chances?"

Was passiert, wenn die veröffentlichte Sensitivität eines Tests höher ist als die Wahrheit und die von Ihnen berechneten Wahrscheinlichkeitsverhältnisse daher falsch sind?

REAL DATA

Rapid strep tests (RADT) showed pooled sensitivity of approximately 86% in veröffentlichten Studien, die in Cochrane-Reviews enthalten sind. Allerdings ergaben Zulassungsanträge der FDA 510(k), die unveröffentlichte Herstellerdaten enthalten, Sensitivitätsschätzungen von nur 70-75%. Veröffentlichte Studien mit höherer Sensitivität wurden eher zur Veröffentlichung eingereicht – ein klassischer Fall von Publikationsbias, der die scheinbare Genauigkeit erhöht.

The Rapid Strep Test Publication Gap
Ein Arzt berechnet LR+ aus veröffentlichten Daten (Sensitivität 86 %, Spezifität 95 %), um zu entscheiden, ob Halsschmerzen eines Kindes behandelt werden sollen. Aber die wahre Sensitivität liegt möglicherweise nur bei 70 %.
PATH A: Trust Published Meta-Analysis
Verwenden Sie LR+ aus veröffentlichten Daten (86/5 = 17,2)
Überschätztes LR+ führt zu übermäßigem Vertrauen in ein negatives Ergebnis; Kinder mit Streptokokken werden ohne Antibiotika nach Hause geschickt
OUTCOME: Missed strep leads to rheumatic fever risk
PFAD B: Zulassungsdaten einholen
Verwenden Sie LR+ aus FDA-Anträgen (70/5 = 14) und beachten Sie, dass LR- schlechter ist (0,32 vs. 0,15)
Recognize a negative RADT cannot confidently exclude strep; back up with throat culture when clinical suspicion is high
OUTCOME: Appropriate caution protects children
THE REVELATION
Wahrscheinlichkeitsverhältnisse sind nur so ehrlich wie die Sensitivität und Spezifität, die sie erzeugen. Der Publikationsbias steigert die Genauigkeit und macht LR+ zu optimistisch und LR- zu beruhigend. Fragen Sie immer: Fehlen unveröffentlichte Studien?
Likelihood Ratios
POSITIVE LIKELIHOOD RATIO
LR+ = Sensitivity / (1 - Specificity)
How much more likely is a + result in sick vs healthy?
NEGATIVE LIKELIHOOD RATIO
LR- = (1 - Sensitivity) / Specificity
How much more likely is a - result in sick vs healthy?
Das Fagan-Nomogramm

Von der Wahrscheinlichkeit vor dem Test zur Wahrscheinlichkeit nach dem Test

Pre-Test
Probability
99%
50%
20%
5%
1%
Likelihood
Ratio
100
10
1
0.1
0.01
Post-Test
Probability
99%
80%
50%
20%
1%
Draw a line from pre-test through LR to find post-test probability
Interpreting Likelihood Ratios

Wie wirkungsvoll ist dieser Test?

LR+ Value?
LR+ > 10Strong rule-in
5-10Moderate
2-5Weak
1-2Useless
LR- Value?
< 0.1Strong rule-out
0.1-0.2Moderate
0.2-0.5Weak
0.5-1Useless
„Sensibilität erzählt von den Kranken.
Spezifität erzählt vom Brunnen.
But the likelihood ratio answers:
Was bedeutet dieses Ergebnis für DIESEN Patienten?"
============================================= MALARIA-RDTs ===================
Hast du nicht das Kind mit Fieber im Dorf gesehen?
der Schnelltest, der besagte negative,
and the Plasmodium das hat sich immer mehr vermehrt?
Das Malaria-RDT-Problem
SUB-SAHARAN AFRICA
Malaria kills 600,000 people yearly, mostly children under 5.

Rapid Diagnostic Tests were meant to guide treatment in remote areas without microscopes or laboratories.

But when parasitemia is low—Das RDT übersieht Fälle. And when P. falciparum löscht das HRP2-Gen – the RDT sees nothing at all.
WHO. Malaria RDT Performance. 2022
Der klinische Entscheidungsbaum

Child with Fever in Malaria-Endemic Area

Febrile Child
Perform RDT
RDT Positive
Behandlung gegen Malaria
RDT Negative
Clinical Suspicion?
High
Treat Anywayor Microscopy
Low
Look forOther Cause
Sensitivity Varies by Parasitemia
95%
High parasitemia
(>200/μL)
75%
Low parasitemia
(100-200/μL)
50%
Very low
(<100/μL)
DIE KLINISCHE LEKTION
A negative RDT does not rule out malaria in endemic areas. Clinical judgment must override the test when suspicion is high.
„Und der Test sagte ‚negativ‘,
und das Kind wurde nach Hause geschickt,
und die Parasiten vermehrten sich im Dunkeln,
und am Morgen konnte das Kind nicht aufwachen.
==================== MODUL 12: COVID-SCHNELLTESTS ====================
Im Jahr der Pest,
Die Welt brauchte einen Test fast.

Aber schnell ist nicht gleich accurate.

Wenn eine neue Testgeneration mit höherer Empfindlichkeit auf den Markt kommt, wird sie dann automatisch besser?

REAL DATA

Hochempfindliche Troponin-Assays (hs-cTn) erhöhen die Empfindlichkeit für akuten Myokardinfarkt ab ca 70% (konventionelles Troponin bei Präsentation) auf über 95%. But specificity dropped from approximately 95% to around 80% weil hs-cTn Myokardschäden aus vielen Nicht-MI-Ursachen erkennt (Herzinsuffizienz, Sepsis, Nierenerkrankung, Lungenembolie). Der klinische Nettoeffekt erforderte eine HSROC-Modellierung über mehrere Studien hinweg, um den Kompromiss zu verstehen.

Der Troponin-Generationswechsel: 2010er Jahre
An emergency department adopts hs-troponin. More patients now test positive, but many do not have acute MI.
PATH A: Adopt Based on Sensitivity Alone
Feiern Sie, dass die MI-Erkennung von 70 % auf über 95 % gestiegen ist
Mehr falsch positive Ergebnisse führen zu unnötigen Katheterisierungen, Krankenhauseinweisungen und der Angst der Patienten vor nicht kardialen Troponin-Erhöhungen
OUTCOME: Overdiagnosis and wasted resources
PFAD B: Modellieren Sie den Kompromiss
Use serial measurements (0h/1h or 0h/3h protocols) and clinical context to maintain specificity
Rapid rule-out algorithms safely discharge low-risk patients; sensitivity remains high while managing the false positive rate
OUTCOME: Faster, safer triage of chest pain
THE REVELATION
Sensitivität und Spezifität stehen im Widerspruch zueinander. Eine neue Testgeneration, die die Sensitivität erhöht, führt häufig zu einer Verringerung der Spezifität. Die HSROC-Kurve ist das Instrument, das zeigt, ob der Netto-Kompromiss den Patienten hilft oder schadet.
Das Cochrane-Urteil

COVID-19 Rapid Antigen Tests (Dinnes 2022 Cochrane Review)

PopulationSensitivityMissed
Symptomatic73%27%
Asymptomatic55%45%
First 7 days80%20%

Dinnes J et al. Cochrane Database Syst Rev. 2022;7:CD013705

The False Security Decision Tree

Thanksgiving 2020: What Happened

Family Member Tests Negative
Truly Negative?
55% if asymptomatic
True NegativeSafe to gather
45% if asymptomatic
FALSE NegativeInfectious!
Treffen mit der FamilieGrandparents infected
„Und der Test sagte ‚negativ‘,
und die Familie umarmte sich,
und am Ende des Winters,
der Großvater wurde begraben.“
Haben Sie noch nichts von der Vorführung gehört?
Das hat Krebs gefunden would never kill,
und führte zu Behandlungen, die caused more harm than the disease?

Can you trust a DTA meta-analysis done in a spreadsheet?

REAL DATA

Für die DTA-Metaanalyse ist das bivariate Modell oder HSROC erforderlich – beide benötigen eine Maximum-Likelihood-Schätzung der korrelierten Sensitivität und Spezifität auf der Logit-Skala. Untersuchungen haben dokumentiert, dass manuelle Excel-Berechnungen häufig zu Fehlern führen: Eine bahnbrechende Studie von Reinhart & Rogoff (2010, Wirtschaftswissenschaften) zeigte, wie ein einfacher Tabellenfehler zu globalen politischen Änderungen führte. In DTA ignoriert die manuelle Anwendung von Logit-Transformationen und das separate Zusammenfassen von Sensitivität/Spezifität in Excel die Korrelation zwischen ihnen und kann zu gepoolten Schätzungen führen, die sich deutlich von validierten bivariaten Modellen in Software (R mada/reitsma, Stata metandi, SAS NLMIXED) unterscheiden.

Der QUADAS Excel-Fehler
Ein Forschungsteam benötigt gebündelte Sensitivität und Spezifität für eine systematische DTA-Überprüfung. Sie haben 12 Studien. Ein Teammitglied erstellt ein Excel-Modell; ein anderer verwendet das Mada-Paket von R.
PFAD A: Verwenden Sie die Tabellenkalkulation
Pool sensitivity and specificity separately in Excel using simple averages or fixed-effect formulas
Ignoriert die Korrelation zwischen Sensitivität und Spezifität; Zusammengesetzte Logit-Transformationsfehler; Die gebündelte Sensitivität verringerte sich um etwa 12 Prozentpunkte
OUTCOME: Wrong numbers published; clinical guidelines misled
PATH B: Use Validated Software
Verwenden Sie R (mada/reitsma), Stata (metandi) oder SAS (NLMIXED) mit dem bivariaten Modell
Ein ordnungsgemäßes bivariates GLMM berücksichtigt den Kompromiss zwischen Sensitivität und Spezifität, erzeugt gültige Konfidenzbereiche und berücksichtigt die Heterogenität zwischen Studien
OUTCOME: Reproducible, auditable, correct results
THE REVELATION
Bei der DTA-Metaanalyse handelt es sich nicht um einfaches Pooling. Die bivariate Natur der Daten (gepaarte Sensitivität und Spezifität) erfordert spezielle Statistiksoftware. Ein Tabellenkalkulationsfehler ist nicht nur eine Unannehmlichkeit – er kann die klinische Praxis verändern.
Das Problem der Überdiagnose
3-4
Lives saved
per 10,000 screened
50-130
Overdiagnosed
(treated unnecessarily)
~500
False alarms
(anxiety, biopsies)
THE QUESTION
Um drei bis vier Leben zu retten, erhalten schätzungsweise 50 bis 130 Frauen eine Operation, Bestrahlung oder Chemotherapie wegen Krebserkrankungen, die ihnen nie geschadet hätten.

Lohnt sich dieser Kompromiss?
Patient Decision Aid: Mammography

Wenn 10.000 Frauen im Alter von 50 bis 69 Jahren werden 10 Jahre lang untersucht

Deaths from breast cancer prevented
3-4 women
Women called back for false alarms
~500 women
Unnecessary biopsies
~200 women
Frauen, die wegen Krebs behandelt werden, der ihnen niemals schaden würde
~15 women
Ist die Vorsorgeuntersuchung das Richtige für Sie?
The Screening Cascade Decision Tree

10.000 Frauen über einen Zeitraum von 10 Jahren untersucht

10,000 Women
~1,000 RecalledAbnormal
~500 False
Alarm
~500 Biopsy
~50 cancer
~9,000 Cleared
Of ~50 Cancers Found
~35 Would Kill3-4 saved
~15 Would Never KillOverdiagnosed
„Und der Test fand den Schatten,
und nannte es Krebs,
und die Frau wurde verletzt und verbrannt –
für einen Schatten, der sie niemals verdunkelt hätte Tage.“
==================== MODUL 14: ALZHEIMER-AMYLOID ===================
Haben Sie noch nicht von dem Scan gehört
der die Plaques im Gehirn findet,
kann Ihnen aber nicht sagen
ob das? Geist wird fade?
Das Amyloid-Paradoxon
ALZHEIMER'S RESEARCH, 2010s-2020s
PET scans can now detect amyloid plaques—the hallmark of Alzheimer's.

But 30% of cognitively normal elderly have amyloid plaques. They may never develop dementia.

And 10-20 % der Menschen mit Demenz have no amyloid.

Der Test findet die Plaques nicht die Krankheit. Wir testen auf einen Ersatz, nicht auf die Ergebnis.
Jack CR et al. Lancet Neurol. 2018;17:760-773
Surrogate vs. Outcome Decision Tree

Worauf testen wir wirklich?

Diagnostic Test
What Does It Detect?
Outcome itself
Direct Diagnosisz. B. Biopsie bei Krebs
High clinical value
Surrogate marker
Indirect Signalz. B. Amyloid bei Demenz
Validated link?
YesUse cautiously
NoLimited value
"Und der Scan fand das Plaques,
und der Arzt nannte es Alzheimer,
und der Patient lebte in Angst–
of a forgetting that might never come."
==================== MODUL 15: QUADAS-2-QUALITÄT ===================
Nicht alle Studien sind gleich.

Some are biased.
Some are poorly designed.
Manche sollten nicht sein trusted.

Wie trennen wir die Spreu vom Weizen?

Was wäre, wenn die meisten DTA-Studien nicht einmal genügend Informationen liefern, um ihre Qualität zu beurteilen?

REAL DATA

Vor der Veröffentlichung der STARD-Initiative im Jahr 2003 ergab eine systematische Bewertung, dass weniger als half der DTA-Studien berichteten, dass die Interpretation von Indextests blind war und die Beschreibungen der Referenzstandards häufig unzureichend waren. Nach STARD verbesserte sich die Berichterstattung: Mehrere metaepidemiologische Bewertungen ergaben, dass die Einhaltung von STARD-Elementen erheblich zunahm, obwohl viele Studien bei wichtigen Elementen wie Flussdiagrammen und der Handhabung unbestimmter Ergebnisse immer noch unzureichend waren.

Die STARD-Revolution: 2003
Ein Team führt eine DTA-Studie zu einem neuen Point-of-Care-Test durch. Sie sind bestrebt, schnell zu veröffentlichen. Sie verfügen über die 2x2-Daten, haben jedoch keine Verblindung, keinen Patientenfluss oder unbestimmte Ergebnisse dokumentiert.
PATH A: Publish Quickly
Einreichen ohne STARD-Flussdiagramm oder vollständige Angabe der Methoden
Leser können Verblindung, Patientenspektrum oder Verifizierung nicht beurteilen. Die QUADAS-2-Bewertung bewertet jeden Bereich als „unklar“. Die Studie kann von zukünftigen systematischen Überprüfungen ausgeschlossen oder, schlimmer noch, mit überhöhtem Gewicht eingeschlossen werden.
OUTCOME: Waste of research; uninterpretable results
PATH B: Follow STARD Guidelines
Füllen Sie die STARD-Checkliste aus, erstellen Sie ein Patientenflussdiagramm, melden Sie unbestimmte Ergebnisse und beschreiben Sie die Verblindung.
Gutachter können die Qualität vollständig beurteilen. QUADAS-2-Domänen sind verantwortlich. Die Studie leistet einen bedeutenden Beitrag zu systematischen Überprüfungen und klinischen Leitlinien.
ERGEBNIS: Vertrauenswürdige Beweise, die die Pflege vorantreiben
THE REVELATION
Sie können die Qualität nicht beurteilen, wenn die Studie ihre Methoden nicht angibt. STARD stellt sicher, dass DTA-Studien vollständig genug sind, um von QUADAS-2 beurteilt zu werden. Eine unvollständige Berichterstattung ist nicht neutral – sie verbirgt Voreingenommenheit.
QUADAS-2: Die Qualitätscheckliste

Four Domains of Risk of Bias

1
Patient Selection

Wurde eine konsekutive oder eine Zufallsstichprobe aufgenommen? Wurde ein Case-Control-Design vermieden?

2
Index Test

Wurde der Test ohne Kenntnis des Referenzstandards interpretiert? Wurde der Schwellenwert vorab festgelegt?

3
Reference Standard

Kann der Referenzstandard den Zustand wahrscheinlich korrekt klassifizieren? Wurde es blind interpretiert?

4
Ablauf und Timing

Gab es einen angemessenen Abstand zwischen den Tests? Haben alle Patienten den gleichen Referenzstandard erhalten?

QUADAS-2 Decision Tree

Sollten Sie dieser Studie vertrauen?

DTA Study
Check All 4 Domains
All Low Risk
High QualityTrust results
Some Unclear
ModerateMit Vorsicht verwenden
Any High Risk
Low QualityDie Ergebnisse können verzerrt sein
Häufige Vorurteile in DTA-Studien
!

Verification Bias

Only positive tests get the reference standard → inflates sensitivity

!

Spectrum Bias

Studienpopulation weicht von der klinischen Realität ab → Ergebnisse lassen sich nicht verallgemeinern

!

Incorporation Bias

Index test is part of reference standard → artificially high accuracy

!

Review Bias

Index test interpreted knowing reference result → inflates both metrics

„Bevor Sie den Zahlen vertrauen,
ask: How were they gathered?
Eine voreingenommene Studie spricht mit Zuversicht –
but its confidence is a lie."
==================== MODUL 16: META-ANALYSE & SROC ====================
Eine Studie könnte täuschen.
Eine Studie mag schmeichelhaft sein.

Aber wenn man alle Beweise
the truth becomes harder to hide.

Was passiert, wenn verschiedene Studien unterschiedliche Schwellenwerte für denselben Test verwenden und Sie versuchen, diese zu bündeln?

REAL DATA

D-dimer testing for pulmonary embolism (PE) traditionally used a fixed cutoff of 500 µg/L. Die ADJUST-PE-Studie (Righini et al., JAMA 2014) zeigte, dass ein altersbereinigter Grenzwert (age × 10 µg/L für Patienten über 50) den Anteil älterer Patienten mit negativen D-Dimer-Ergebnissen von ~6% to ~30%erhöhte, wobei das 3-Monats-VTE-Risiko in der altersbereinigten negativen Gruppe nur 0,3 % betrug. Eine DTA-Metaanalyse von D-Dimer-Studien muss das bivariate Modell verwenden, da unterschiedliche Schwellenwerte einen Kompromiss zwischen Sensitivität und Spezifität erzeugen, der auf der SROC-Kurve sichtbar ist.

The D-dimer Threshold Dilemma: ADJUST-PE 2014
Ein älterer Patient (Alter 75) stellt sich mit möglicher LE in der Notaufnahme vor. D-Dimer beträgt 620 µg/L. Bei Verwendung des festen Cutoffs ist dies positiv. Bei Verwendung des altersbereinigten Grenzwerts (750 µg/L) ist dies negativ.
PATH A: Use Fixed Cutoff (500 µg/L)
Apply one threshold to all patients regardless of age
Ältere Patienten überschreiten fast immer 500 µg/L. Bei den über 80-Jährigen sinkt die Spezifität auf unter 10 %. Fast jeder ältere Patient erhält ein CT-Lungenangiogramm – mit Kontrastmittel, Bestrahlung und Zufallsbefunden.
OUTCOME: D-dimer becomes useless in the elderly
PATH B: Use Bivariate Model with Threshold Covariate
Wenden Sie den altersangepassten Grenzwert an; Modellschwellenwertvariation in der Metaanalyse
Die SROC-Kurve zeigt, dass sich altersbereinigte Schwellenwerte entlang der Kurve bewegen und dabei ein geringes Maß an Sensitivität gegen einen großen Gewinn an Spezifität eintauschen. 30 % mehr ältere Patienten vermeiden sicher eine CT-Bildgebung.
OUTCOME: Fewer unnecessary scans; no missed PEs
THE REVELATION
Schwellenwertschwankungen sind der Grund, warum die DTA-Metaanalyse das bivariate Modell benötigt. Verschiedene Studien verwenden unterschiedliche Grenzwerte, wodurch ein Kompromiss zwischen Sensitivität und Spezifität entsteht. Die SROC-Kurve ist die Karte dieses Kompromisses.
Why DTA Meta-Analysis Is Different
THE PROBLEM
Sensitivität und Spezifität sind correlated. When one goes up, the other tends to go down.

Sie können sie nicht wie Behandlungseffekte separat zusammenfassen. Du brauchst das bivariate model.
Die SROC-Kurve

Summary Receiver Operating Characteristic

Sensitivity
1 - Specificity (False Positive Rate)
Individual studies
Summary estimate
Lesen des SROC

Was sagt Ihnen die Kurve?

SROC Curve Position
Top-Left Corner
Excellent TestHigh sens + spec
Near Diagonal
Useless TestNo better than chance
Points Scattered
High HeterogeneityInvestigate sources
„Eine Studie könnte täuschen.
Viele Studien, zusammen gewogen,
Verfolge den Weg der Wahrheit –
die SROC-Kurve, die zeigt, was der Test wirklich leisten kann.“
Aber was wäre, wenn die Studien disagree?

One says sensitivity is 95%.
Another says 60%.

An welche Wahrheit glauben Sie?

Was passiert, wenn ein Test in der Allgemeinbevölkerung gut funktioniert, aber bei den Patienten, die ihn am meisten benötigen, fehlschlägt?

REAL DATA

HRP2-based malaria rapid diagnostic tests (RDTs) achieve sensitivity of approximately 95% in the general population in endemic areas. However, in pregnant women, sensitivity can drop to as low as 56-76% aufgrund der Plazenta-Sequestrierung von Parasiten – die Parasiten verstecken sich in der Plazenta, wodurch die Parasitämie im peripheren Blut niedrig bleibt und unter der RDT-Erkennungsschwelle liegt. Eine Cochrane-Überprüfung von Malaria-RDTs ergab eine erhebliche Heterogenität (I² oft über 80 %), die auf Bevölkerungsuntergruppen wie Schwangerschaft, Kinder unter 5 Jahren und HIV-Koinfektion zurückzuführen ist.

Die Malaria-RDT in der Schwangerschaft
Eine Metaanalyse bündelt 25 Malaria-RDT-Studien und berichtet über eine gepoolte Sensitivität von 93 %. Ein Kliniker in einer Geburtsklinik nutzt dies, um eine schwangere Frau mit einem negativen RDT zu beruhigen.
PATH A: Trust the Overall Pooled Estimate
Wenden Sie die 93 %-Sensitivität aus der Metaanalyse der Allgemeinbevölkerung an.
Bei schwangeren Frauen kann die tatsächliche Sensitivität nur 56–76 % betragen. Ein erheblicher Teil der infizierten Schwangeren wird fälschlicherweise beruhigt. Unbehandelte Malaria in der Schwangerschaft führt zu schwerer mütterlicher Anämie, niedrigem Geburtsgewicht und Totgeburten.
OUTCOME: Preventable maternal and neonatal deaths
PATH B: Investigate Heterogeneity by Subgroup
Untergruppen-Metaanalyse für schwangere Frauen durchführen; Erkunden Sie I² und Variationsquellen
Entdecken Sie, dass Schwangerschaft eine Hauptursache für Heterogenität ist. Empfehlen Sie die mikroskopische Bestätigung für alle schwangeren Frauen mit negativen RDTs in Endemiegebieten.
OUTCOME: Targeted protocols save mothers and babies
THE REVELATION
Heterogenität ist nicht nur statistisches Rauschen. Dies signalisiert häufig, dass der Test in verschiedenen Populationen unterschiedlich funktioniert. I² zu ignorieren und alles zusammenzufassen, kann für gefährdete Untergruppen tödlich sein.
Sources of Heterogeneity

Warum Studien nicht übereinstimmen

Gleicher Test, unterschiedliche Ergebnisse?
ThresholdDifferent cutoffs
PopulationSeverity, age
SettingPrimary vs specialist
QualityBias, blinding
Measuring Disagreement: I²
I² < 25%
Low
Studies agree
I² 25-75%
Moderate
Some variation
I² > 75%
High
Major disagreement
THE WARNING
When I² > 75%, the pooled estimate may be meaningless. Explain the disagreement before averaging.
„Wenn die Studien anderer Meinung sind,
den Dissens nicht zum Schweigen bringen.
Ask: Why do they see differently?
Die Meinungsverschiedenheit selbst lehrt.“
==================== MODUL 18: DAS TOOLKIT ====================
Ihr DTA-Toolkit
Die wesentlichen Maßnahmen und wann man sie verwendet

Wenn eine KI behauptet, besser zu diagnostizieren als Ärzte, sollten Sie dann der Gesamt-AUC vertrauen?

REAL DATA

Deep learning models for skin cancer detection have reported AUC values as high as 0.91-0.94 in development datasets. However, external validation revealed alarming disparities: Daneshjou et al. (2022, Nature Medicine) hat herausgefunden, dass kommerzielle KI-Dermatologie-Tools bei dunklerer Haut (Fitzpatrick-Typen V-VI) auf nahezu zufälligem Niveau funktionieren und die AUC genauso niedrig ist as 0.50-0.57 – im Wesentlichen zufällig. Trainingsdatensätze waren stark auf hellere Hauttöne ausgerichtet, was bedeutete, dass die 2x2-Tabelle nie für alle Bevölkerungsgruppen richtig ausgefüllt wurde.

Das KI-Dermatologie-Versprechen: 2020er Jahre
Ein Krankenhaus erwägt den Einsatz eines KI-Hautkrebs-Screening-Tools in einer Dermatologieklinik, die eine vielfältige städtische Bevölkerung versorgt. Der Hersteller gibt eine AUC von 0,94 an.
PATH A: Deploy Based on Overall AUC
Vertrauen Sie der Schlagzeile AUC von 0,94 und wenden Sie diese an alle Patienten an
Melanome auf dunklerer Haut werden häufiger übersehen. Der Gesamtwert der Sensitivität verbirgt eine gefährliche Lücke. Bei Patienten mit der höchsten Sterblichkeit aufgrund einer späten Diagnose versagt die KI am meisten.
OUTCOME: Health disparity amplified by technology
PATH B: Demand Fairness-Stratified Evaluation
Erfordern Sensitivität und Spezifität, aufgeschlüsselt nach Hautton (Fitzpatrick-Skala), Alter und Läsionsort
Entdecken Sie die Leistungslücke. Erfordern Sie eine Umschulung verschiedener Datensätze oder beschränken Sie die Verwendung auf validierte Populationen. Kombinieren Sie KI mit dermatologischer Aufsicht für unterrepräsentierte Gruppen.
OUTCOME: Equitable deployment; no one left behind
THE REVELATION
Eine einzige AUC-Zahl kann gefährliche Unterschiede verbergen. Neue KI-basierte Diagnosetools müssen mit der gleichen Strenge bewertet werden wie jeder Diagnosetest: stratifiziert nach Population, extern validiert und auf STARD- und QUADAS-2-Standards überprüft.
The Checklist

Was there a valid reference standard?

Gold standard applied to ALL patients?

Wurden Dolmetscher geblendet?

Test readers unaware of diagnosis?

War das Spektrum angemessen?

Ähnliche Patienten wie Ihre Population?

War das Schwellenwert vorab festgelegt?

Oder ausgewählt, um die Ergebnisse zu maximieren?

When Results Don't Match Suspicion

The Clinical Override Decision Tree

Test Negative, High Suspicion
What Is the LR-?
LR- < 0.1
Strong rule-outAccept negative
LR- 0.1-0.5
Repeat testOr different test
LR- > 0.5
Trust judgmentTest is weak
Sequential Testing Decision Tree

When One Test Isn't Enough

Initial Screening Test
Positive
Confirmatory TestHigh specificity
PositiveDiagnose
NegativeFalse alarm
Negative
Likely negativeIf high sens screen
"Armed with sensitivity, specificity, likelihood,
Mit dem SROC und dem Maß der Übereinstimmung bewaffnet,
können Sie die Lüge des Tests durchschauen –
und seine Wahrheit beurteilen sich selbst.“
==================== MODUL 19: BLUTTRANSFUSIONSFEHLER ====================
Haben Sie noch nichts von dem Patienten gehört?
Wer hat das erhalten? wrong blood,
nicht weil der Test falsch war,
but because no one performed it?
Der Test, der nicht gemacht wurde
HOSPITALS WORLDWIDE
ABO blood typing is nearly 100% accurate when performed.

Yet transfusion reactions still kill– nicht durch Testfehler, sondern durch human failure:

• Wrong blood drawn from wrong patient
• Etiketten im Labor ausgetauscht
• Bedside check skipped in emergency

In the UK, 1 in 13,000 transfusions geht an den falschen Patienten. Der Test hat funktioniert. Das System ist ausgefallen.
Bolton-Maggs PHB. Transfus Med. 2016;26:303-311
Test vs. System Decision Tree

Where Can Things Go Wrong?

Diagnostic Process
Error Source?
Test itself
Analytical ErrorSens/Spec issue
Better test needed
Pre-analytical
Wrong sampleID error
System fix needed
Post-analytical
Wrong actionReporting error
Process fix needed
"The perfect test means nothing
wenn das falsche Blut abgenommen wird,
es wird ein falsches Etikett angebracht,
die falsche Tasche ist aufgehängt.

DTA-Studien messen die Testgenauigkeit. Sie messen nicht die Systemgenauigkeit.

==================== MODUL 20: QUIZ & REFERENZEN ====================
References

Key Sources

  1. Carreyrou J. Bad Blood. Knopf, 2018. [Theranos]
  2. CDC. MMWR. 1987;36(49):833-840. [HIV blood supply]
  3. Herbst AL et al. N Engl J Med. 1971;284:878-881. [DES]
  4. Moyer VA. Ann Intern Med. 2012;157:120-134. [PSA]
  5. Pope JH et al. N Engl J Med. 2000;342:1163-1170. [Troponin]
  6. Steingart KR et al. Cochrane 2014;1:CD009593. [GeneXpert]
  7. Dinnes J et al. Cochrane 2022;7:CD013705. [COVID RAT]
  8. UK Panel. Lancet. 2012;380:1778-1786. [Mammography]
  9. Jack CR et al. Lancet Neurol. 2018;17:760-773. [Amyloid]
  10. WHO. Malaria RDT Performance. 2022.
  11. Reitsma JB et al. J Clin Epidemiol. 2005;58:982-990. [Bivariate]
  12. Whiting PF et al. Ann Intern Med. 2011;155:529-536. [QUADAS-2]
  13. Bolton-Maggs PHB. Transfus Med. 2016;26:303-311.
Ein Test ist zu 99 % empfindlich und zu 99 % spezifisch. Die Krankheitsprävalenz beträgt 1/1000. Ein Patient wird positiv getestet. Wie hoch ist die Wahrscheinlichkeit, dass sie an der Krankheit leiden?
99%
90%
About 9%
50%
What does "SnNout" mean?
A highly Sensitive test, when Negative, rules OUT disease
A highly Specific test, when Negative, rules OUT disease
Sensitivity should be used for screening
Specificity should be above 90%
Warum wurde die Blutversorgung trotz Tests mit HIV kontaminiert?
The tests had low specificity
Tests had a window period with zero sensitivity in early infection
Die Tests wurden nicht korrekt durchgeführt
Die Tests waren zu teuer
Welche QUADAS-2-Domäne beurteilt, ob der Test ohne Kenntnis der interpretiert wurde Diagnose?
Patient Selection
Index Test
Reference Standard
Ablauf und Timing
Course Complete
"Jetzt kennen Sie die vier Ergebnisse,
die beiden Vorzüge eines Tests,
der Trugschluss der Basis Rate,
die Kunst, Beweise zu bündeln,
und die Vorurteile, die die Wahrheit verbergen.

Wenn der nächste Test Sie belügt –
Sie werden es wissen."