who promised to 一滴の血で世界を変える,
who raised billions on a test that never worked?
No more needles. No more vials. No more waiting.
Investors believed. Walgreens believed. The Pentagon believed.
They gave her $9 billion.
テストは間違っていました。赤ちゃんは健康でした。
But how many women, receiving the same news, made different decisions?
そしてその嘘は確実性を帯びていた、
そして誰もその数字に疑問を持たなかった。」
これが、私たちが診断テストの精度を研究する理由です。
あるだけです four possible truths.
二つは祝福です。 2つは呪いです。
Every Test Result Has a Reality Behind It
Test: Positive
Test: Positive
Test: Negative
Test: Negative
True Positive (TP)
Sick person correctly identified.
テストは真実を告げた。
False Positive (FP)
Healthy person wrongly alarmed.
テストは嘘をつきました。
False Negative (FN)
Sick person wrongly reassured.
最も致命的な嘘。
True Negative (TN)
Healthy person correctly cleared.
テストは真実を告げた。
2x2 混同マトリックス
| Disease Present | Disease Absent | |
|---|---|---|
| Test Positive | TP True Positive |
FP False Positive |
| Test Negative | FN False Negative |
TN True Negative |
Know them by name.
TP、TN: テストは真実でした。
FP、FN: 検査は嘘でした。」
Sensitivity asks: Can it find the sick?
Specificity asks: Can it spare the healthy?
High sensitivity = few false negatives = few missed cases.
High specificity = few false positives = few false alarms.
Lower the threshold to catch more sick people? You'll alarm more healthy people.
Raise the threshold to spare healthy people? You'll miss more sick people.
This is the threshold effect―診断のシーソー。
SnNout: Sensitive tests rule OUT
A highly sensitive test, when negative, rules out disease. If it didn't find it, it's probably not there.
SpPin: Specific tests rule IN
特異性の高い検査で陽性となった場合、病気の可能性が決まります。持っていると言われれば、おそらく持っているでしょう。
SpPin: Specific Positive rules IN
特異性があれば問題はありません。
But no test masters both perfectly—
これが我々が負わなければならない重荷だ。」
世界はそれができるテストを必要としていた 感染者を早く見つける.
But what if the rapid test missed too many?
症状のある人の場合:
Sensitivity: 73% (missed 27% of cases)
In people WITHOUT symptoms:
Sensitivity: 55% (missed 45% of cases)
無症状の感染者の半数近くは無症状だと言われた。
Thanksgiving Dinners
Families tested negative in the morning, gathered indoors, unknowingly infected grandparents
Workplace Outbreaks
Workers tested negative, came to work, infected colleagues in the break room
Hospital Transmission
Patients tested negative, admitted to wards, infected vulnerable patients
そして家族が集まり、
そしておじいさんは孫たちを抱きしめました。
そして冬の終わりまでに、彼はいなくなってしまいました。」
しかし、患者は別の質問をします。
"I tested positive. What are my chances?"
あなたの患者は、希少疾患 (罹患率 1000 人に 1 人) の検査で陽性反応を示しました。
Question: 彼らが実際にその病気に罹患している確率はどれくらいでしょうか?
ほとんどの医師は95%と言っています。本当の答えは? About 2%.
Specificity tells how many well it will spare.
But only the likelihood ratio answers:
この結果はこの患者にとって何を意味するのでしょうか?"
that found too much?
When does finding disease become causing harm?
Mammography could detect tumors too small to feel.
女性たちはこう言われました。 "Annual mammograms save lives."
But what if some of those "cancers" would never have killed?
女性は診断を受け、手術、放射線療法、化学療法で治療を受ける。 彼女には決して害を及ぼすことのなかった病気のせいで。
Independent UK Panel on Breast Cancer Screening. Lancet. 2012;380:1778-1786
乳がんから
(treated unnecessarily)
(anxiety, biopsies)
これは良い取引でしょうか? 答えは数字だけではなく価値観によって決まります。
そしてそれを病気と呼びました、
そして女性は切られ、焼かれ、毒を盛られた――
彼女の日々を決して暗くすることのなかった影のために。」
これが過剰診断の問題です。
でも集まると すべての勉強,
それらの証拠を総合的に比較検討すると—
The truth becomes harder to hide.
More Precision
Combining studies gives narrower confidence intervals, reducing uncertainty
Detect Heterogeneity
Why do different studies give different answers? Setting? Population? Threshold?
Expose Publication Bias
否定的な研究は隠蔽されているのでしょうか?ファンネルプロットで非対称性が明らかになる
Explore Thresholds
Build SROC curves to understand the sensitivity-specificity trade-off
They are correlated: 一方が上昇すると、他方は低下する傾向があります (しきい値効果)。
The bivariate model はこの相関関係を考慮し、有効なプールされた推定値を提供します。
Reitsma JB et al. J Clin Epidemiol. 2005;58:982-990
ROC Space
曲線はトレードオフを示しています
Higher = better test
Diagonal line = useless test (random guessing)
The curve = すべての研究結果の概要
真実を明らかにし始める。
SROC 曲線は証拠の道です -
showing what the test can truly do."
ある研究によると、感度は95%です。
Another says 60%.
あなたはどの真実を信じますか?
High heterogeneity means 研究ではさまざまなことを測定しています— or the test performs differently in different settings.
Threshold Differences
「陽性」結果の異なるカットオフ (例: 糖尿病の異なる HbA1c 閾値)
Population Differences
Disease severity, age, comorbidities differ between studies
Setting Differences
Primary care vs. specialist clinic vs. emergency room
Quality Differences
Risk of bias, verification bias, spectrum bias
Studies agree
Some disagreement
Major disagreement
リンゴとオレンジを平均することはできません。絶対です explain why studies differ before pooling them.
反対意見を黙らせないでください。
Ask: Why do they see differently?
意見の相違自体が教えてくれます。」
Sensitivity & Specificity
How well the test performs on sick vs. healthy people
Likelihood Ratios (LR+, LR-)
How much a result changes the probability of disease
Diagnostic Odds Ratio (DOR)
Single measure of test discrimination (DOR = LR+ / LR-)
SROC 曲線下面積 (AUC)
Overall test performance across all thresholds (0.5 = useless, 1.0 = perfect)
bivariate meta-analysis
DTAレビュー用
オープンアクセスツール
Rutter & Gatsonis 2001 - HSROC model
Cochrane Handbook Ch. 10 - DTA methods
Was there a valid reference standard?
Gold standard test applied to all patients?
通訳者は盲目だったのでしょうか?
Test readers unaware of diagnosis, and vice versa?
スペクトルは適切でしたか?
Patients similar to your clinical population?
しきい値は事前に指定されていましたか?
それとも結果を最大化するために選択されたのでしょうか?
SROCと合意手段で武装し、
テストの嘘を見破ることができる――
そしてその真実を自分で判断してください。」
When a machine claims to see what no other machine can see,
そして誰も尋ねません: 「証拠を見せてください」?
FDA found:
• Results varied by 146% between runs on the same sample
• Edison machines failed 87% of proficiency tests
• Zero 査読済みの検証研究が出版されました
• 患者は、陰性だったサンプルに対して HIV 陽性の結果を受け取りました。
Sources: FDA Warning Letter 2016; Carreyrou J. Bad Blood. 2018; CMS Inspection Reports.
何を選択しますか?
Face lawsuits
Harm patients
患者を守る
Avoid Scandal
A $9 billion valuation became a criminal fraud conviction.
署名する前に検証データを要求したすべての病院
は嘘から守られました。
マーケティング
became complicit in harming patients.
証拠の欠如はマーケティングの問題ではありません。
It is a patient safety emergency.
代償を払うのは誰ですか?
The test result comes in 15 minutes.
しかし、その結果が生じたらどうなるでしょうか?は 15 minutes of false confidence?
Real-world performance (Cochrane 2022):
• Symptomatic individuals: 73% sensitivity (missed 27%)
• Asymptomatic individuals: 58% sensitivity (missed 42%)
• Early infection (days 0-3): ~50% sensitivity
無症状の感染者のほぼ半数は「無症状」と言われました。
Source: Dinnes J et al. Cochrane Database Syst Rev. 2022;7:CD013705
何を選択しますか?
School closure
Three hospitalizations
Teacher isolates
Outbreak prevented
It means: "not detected."
これら 2 つのフレーズの違い
is measured in lives.
is almost meaningless.
SnNout only works when sensitivity is HIGH.
Know your test's limits before trusting its verdict.
still cause harm?
がんが見つかったらどうなる
would never have hurt you?
Sensitivity: ~85% | Specificity: ~90%
毎年10年間にわたってスクリーニングを受けた1,000人の女性について:
• 1 death prevented 乳がんから
• 5 women overtreated 決して害を及ぼすことのなかった癌について
• 100-500 false alarms leading to biopsies, anxiety, repeat imaging
Overdiagnosis rate: 19-30% of screen-detected cancers
Source: Independent UK Panel on Breast Cancer Screening. Lancet. 2012;380:1778-1786
何を選択しますか?
腫瘍は緩徐進行性であった(DCIS)
Would never have harmed her
利点と害悪を理解しています
Autonomy preserved
A test can be accurate それでも害を引き起こす harm.
When overdiagnosis exceeds lives saved,
we must ask: Is finding always helping?
による利点は、 true positives.
Always weigh benefits against harms.
スクリーニングによって常に節約されるわけではありません。
is worse than missing it?
What if the treatment causes more suffering
than the disease ever would?
• 高悪性度がんの感度: 21%
• Detects many indolent cancers that would never harm
Lower cutoff to 2.5 ng/mL:
• Sensitivity rises to: 40%
• But overdiagnosis doubles
Treatment consequences:
• 20-30% of men experience incontinence after prostatectomy
• 30-70% experience erectile dysfunction
Source: US Preventive Services Task Force. JAMA. 2018;319(18):1901-1913
どのしきい値を選択しますか?
Thousands of unnecessary
生検と治療
But most missed are indolent
Fewer unnecessary treatments
Some preventable deaths
No overtreatment harm
Every threshold trades の感受性特異性,
過剰診断の検出.
この選択は医学的ではありません。それは ethical.
それは、あなたがどのような害を受け入れるかによって異なります。
It is a values problem.
Before choosing a cutoff, ask:
What is worse: missing disease or overtreating the healthy?
Different truths.
How can identical numbers
mean opposite things?
Sensitivity: ~80% | Specificity: ~95%
In high-prevalence setting (TB prevalence 10%):
• Positive Predictive Value: 85%
• A positive test usually means TB
In low-prevalence setting (TB prevalence 0.1%):
• Positive Predictive Value: 15%
• A positive test is usually a false positive
Source: Pai M et al. Lancet Infect Dis. 2014;14(8):765-773
結論は何ですか?
Patient infects family
診断は数か月遅れる
Chest X-ray, sputum
Treat early if confirmed
PPV およびNPV are properties of the population.
同じ結果は意味 different things
in different people.
A positive test in a high-risk patient means disease.
The same positive in a low-risk patient means probably nothing.
Context is everything.
Theranos: Demand Validation
No peer-reviewed data = no trust, regardless of marketing claims
COVID Rapid Tests: Know Sensitivity Limits
「検出されない」は「感染していない」と同じではありません
Mammography: Weigh Benefits vs. Harms
Finding is not always helping; overdiagnosis causes real harm
PSA: The Threshold is a Values Choice
すべてのカットオフは感度を特異性と引き換えにします。 「正しい」答えはありません
TB Test: Context Determines Meaning
The same result means different things in different populations
この文書で引用されている主な情報源コース
- Carreyrou J. Bad Blood: Secrets and Lies in a Silicon Valley Startup. Knopf, 2018.
- Dinnes J, et al. Rapid, point-of-care antigen tests for diagnosis of SARS-CoV-2 infection. Cochrane Database Syst Rev. 2022;7:CD013705.
- 乳がんスクリーニングに関する英国の独立委員会。乳がん検診の利点と害。 Lancet. 2012;380:1778-1786.
- Reitsma JB, et al.感度と特異度の二変量解析により、診断レビューで有益な概要測定が生成されます。 J Clin Epidemiol. 2005;58:982-990.
- Rutter CM, Gatsonis CA. A hierarchical regression approach to meta-analysis of diagnostic test accuracy evaluations. Stat Med. 2001;20:2865-2884.
- Deeks JJ, et al. The performance of tests of publication bias in systematic reviews of diagnostic test accuracy. J Clin Epidemiol. 2005;58:882-893.
- Macaskill P, et al. Cochrane Handbook for Systematic Reviews of Diagnostic Test Accuracy. Chapter 10. 2023.
- Higgins JPT, Thompson SG. Quantifying heterogeneity in a meta-analysis. Stat Med. 2002;21:1539-1558.
- US Food and Drug Administration. Warning Letter to Theranos Inc. 2016.
- US Preventive Services Task Force. Screening for Prostate Cancer. JAMA. 2018;319(18):1901-1913.
- Pai M, et al. Tuberculosis. Lancet Infect Dis. 2014;14(8):765-773.
テストの 2 つの美徳
閾値の残酷なトレードオフ、
そして証拠を集める技術。
次の試練があなたに課せられたとき—
you will know how to see through it."
テストに嘘があるとき — 今ならわかります。