who promised to mude o mundo com uma gota de sangue,
who raised billions on a test that never worked?
No more needles. No more vials. No more waiting.
Investors believed. Walgreens believed. The Pentagon believed.
They gave her $9 billion.
O teste estava errado. O bebê estava saudável.
But how many women, receiving the same news, made different decisions?
e a mentira estava vestida de certeza,
e ninguém questionou os números."
É por isso que estudamos a precisão dos testes de diagnóstico.
existem apenas four possible truths.
Dois são bênçãos. Dois são maldições.
Every Test Result Has a Reality Behind It
Test: Positive
Test: Positive
Test: Negative
Test: Negative
True Positive (TP)
Sick person correctly identified.
O teste disse a verdade.
False Positive (FP)
Healthy person wrongly alarmed.
O teste mentiu.
False Negative (FN)
Sick person wrongly reassured.
A mentira mais mortal.
True Negative (TN)
Healthy person correctly cleared.
O teste disse a verdade.
A Matriz de Confusão 2x2
| Disease Present | Disease Absent | |
|---|---|---|
| Test Positive | TP True Positive |
FP False Positive |
| Test Negative | FN False Negative |
TN True Negative |
Know them by name.
TP, TN: o teste falou verdade.
FP, FN: o teste mentiu."
Sensitivity asks: Can it find the sick?
Specificity asks: Can it spare the healthy?
High sensitivity = few false negatives = few missed cases.
High specificity = few false positives = few false alarms.
Lower the threshold to catch more sick people? You'll alarm more healthy people.
Raise the threshold to spare healthy people? You'll miss more sick people.
This is the threshold effect—a gangorra do diagnóstico.
SnNout: Sensitive tests rule OUT
A highly sensitive test, when negative, rules out disease. If it didn't find it, it's probably not there.
SpPin: Specific tests rule IN
Um teste altamente específico, quando positivo, governa a doença. Se diz que você tem, provavelmente você tem.
SpPin: Specific Positive rules IN
A especificidade poupa o bem.
But no test masters both perfectly—
Este é o fardo que devemos ter urso."
o mundo precisava de um teste que pudesse encontrar os infectados rapidamente.
But what if the rapid test missed too many?
Em pessoas COM sintomas:
Sensitivity: 73% (missed 27% of cases)
In people WITHOUT symptoms:
Sensitivity: 55% (missed 45% of cases)
Quase metade dos infectados pessoas assintomáticas foram informadas de que estavam curadas.
Thanksgiving Dinners
Families tested negative in the morning, gathered indoors, unknowingly infected grandparents
Workplace Outbreaks
Workers tested negative, came to work, infected colleagues in the break room
Hospital Transmission
Patients tested negative, admitted to wards, infected vulnerable patients
e a família reuniram-se,
e o avô abraçou seus netos,
e no final do inverno, ele se foi."
Mas o paciente faz uma pergunta diferente:
"I tested positive. What are my chances?"
Seu paciente testa positivo para uma doença rara (prevalência 1 em 1000).
Question: Qual é a probabilidade de ele realmente ter a doença?
A maioria dos médicos diz 95%. A verdadeira resposta? About 2%.
Specificity tells how many well it will spare.
But only the likelihood ratio answers:
O que esse resultado significa para ESTE paciente?"
that found too much?
When does finding disease become causing harm?
Mammography could detect tumors too small to feel.
Foi dito às mulheres: "Annual mammograms save lives."
But what if some of those "cancers" would never have killed?
A mulher é diagnosticada, tratada com cirurgia, radioterapia, quimioterapia... por uma doença que nunca a teria prejudicado.
Independent UK Panel on Breast Cancer Screening. Lancet. 2012;380:1778-1786
do câncer de mama
(treated unnecessarily)
(anxiety, biopsies)
Este é um bom comércio? A resposta depende de valores, não apenas de números.
e chamou isso de doença,
e a mulher foi cortada, queimada e envenenada -
por uma sombra que nunca teria obscurecido seus dias."
Este é o problema do sobrediagnóstico.
Mas quando você se reúne todos os estudos,
quando você pesa suas evidências juntas -
The truth becomes harder to hide.
More Precision
Combining studies gives narrower confidence intervals, reducing uncertainty
Detect Heterogeneity
Why do different studies give different answers? Setting? Population? Threshold?
Expose Publication Bias
Os estudos negativos estão sendo ocultados? Gráficos de funil revelam assimetria
Explore Thresholds
Build SROC curves to understand the sensitivity-specificity trade-off
They are correlated: quando um sobe, o outro tende a descer (efeito limiar).
The bivariate model explica esta correlação, fornecendo estimativas agrupadas válidas.
Reitsma JB et al. J Clin Epidemiol. 2005;58:982-990
ROC Space
A curva mostra o trade-off
Higher = better test
Diagonal line = useless test (random guessing)
The curve = resumo do desempenho de todos os estudos
começar a revelar a verdade.
A curva SROC é o caminho da evidência –
showing what the test can truly do."
Um estudo diz que a sensibilidade é de 95%.
Another says 60%.
Em qual verdade você acredita?
High heterogeneity means os estudos estão medindo coisas diferentes— or the test performs differently in different settings.
Threshold Differences
Diferentes pontos de corte para resultados “positivos” (por exemplo, diferentes limiares de HbA1c para diabetes)
Population Differences
Disease severity, age, comorbidities differ between studies
Setting Differences
Primary care vs. specialist clinic vs. emergency room
Quality Differences
Risk of bias, verification bias, spectrum bias
Studies agree
Some disagreement
Major disagreement
Você não pode calcular a média de maçãs e laranjas. Você deve explain why studies differ before pooling them.
não silencie a dissidência.
Ask: Why do they see differently?
A própria discordância ensina."
Sensitivity & Specificity
How well the test performs on sick vs. healthy people
Likelihood Ratios (LR+, LR-)
How much a result changes the probability of disease
Diagnostic Odds Ratio (DOR)
Single measure of test discrimination (DOR = LR+ / LR-)
Área sob a curva SROC (AUC)
Overall test performance across all thresholds (0.5 = useless, 1.0 = perfect)
bivariate meta-analysis
para análises do DTA
ferramenta de acesso aberto
Rutter & Gatsonis 2001 - HSROC model
Cochrane Handbook Ch. 10 - DTA methods
Was there a valid reference standard?
Gold standard test applied to all patients?
Os intérpretes ficaram cegos?
Test readers unaware of diagnosis, and vice versa?
O espectro era apropriado?
Patients similar to your clinical population?
O limite foi pré-especificado?
Ou foi escolhido para maximizar resultados?
armado com o SROC e a medida de acordo,
você pode ver através da mentira do teste -
e julgue a sua verdade por si mesmo."
When a machine claims to see what no other machine can see,
e ninguém pergunta: "Mostre-me a prova"?
FDA found:
• Results varied by 146% between runs on the same sample
• Edison machines failed 87% of proficiency tests
• Zero estudos de validação revisados por pares publicados
• Os pacientes receberam resultados HIV positivos para amostras negativas
Sources: FDA Warning Letter 2016; Carreyrou J. Bad Blood. 2018; CMS Inspection Reports.
O que você escolhe?
Face lawsuits
Harm patients
Proteja seus pacientes
Avoid Scandal
A $9 billion valuation became a criminal fraud conviction.
Todo hospital que exigiu dados de validação antes de assinar
foi protegido da mentira.
Todo hospital que confiou no marketing
became complicit in harming patients.
A ausência de evidências não é um problema de marketing.
It is a patient safety emergency.
quem paga o preço?
The test result comes in 15 minutes.
Mas o que se o resultado para 15 minutes of false confidence?
Real-world performance (Cochrane 2022):
• Symptomatic individuals: 73% sensitivity (missed 27%)
• Asymptomatic individuals: 58% sensitivity (missed 42%)
• Early infection (days 0-3): ~50% sensitivity
Quase metade das pessoas assintomáticas infectadas foram informadas de que estavam "limpas".
Source: Dinnes J et al. Cochrane Database Syst Rev. 2022;7:CD013705
O que você escolhe?
School closure
Three hospitalizations
Teacher isolates
Outbreak prevented
It means: "not detected."
A diferença entre essas duas frases
is measured in lives.
is almost meaningless.
SnNout only works when sensitivity is HIGH.
Know your test's limits before trusting its verdict.
still cause harm?
E se o câncer for encontrado
would never have hurt you?
Sensitivity: ~85% | Specificity: ~90%
Para 1.000 mulheres examinadas anualmente durante 10 anos:
• 1 death prevented do câncer de mama
• 5 women overtreated para cânceres que nunca as teriam prejudicado
• 100-500 false alarms leading to biopsies, anxiety, repeat imaging
Overdiagnosis rate: 19-30% of screen-detected cancers
Source: Independent UK Panel on Breast Cancer Screening. Lancet. 2012;380:1778-1786
O que você escolhe?
O tumor era indolente (DCIS)
Would never have harmed her
Compreende os benefícios E os malefícios
Autonomy preserved
A test can be accurate e ainda causa harm.
When overdiagnosis exceeds lives saved,
we must ask: Is finding always helping?
pode exceder o benefício de true positives.
Always weigh benefits against harms.
A triagem nem sempre salva.
is worse than missing it?
What if the treatment causes more suffering
than the disease ever would?
• Sensibilidade para câncer de alto grau: 21%
• Detects many indolent cancers that would never harm
Lower cutoff to 2.5 ng/mL:
• Sensitivity rises to: 40%
• But overdiagnosis doubles
Treatment consequences:
• 20-30% of men experience incontinence after prostatectomy
• 30-70% experience erectile dysfunction
Source: US Preventive Services Task Force. JAMA. 2018;319(18):1901-1913
Qual limite você escolhe?
Thousands of unnecessary
biópsias e tratamentos
But most missed are indolent
Fewer unnecessary treatments
Some preventable deaths
No overtreatment harm
Every threshold trades sensibilidade para especificidade,
detecção de sobrediagnóstico.
A escolha não é médica. É ethical.
Depende de quais danos você está disposto a aceitar.
It is a values problem.
Before choosing a cutoff, ask:
What is worse: missing disease or overtreating the healthy?
Different truths.
How can identical numbers
mean opposite things?
Sensitivity: ~80% | Specificity: ~95%
In high-prevalence setting (TB prevalence 10%):
• Positive Predictive Value: 85%
• A positive test usually means TB
In low-prevalence setting (TB prevalence 0.1%):
• Positive Predictive Value: 15%
• A positive test is usually a false positive
Source: Pai M et al. Lancet Infect Dis. 2014;14(8):765-773
O que você conclui?
Patient infects family
Atrasa o diagnóstico por meses
Chest X-ray, sputum
Treat early if confirmed
PPV e NPV are properties of the population.
O mesmo resultado significa different things
in different people.
A positive test in a high-risk patient means disease.
The same positive in a low-risk patient means probably nothing.
Context is everything.
Theranos: Demand Validation
No peer-reviewed data = no trust, regardless of marketing claims
COVID Rapid Tests: Know Sensitivity Limits
"Não detectado" não é o mesmo que "não infectado"
Mammography: Weigh Benefits vs. Harms
Finding is not always helping; overdiagnosis causes real harm
PSA: The Threshold is a Values Choice
Todos o ponto de corte troca sensibilidade por especificidade; não há resposta "certa"
TB Test: Context Determines Meaning
The same result means different things in different populations
Principais fontes citadas neste Curso
- Carreyrou J. Bad Blood: Secrets and Lies in a Silicon Valley Startup. Knopf, 2018.
- Dinnes J, et al. Rapid, point-of-care antigen tests for diagnosis of SARS-CoV-2 infection. Cochrane Database Syst Rev. 2022;7:CD013705.
- Painel Independente do Reino Unido sobre Rastreio do Cancro da Mama. Os benefícios e malefícios do rastreamento do câncer de mama. Lancet. 2012;380:1778-1786.
- Reitsma JB, et al. A análise bivariada de sensibilidade e especificidade produz medidas resumidas informativas em revisões diagnósticas. J Clin Epidemiol. 2005;58:982-990.
- Rutter CM, Gatsonis CA. A hierarchical regression approach to meta-analysis of diagnostic test accuracy evaluations. Stat Med. 2001;20:2865-2884.
- Deeks JJ, et al. The performance of tests of publication bias in systematic reviews of diagnostic test accuracy. J Clin Epidemiol. 2005;58:882-893.
- Macaskill P, et al. Cochrane Handbook for Systematic Reviews of Diagnostic Test Accuracy. Chapter 10. 2023.
- Higgins JPT, Thompson SG. Quantifying heterogeneity in a meta-analysis. Stat Med. 2002;21:1539-1558.
- US Food and Drug Administration. Warning Letter to Theranos Inc. 2016.
- US Preventive Services Task Force. Screening for Prostate Cancer. JAMA. 2018;319(18):1901-1913.
- Pai M, et al. Tuberculosis. Lancet Infect Dis. 2014;14(8):765-773.
as duas virtudes de um teste,
a troca cruel do limite,
e a arte de agrupar evidência.
Quando o próximo teste estiver para você—
you will know how to see through it."
Quando o teste estiver — Agora você sabe.