can be reduced to a single number,
y en ese número, se borran vidas?
Pero ¿qué pacientes se beneficiaron? ¿Los jóvenes o los viejos? ¿Aquellos con enfermedad leve o grave? ¿Hombres o mujeres?
El conjunto no puede responder.
Porque dentro del promedio, algunos pacientes se salvaron y otros sufrieron daños.
● Responders ● Non-responders
But who ¿Son el 30%? Sin datos individuales, no podemos identificar a los que responden de los que no responden. No podemos practicar precision medicine.
No resúmenes. No son promedios. Each patient, each tumor, each outcome.
What he discovered changed breast cancer treatment forever.
"Tamoxifen works."
But the individual data revealed:
Giving tamoxifen to ER− patients was useless.
En el individuo, la verdad aparece.
Por eso buscamos al paciente oculto."
Este es un metaanálisis de datos de participantes individuales.
What is found when we look closer?
Aggregate Data (AD)
- Study-level summaries
- Tamaños de efecto de publicaciones
- Mean age, % male, etc.
- Rápido y accesible
- Cannot see within-study variation
Datos individuales del participante (IPD)
- Datos brutos a nivel de paciente
- Every participant's characteristics
- Actual ages, actual outcomes
- Time-intensive to obtain
- Can see who responds and who doesn't
Trial A: Mean age 55 years, Effect size 0.70 (benefit)
Trial B: Mean age 75 years, Effect size 0.90 (less benefit)
Tempting conclusion: "The drug works better in younger patients."
But this could be completely wrong.
Perhaps in Trial A, older patients within that trial responded better. Perhaps in Trial B, younger patients within that trial responded better.
No se puede saber sin individuos datos.
True Effect Modification
Test whether treatment effect varies by patient characteristics (age, biomarkers, disease severity)
Time-to-Event Analysis
Use actual survival curves, not just hazard ratios. Handle censoring properly.
Consistent Definitions
Standardize outcome definitions, exposure timing, covariate categories across studies
Subgroup Credibility
Pruebe las interacciones dentro de los estudios, evitando la falacia ecológica
Individual data shows each tree.
Si necesita saber qué árboles están enfermos—
you must walk among them."
gathered data on 170,000 patients
and answered questions no single trial could ask?
27 trials. 174,149 patients. Every baseline characteristic. Every cardiovascular event. Every death.
The published trials asked: "Do statins work?"
El CTT preguntó: "¿Para quién funcionan las estatinas?"
Pero las preguntas que puede responder son valen la inversión.
Benefit Proportional to LDL Reduction
Every 1 mmol/L LDL reduction = 22% lower CV events. True across all subgroups.
No Age Threshold
Benefit continues even in patients >75 years (contradicting earlier AD analyses)
Primary Prevention Works
Patients without prior CVD benefit proportionally to their baseline risk
No Cancer Signal
Las preocupaciones sobre las estatinas que causan cáncer fueron refutadas definitivamente con el seguimiento de IPD
Trial A: "High risk" = 10-year CVD risk >20%
Trial B: "High risk" = Prior MI
Trial C: "High risk" = Diabetes
You cannot compare or combine what is defined differently.
IPD allowed the CTT to redefine everyone consistently.
IPD proporciona la traducción.
What seemed contradictory becomes clear:
the same truth, measured differently."
Se necesitan datos agregados weeks.
¿Cuándo vale la pena la inversión?
¿Debería seguir IPD?
Time-to-Event Outcomes
Cuando las curvas de supervivencia son importantes, no solo los índices de riesgo finales. Cuando es necesario manejar la censura de manera adecuada.
Continuous Effect Modifiers
Testing whether treatment effect varies by age, BMI, biomarker level (not just "high" vs "low")
Outcome Definition Problems
Cuando los ensayos definen los resultados de manera diferente y es necesario estandarizarlos
Longer Follow-Up Available
Cuando los investigadores tienen datos de seguimiento no publicados, usted desea. incluya
Su pregunta clave es: "¿El beneficio varía según la gravedad de la enfermedad y el momento del tratamiento?"
Overall Treatment Effect
Cuando su única pregunta es "¿Funciona?" no "¿Para quién?"
Homogeneous Population
When trials enrolled similar patients and effect modification is unlikely
Binary Outcomes, Short Follow-up
Cuando la censura no es un problema y los resultados son simples sí/no
IPD Unobtainable
Cuando los investigadores no comparten, se pierden datos o los recursos no están disponibles
Pero cada pregunta sobre which individuals
exige su presencia en sus datos."
Ahora: ¿los analiza como one combined dataset
or trial by trial, then combine?
Two-Stage Approach
- Stage 1: Analyze each trial separately
- Etapa 2: Metaanalizar los resultados
- Preserves trial structure
- Familiar (like standard MA)
- Cannot handle sparse data well
One-Stage Approach
- Analizar todos los datos simultáneamente
- Mixed-effects regression model
- Efectos aleatorios para agrupación
- Mejor para datos escasos
- More flexible modeling
Each trial's estimate is transparent.
Parcelas forestales familiares y I2 statistics.
2. More powerful for detecting interactions
3. Can model complex covariate relationships
4. Exact likelihood (no normal approximations)
One-Stage or Two-Stage?
The one-stage hears all voices at once.
Cuando los datos son escasos y los eventos son raros—
el de una etapa capta lo que las dos etapas pierden."
que salvó la vida de los bebés—
but only if given at the right time?
But a puzzle remained: When should they be given?
24 hours before birth? 48 hours? A week?
Published trials couldn't answer—they didn't report timing consistently.
Maximum benefit: 24 hours to 7 days before birth
Reduced benefit: >7 days (lung maturity effect fades)
No benefit: <24 hours (not enough time to work)
After IPD: Guidelines now recommend repeat dosing si el parto no se produjo dentro de los 7 días posteriores al primero curso.
Esta precisión, imposible sin datos individuales, tiene saved thousands of premature babies.
Trial B reported: "Steroid given antenatally"
Trial C reported: "Steroid-to-delivery interval: median 3 days"
Different categories. Different definitions. Incompatible summaries.
Only by examining each baby's actual steroid-to-delivery time could the optimal window be identified.
But when para darlo era desconocido.
IPD convirtió 'en algún momento' en 'el momento adecuado'—
y en esa precisión, los niños vivieron."
En algún lugar, en archivos y bases de datos,
Se registra la historia de cada paciente..
La pregunta es: ¿lo compartirán?
This is expected. Plan for it.
Trialist Collaboration
Direct contact with trial investigators. Build relationships. Offer co-authorship.
Plataformas de intercambio de datos
YODA Project, ClinicalStudyDataRequest.com, Vivli, ICPSR
Regulatory Agencies
EMA Policy 0070, FDA (limited), Health Canada
Journal Requirements
Many journals now require data sharing; check supplementary materials
2. Offer co-authorship—make sharing worthwhile
3. Describir la seguridad de los datos—how you'll protect their patients
4. Proporcionar diccionarios de datos.—specify exactly what you need
5. Set clear timelines—respect their time
Industry trials: less likely to share
Negative trials: less likely to share
Older trials: data may be lost
Your IPD sample may be biased.
Will they share what they have guarded?
Construye el puente con cuidado.
porque en ese puente se cruza el futuro de los pacientes".
from twelve trials, five countries, three decades.
But Trial A calls it "cardiovascular death"
y el ensayo B lo llama "cardiac mortality".
¿Son iguales?
Trial from USA: Age in decimal years (e.g., 65.7)
Prueba del Reino Unido: franjas de edad ("65-74")
Diabetes: HbA1c ≥ 6.5% vs. fasting glucose ≥ 126 vs. "physician diagnosis"
Outcome: "Major adverse cardiac event" (one trial includes stroke, another doesn't)
Antes del análisis: armonizar todo.
Crear un diccionario de datos maestros
Define every variable you need: name, type, permitted values, derivation rules
Map Each Trial's Variables
Document how each trial's coding maps to your standardized definitions
Consulte con los probadores
Verifique sus interpretaciones. Ellos conocen sus datos mejor que tú.
Validate Transformations
Reproducir los resultados publicados del IPD. Si no coinciden, investiga.
Seis ensayos utilizaron una definición estándar (códigos ICD). Dos ensayos de la década de 1990 utilizaron "muerte cardíaca evaluada por un investigador" sin criterios estandarizados. Estos dos ensayos muestran efectos de tratamiento mayores.
Reproduzca los resultados publicados de cada ensayo del IPD.
Si su análisis arroja RR = 0,78 pero la publicación dice RR = 0,85,
something is wrong.
Find the discrepancy. Fix it. Then proceed.
different ways to name the same disease.
Antes de usted puedes combinar, debes traducir.
Antes de traducir, debes entender."
¿Pero funciona igual para los jóvenes y los mayores?
¿Para los leves y los graves?
¿Para el que tiene el biomarcador y el que no?
They asked: "Does the effect differ by estrogen receptor status?"
La interacción fue masiva:
ER-positive: 47% reduction in recurrence
ER-negative: No benefit at all
El efecto del tratamiento differs between subgroups defined by the covariate.
Si no: el efecto del tratamiento es similar across subgroups (or you lack power to detect a difference).
Between-Study Interaction
- Compares trial-level averages
- Ecological fallacy risk
- Confounded by trial design
- Low statistical power
- Se puede hacer con datos agregados
Within-Study Interaction
- Compares patients within each trial
- No ecological fallacy
- Randomization preserved
- Much higher power
- Requires IPD
Este es el estándar de oro para la modificación del efecto.
Probó 8 posibles modificadores del efecto en su análisis.
The interaction reveals who benefits.
Pruébelo dentro de los estudios, no entre—
porque ahí es donde se encuentra la verdad."
Cuando buscas predict who will die,
who will recover, who will relapse—
el individuo lo es todo.
"Will they ever wake up?"
Individual trials were too small to develop accurate prediction models.
IMPACT recopiló IPD de 11 estudios, 9205 pacientes, y construyó un modelo que predice los resultados a 6 meses a partir de las características clínicas iniciales.
External Validation Across Populations
Develop in some studies, validate in others. True test of generalizability.
Non-linear Relationships
Explore how predictors relate to outcome: linear? threshold? U-shaped?
Multiple Predictor Interactions
Age + GCS + pupil reactivity may interact in ways aggregate data cannot reveal
Proper Handling of Missing Predictors
Múltiples imputaciones a nivel del paciente, no a nivel de estudio
TRIPOD
- Prediction model reporting
- Desarrollo y validación
- Calibración y discriminación
- 22 item checklist
PRISMA-IPD
- IPD meta-analysis reporting
- Detalles de adquisición de datos
- Harmonization process
- Integrity checking
Cuando un paciente llega con una lesión cerebral traumática, el modelo proporciona una probability of survival and probability of favorable outcome.
Esto guía las conversaciones con las familias. Esto informa la intensidad del tratamiento. Esto ayuda a asignar recursos de la UCI.
Construido a partir de datos individuales. Atendiendo a pacientes individuales.
debes aprender de miles de pasados.
IPD guarda esas historias—
each one a teacher, if you will listen."
que se le ha dado a millions por sus corazones?
Les dijeron: "Toma esto y estarás protegido".
But was every heart equally in need of protection?
Researchers quickly re-identified users by matching ratings with public IMDb reviews.
One lawsuit alleged a closeted lesbian was outed through her viewing patterns.
The lesson: removing names isn't anonymization.
IPD contiene suficientes combinaciones de edad, diagnóstico, respuesta al tratamiento y fechas para identificar de forma única a los individuos. La privacidad requiere más que eliminar la columna de nombre: requiere comprender cómo las combinaciones de datos se convierten en huellas digitales.
The published trials said: "Aspirin prevents heart attacks."
Pero el TCA formuló la pregunta prohibida:
"¿A qué precio? ¿Y para quién?"
2-3 heart attacks prevented
2-3 major bleeds caused
El beneficio y el daño se anulan.
¿Este paciente debería tomar aspirina como prevención primaria?
(benefit > harm)
(benefit ≈ harm)
(harm > benefit)
No pudieron demostrar que los pacientes de alto riesgo ganaran
while low-risk patients lost.
Only by examining each patient's baseline risk,
each patient's outcomes,
could the interaction be revealed.
Leyó en línea que "la aspirina previene los ataques cardíacos" y quiere su consejo.
puede dañar la seguridad.
Conozca el riesgo de su paciente antes de recetar.
Esto es lo que nos enseñaron los datos individuales".
95,000 patients. One truth: risk determines benefit.
"¿Se debe tratar a los viejos igual que a los jóvenes?"
Some said: "Lower is always better."
Otros decían: "Los viejos son frágiles. Tengan cuidado".
¿Quién tenía razón?
El campo agresivo: "Every mmHg of BP reduction saves lives.
Treat everyone to target 120/80."
El campo conservador: "In the elderly, low BP causes falls, strokes, death.
There's a J-curve—too low is dangerous."
Individual trials were too small to settle it. Hasta que el BPLTTC recopiló los datos individuales.
Is there a J-curve at very low pressures?
Do the very old (>80 years) still benefit?
Age 55-64: 10% lower major CV events
Age 65-74: 10% lower major CV events
Age 75-84: 10% lower major CV events
Age ≥85: Still 10% lower
pinteraction = 0,85. No hay evidencia de modificación de edad.
who achieved very low blood pressures.
Result: No J-curve in randomized comparisons.
La curva J aparente en los datos observacionales fue reverse causation— sick patients have low BP because they're sick, not sick because their BP is low.
Sólo los DPI de los ECA podrían desenmarañar esto.
Should This Elderly Patient Get BP Treatment?
Proportional benefit maintained across all ages
Consider frailty, life expectancy, patient preference—but not age.
¿Recuerda el metanálisis IPD de BPLTTC?
Pero los datos individuales mostraron lo contrario:
At every age, the benefit endures.
Do not let age alone deny protection."
when a clot blocks the brain?
Every minute, two million neurons die.
But when does the window close?
When is it too late to intervene?
But given too late, it causes bleeding into dying brain tissue.
What is the time window? 3 hours? 4.5 hours? 6 hours?
Individual trials disagreed. Guidelines were uncertain.
They knew exactly when each patient's stroke began. They knew exactly when thrombolysis was given. They knew exactly who lived, who died, who recovered.
They could map benefit against time, minute by minute.
Treated at 90 min: 1 in 4 achieve excellent outcome
Treated at 180 min: 1 in 7 achieve excellent outcome
Treated at 270 min: 1 in 14 achieve excellent outcome
Acute Ischemic Stroke: Give Thrombolysis?
URGENTLY
if eligible
imaging
avoid
Trial B: "Patients treated within 6 hours" (average: 4.2 hours)
These overlapping, inconsistent windows couldn't be compared.
Only by knowing each patient's exact time
could the continuous decay of benefit be mapped.
Door-to-needle time will add 30 minutes, making total time ~4.5 hours.
two million neurons perish.
El IPD nos mostró la ventana que se desvanecía.
Act quickly, or the window closes forever."
Abres los archivos con esperanza.
Y luego lo ves: empty cells.
Age: 67. Sex: Male. Smoking status: missing.
Outcome at 1 year: missing.
What now?
Missing Completely at Random (MCAR)
Lab machine broke randomly. No relation to patient characteristics. Safe to ignore (but wasteful).
Missing at Random (MAR)
Older patients more likely to miss follow-up. Missingness related to observed variables. Imputation can help.
Desaparecido no al azar (MNAR)
Los pacientes con malos resultados abandonan. Falta relacionada con el missing value itself. Peligroso. Requiere análisis de sensibilidad.
¿Qué hacer con los valores faltantes?
may suffice
imputation
sensitivity
Multiple imputation (M=20-50 datasets) reflects uncertainty sobre cuál podría haber sido el valor faltante.
Esto preserva los errores estándar y los valores p válidos.
Systematically Missing Variables
Trial A measured biomarker X. Trial B didn't. Can't impute what was never collected.
Multilevel Structure
Patients nested within trials. Imputation model must account for clustering.
Different Follow-up Durations
El ensayo A siguió durante 2 años. Ensayo B durante 5 años. El análisis de supervivencia necesita atención.
Trial Didn't Collect Your Key Covariate
analysis to trials
con la variable
varying assumptions
about unmeasured
Estos tres ensayos tienden a ser más antiguos y más pequeños.
It is a question: ¿Por qué se desconoce esto?
Responda esa pregunta antes de llenar el vacío.
porque el motivo de la ausencia da forma a la solución."
quien recopiló datos de willing trialists
y declaró la victoria?
But the unwilling held secrets.
Y esos secretos cambiaron todo.
Cochrane reviewers requested trial data to verify efficacy. Roche refused, citing confidentiality.
Durante cinco años, el BMJ hizo campaña por la transparencia. Cuando finalmente se publicaron los informes completos de los estudios clínicos en 2014, el panorama cambió: Tamiflu redujo la duración de los síntomas en menos de un día y no previno las complicaciones.
Se gastaron miles de millones en un medicamento cuya evidencia completa estaba bajo llave.
La saga del Tamiflu transformó las expectativas: hoy en día, la transparencia de los ensayos clínicos se está convirtiendo en la norma, no en la excepción.
Industry-sponsored trials: Less likely to share
Ensayos con resultados negativos: Less likely to share
Older trials: Los datos se pierden con frecuencia
If these trials systematically differ in effect size,
su IPD-MA está sesgado.
Assessing Availability Bias
for bias
Se necesita análisis de sensibilidad
Report IPD retrieval rate
"Obtuvimos IPD de 12/15 ensayos (80%)"
Compare IPD vs. non-IPD trial characteristics
Tamaño de la muestra, financiación, fecha de publicación, tamaño del efecto a partir de datos agregados
Sensitivity analysis including non-IPD trials
Análisis de dos etapas que combina IPD + AD de ensayos que no se comparten
Discute las razones para no compartir
Data lost? Refused? Never requested? Each has different implications.
Su análisis de IPD muestra OR 0,70.
Utilice IPD donde lo tenga (para pruebas de interacción).
Complemente con AD para la estimación del efecto general.
Transparencia sobre de dónde vino. donde.
Las puertas abiertas pueden ocultar la verdad detrás de las cerradas.
Always ask: Who refused to share?
And what might they be hiding?"
Fuentes clave citadas en este Curso
- Riley RD, et al. Metanálisis de datos de participantes individuales: un manual para la investigación de atención médica. Wiley, 2021.
- Stewart LA, et al. PRISMA-IPD: Elementos de informes preferidos para revisiones sistemáticas y metanálisis de datos de participantes individuales. JAMA 2015;313:1657-65.
- Early Breast Cancer Trialists' Collaborative Group. Tamoxifen for early breast cancer. Cochrane Database Syst Rev 2001.
- Cholesterol Treatment Trialists' Collaboration. Efficacy and safety of LDL-lowering therapy. Lancet 2010;376:1670-81.
- Roberts D, et al. Antenatal corticosteroids for accelerating fetal lung maturation. Cochrane Database Syst Rev 2017.
- IMPACT Study Group. Predicting outcome after traumatic brain injury. PLoS Med 2008;5:e165.
- Debray TPA, et al. Get real in individual participant data meta-analysis. Int J Epidemiol 2015;44:1287-97.
- Burke DL, et al. Meta-analysis using individual participant data. Stat Med 2017;36:320-38.
But you have learned to find them.
You have learned to ask: Who benefits? Who is harmed?
Ahora adelante, y no dejes que ningún paciente desaparezca en el promedio."
El paciente oculto: ahora lo ve.