Dr. Luis A. Pérez de Llano, Hospital Xeral-Calde, Lugo

A Clinical Model To Estimate the Pretest Probability of Lung Cancer in Patients With Solitary Pulmonary Nodules*

Michael K. Gould, MD, MS, FCCP; Lakshmi Ananth, MS; Paul G. Barnett, PhD; for the Veterans Affairs SNAP Cooperative Study Group.

* From the Veterans Affairs Palo Alto Health Care System (Dr. Gould), Palo Alto, CA; and the Veterans Affairs Health Economics Resource Center (Ms. Ananth and Dr. Barnett), Menlo Park, CA.

Correspondence to: Michael K. Gould, MD, MS, FCCP, Veterans Affairs Palo Alto Health Care System, 3801 Miranda Ave (111P), Palo Alto, CA 94304; e-mail: gould@stanford.edu

Chest. 2007; 131:383-388.


Background: Estimating the clinical probability of malignancy in patients with a solitary pulmonary nodule (SPN) can facilitate the selection and interpretation of subsequent diagnostic tests.

Methods: We used multiple logistic regression analysis to identify independent clinical predictors of malignancy and to develop a parsimonious clinical prediction model to estimate the pretest probability of malignancy in a geographically diverse sample of 375 veterans with SPNs. We used data from Department of Veterans Affairs (VA) administrative databases and a recently completed VA Cooperative Study that evaluated the accuracy of positron emission tomography (PET) scans for the diagnosis of SPNs.

Results: The mean (± SD) age of subjects in the sample was 65.9 ± 10.7 years. The prevalence of malignant SPNs was 54%. Most participants were either current smokers (n = 177) or former smokers (n = 177). Independent predictors of malignant SPNs included a positive smoking history (odds ratio [OR], 7.9; 95% confidence interval [CI], 2.6 to 23.6), older age (OR, 2.2 per 10-year increment; 95% CI, 1.7 to 2.8), larger nodule diameter (OR, 1.1 per 1-mm increment; 95% CI, 1.1 to 1.2), and time since quitting smoking (OR, 0.6 per 10-year increment; 95% CI, 0.5 to 0.7). Model accuracy was very good (area under the curve of the receiver operating characteristic, 0.79; 95% CI, 0.74 to 0.84), and there was excellent agreement between the predicted probability and the observed frequency of malignant SPNs.

Conclusions: Our prediction rule can be used to estimate the pretest probability of malignancy in patients with SPNs, and thereby facilitate clinical decision making when selecting and interpreting the results of diagnostic tests such as PET imaging.

Key Words: coin lesion • diagnosis • lung neoplasms • pulmonary • receiver operating characteristic curve • statistical models • veterans.


COMENTARIO:

El diagnóstico del nódulo pulmonar solitario (NPS) continúa siendo un desafío clínico a pesar de las nuevas y valiosas técnicas introducidas en los últimos años. Este problema se ha hecho, si cabe, más relevante como consecuencia de la puesta en marcha, en diferentes países, de estudios destinados a conocer si el screening de cáncer de pulmón es una prueba que pueda disminuir la mortalidad por esta patología. La cirugía sigue siendo el gold standard diagnóstico, pero debe ser evitada en pacientes con nódulos benignos. La punción aspirativa con aguja fina (PAAF) suele establecer un diagnóstico específico de malignidad o benignidad, pero es un procedimiento invasivo, con riesgo potencial y no es sensible al 100%. La observación radiológica periódica evita cirugía innecesaria, pero también pospone el tratamiento en pacientes con patología maligna y puede favorecer el desarrollo de ansiedad en personas que, al fin y al cabo, no saben durante meses si tienen un cáncer o no. La tomografía axial computerizada (PET) es sensible para identificar nódulos malignos, pero su eficacia es inaceptable para lesiones < 1 cm y se han publicado diferentes porcentajes de falsos negativos. Por lo tanto, es motivo de controversia qué estrategia es la mejor para diagnosticar el NPS con la mayor economía de medios.

El autor del presente artículo, Michael Gould, ya publicó en el año 2003 (Ann Intern Med 2003; 138: 724) un análisis del coste-eficacia de las diferentes estrategias diagnósticas del NPS, concluyendo que la PET debería ser usada selectivamente en aquellos pacientes en los que la probabilidad pretest y los hallazgos de la TAC fuesen discordantes o en los que, teniendo una probabilidad pretest intermedia, presentasen potenciales riesgos quirúrgicos. Tradicionalmente, se ha usado un estudio de la Clínica Mayo (Swensen et al; Arch Intern Med 1997) para identificar qué factores aumentan el riesgo de que un NPS sea realmente maligno. Este trabajo identificó 6 predictores independientes de malignidad: vejez, historia de tabaquismo, historia de existencia de un cáncer extratorácico en los 5 años previos, mayor diámetro de la lesión radiológica, presencia de especulación de ésta, localización en lóbulos superiores. Este modelo tenía un valor del área bajo la curva ROC de 0.83. Sin embargo, el modelo tenía el problema de que infraestimaba el riesgo de malignidad en el rango más bajo de predicción de probabilidad y, además, se había desarrollado a partir de una cohorte de pacientes originalmente evaluados más de 20 años atrás en una población con prevalencia (23%) muy baja de la enfermedad. El grupo de Gould, localizado en Stanford, utiliza los datos de un trabajo preliminar (enfocado a conocer la utilidad de la PET en el manejo de pacientes con NPS) con la intención de desarrollar un modelo nuevo de estimación de la probabilidad pretest de malignidad en esta situación clínica.

Encontraron predictores independientes de malignidad del NPS: historia de tabaquismo, edad avanzada, mayor diámetro del nódulo, y tiempo transcurrido desde el abandono del tabaco. Con ello elaboraron una fórmula matemática que mostró un buen comportamiento predictivo (valor del área bajo la curva ROC: 0.8). Sin embargo, como ellos mismo reconocen, su estudio tiene importantes limitaciones. Una de ellas es que no recogen información acerca de la morfología de las lesiones en la TAC y, en consecuencia, el modelo sólo explica un 30% de la varianza en la etiología, lo que induce a pensar que restan predictores de malignidad por identificar. Además, el modelo no se puede aplicar para poblaciones diferentes a aquélla en la que se ha validado (predominancia de varones, edad media de 65 años, tamaño >7mm de los nódulos y prevalencia de la enfermedad del 54%). Por ejemplo, no sería aconsejable usar este modelo en una mujer de 47 años con un NPS de 6 mm de diámetro. Todo esto nos lleva a reflexionar acerca de la verdadera utilidad de los modelos matemáticos de estimación de probabilidad pretest en Medicina.

El valor predictivo de un test positivo es el porcentaje de personas con test anormal que tiene la enfermedad. El valor predictivo depende de la sensibilidad y de la especificidad del test empleado, pero también de la prevalencia de la enfermedad en la población estudiada. El teorema de Bayes relaciona la probabilidad de tener la enfermedad en relación con la probabilidad pretest y al resultado del test empleado. Dicho de otra forma, muestra cómo la combinación de la sensibilidad, especificidad y prevalencia o probabilidad a priori (o pretest) de sufrir una determinada enfermedad nos permite calcular el valor predictivo o la probabilidad a posteriori (o postest). Esta probabilidad a posteriori es la que utilizaremos para confirmar o descartar la enfermedad y actuar en consecuencia. El problema es si el teorema de Bayes es aplicable al diagnóstico médico por cuanto la relación síntoma-enfermedad no es aleatoria, sino causal. En este punto se centran las críticas a esta concepción bayesiana de la medicina. Por escoger una, transcribo íntegramente la opinión del Dr Mario Bunge, quizás uno de los filósofos de la ciencia más reputados en el mundo actual (publicada en la Revista Argentina de Cardiología en referencia a una controversia sobre la aplicabilidad del método bayesiano en el diagnóstico de la cardiopatía isquémica).

Estimado Dr. Mandelman:
Vd. tiene plena razón: el teorema de Bayes no se aplica al diagnóstico médico porque la relación enfermedad – síntoma no es aleatoria sino causal. Es como estimar la probabilidad de que un balazo que acierta hiera. Yo he criticado la industria de la medicina bayesiana en mi Tratise, Vol. 7, Part II, así como en un artículo publicado hace un par de años en «Facta philosophica». En mi próximo libro «Emergence and Convergence» digo lo siguiente, entre otras cosas (traducido del original en inglés):
Malabares numéricos bayesianos No existe duda de que, aun cuando es poco explícitamente utilizada por los médicos, la estadística epidemiológica es de valor en el diagnóstico médico. Por ejemplo, dado que la tuberculosis es endémica en Calcuta, es razonable sospechar que la tuberculosis es la causa ante un paciente con hemoptisis en Calcuta.

Sin embargo, sólo futuras exploraciones, como una radiografía de tórax o la búsqueda del bacilo de Koch en sangre, pueden establecer el verdadero valor de la hipótesis. En cada caso, la epidemiología produce frecuencias, no probabilidades, dado que el comienzo de la enfermedad es un asunto de causalidad y no de casualidad. Es por esto que los médicos hablan de etiología, no de Tichelogy. En otras palabras, las estadísticas de morbilidad y mortalidad dan estimados de probabilidades (likelihoods), tales como la de cáncer de pulmón entre fumadores de sexo masculino de cincuenta años de edad. Esta probabilidad (likelihood) no es asunto de opinión o incertidumbre, dado que los mecanismos a través de los cuales el cigarrillo causa cáncer de pulmón son conocidos por lo menos en sus rasgos generales. Sin embargo, los teóricos médicos y epidemiológicos de la escuela bayesiana favorecen el uso de los cálculos de probabilidad en el diagnóstico y tratamiento médico (por ejemplo, Swarts 1998). Las ideas subyacentes son las que siguen.

En primera instancia, cuando enfrentamos a una incertidumbre recurrimos a una probabilidad (subjetiva). Segundo, la relación entre el síndrome S y su causa D, así como entre el tratamiento T y su resultado (outcome), son probabilísticos debido a las incertidumbres del médico que asiste al paciente. Esto implica que el médico es exhortado a evaluar opiniones con probabilidades definidas (asignando probabilidades definidas). Permitámonos examinar el procedimiento. Para evitar la innecesaria duplicación de fórmulas, unificaremos el diagnóstico y el tratamiento, considerando tanto enfermedad como tratamiento como causas C, y el síndrome o el resultado del tratamiento como efectos E. Tendremos entonces cuatro probabilidades:

Las probabilidades previas P(C) y P(E), y las probabilidades condicionales P(E|C) y P(C|E). Estas últimas dos son denominadas «likelihood» y «posibilidad posterior», respectivamente. Las primeras dos deben ser leídas como «la probabilidad de la causa C» y «la probabilidad del efecto E», respectivamente. Los símbolos restantes deben ser interpretados como «la probabilidad del efecto E dada la causa C» y «la probabilidad (inversa) de la causa C dado el efecto E», respectivamente. En algunos casos los mismos argumentos de la función de probabilidad P son nterpretados en términos de hipótesis y datos. Por ejemplo, se afirma que la P(E|C) es la probabilidad de la evidencia o resultado E dada la hipótesis C, mientras que la P(C|E) resultaría la probabilidad inversa de la hipótesis C dados los resultados o evidencia E. Estas probabilidades expuestas son relacionadas por el teorema de Bayes:
P(C|E) = P(C) · P(E|C) / P(E)

Ésta es la pieza central del diagnóstico médico bayesiano y la inferencia estadística. Aun cuando es una formulación correcta del cálculo de probabilidades, existen serias objeciones a su interpretación en términos de causas (o hipótesis) y efectos (o datos). La primera es que el cálculo de probabilidad refiere a mecanismos de azar, mientras que el proceso de enfermedad es causal, y por consiguiente las relaciones síntomas-enfermedad y tratamiento-resultado son causales. Por ejemplo, el exceso de colesterol en sangre causa la obstrucción de las arterias y la cirugía de bypass restituye el flujo normal: no existe aleatoridad aquí.

Una segunda objeción es que las «probabilidades» previas de enfermedad (o tratamiento) y del síndrome (o resultado) son raramente conocidas. Y si son esti-
madas artificialmente, no estamos haciendo ciencia. La opinión cuantitativa no es más rigurosa que la opinión cualitativa.

Puede replicarse que las probabilidades antedichas pueden ser estimadas con frecuencias. Es cierto, en ocasiones los epidemiólogos pueden informarnos la frecuencia de una enfermedad en una población dada, lo que nos daría un estimado de la P(C). Sin embargo, las tres frecuencias remanentes habitualmente son desconocidas. Lo mejor que los reportes médicos y libros de texto nos dicen es que un valor determinado de E está «usualmente», «típicamente» o «en forma muy frecuente» asociado con C (Eddy y Clanton, 1982). En consecuencia, el diagnóstico bayesiano es prácticamente imposible además de ser conceptualmente erróneo debido a que asume que la relación síndrome-enfermedad es aleatoria.

A primera vista parecería que estas objeciones pueden ser dejadas de lado si C y E son interpretadas como proposiciones: C como la hipótesis de que una enfermedad dada (o tratamiento) está presente, y E por los datos que acompañan al síndrome (o resultado) en cuestión. Sin embargo, esta reinterpretación no funciona, dado que no se pueden asignar probabilidad a las proposiciones, en mayor medida en que pueden atribuírsele velocidades o viscosidades.

Sólo a hechos (estados y eventos) pueden asignarse probabilidades, y sólo en el caso de que sean aleatorios. Sin embargo, nada de lo afirmado anteriormente invalida la búsqueda epidemiológica de las asociaciones entre síndromes-enfermedad.

Existen dos asociaciones:
La probabilidad del síndrome S cuando la enfermedad D está presente.
La plausibilidad de que el síndrome S indique la enfermedad D.

Sin embargo, estas probabilidades y plausibilidades son producidas por las estadísticas médicas, no por la fórmula bayesiana. Por ejemplo, la plausibilidad de un diagnóstico de cáncer de mama basado en una mamografía positiva puede ser de 0,40, mientras que la probabilidad de un test positivo cuando está presente el cáncer debe ser cercano a 1 (recuerde la posibilidad de falsos negativos). Estos números, y las cifras de incidencia de cáncer y tests mamográficos positivos, no se combinan de acuerdo con la fórmula bayesiana, como es claramente observable en las tablas de Eddy.

Un hallazgo aún más perturbante es que el 95% de los médicos norteamericanos confunden la probabilidad (likelihood) y plausibilidad en cuestión, las que son diferentes tanto en términos conceptuales como numéricos. Claramente, el bayesianismo es riesgoso para su salud.

En conclusión, la teoría de la probabilidad no debe ser utilizada para el diagnóstico o el tratamiento médico, dado que ambas se relacionan con causación en lugar de azar. El azar interviene en medicina sólo cuando evaluamos hipótesis nulas o cuando asignamos pacientes a grupos experimentales o control en ensayos clínicos. Además, jugar (gambling) con la salud es tan inmoral como disparatado. Se podrá argumentar que esta máxima se aplica a la terapéutica tanto como al diagnóstico.

Profesor Mario Bunge.

Cargando…