Para muchas personas, el cribado parece instintivamente algo apropiado, porque detectar algo antes parece mejor. Sin embargo, ninguna prueba de cribado es perfecta. Siempre existirán los problemas de resultados incorrectos y otras cuestiones mencionadas anteriormente. Es un requisito ético que se dé una información equilibrada y precisa a los participantes en el momento en que se les ofrece el cribado, para que puedan tomar una decisión totalmente informada sobre si aceptan o no.
Antes de que se implante un programa de cribado, debe analizarse para asegurarse de que ponerlo en marcha haría más bien que mal. Los mejores estudios para evaluar si una prueba de cribado aumentará la salud de una población son los ensayos controlados aleatorios rigurosos.
Cuando se estudia un programa de cribado mediante estudios de casos y controles o, más habitualmente, de cohortes, diversos factores pueden hacer que la prueba de cribado parezca tener más éxito del que realmente tiene. Una serie de sesgos diferentes, inherentes al método de estudio, sesgarán los resultados.
SobrediagnósticoEditar
El cribado puede identificar anomalías que nunca causarían un problema en la vida de una persona. Un ejemplo de ello es el cribado del cáncer de próstata; se ha dicho que «mueren más hombres con cáncer de próstata que de él». Los estudios de autopsias han demostrado que entre el 14 y el 77% de los hombres de edad avanzada que han fallecido por otras causas se descubre que tenían cáncer de próstata.
Además de los problemas relacionados con el tratamiento innecesario (el tratamiento del cáncer de próstata no está en absoluto exento de riesgos), el sobrediagnóstico hace que un estudio parezca bueno al detectar anomalías, aunque a veces sean inofensivas.
El sobrediagnóstico se produce cuando todas estas personas con anomalías inofensivas se cuentan como «vidas salvadas» por el cribado, en lugar de como «personas sanas innecesariamente perjudicadas por el sobrediagnóstico». Por tanto, podría conducir a un ciclo sin fin: cuanto mayor sea el sobrediagnóstico, más gente pensará que el cribado es más eficaz de lo que es, lo que puede reforzar a la gente para que se haga más pruebas de cribado, lo que conduce a un sobrediagnóstico aún mayor. Raffle Mackie y Gray llaman a esto la paradoja de la popularidad del cribado: «Cuanto mayor sea el daño por sobrediagnóstico y sobretratamiento del cribado, mayor será el número de personas que crean que deben su salud, o incluso su vida, al programa»(p56 Cuadro 3.4)
El cribado del neuroblastoma, el tumor sólido maligno más común en los niños, en Japón es un muy buen ejemplo de por qué un programa de cribado debe ser evaluado rigurosamente antes de su implantación. En 1981, Japón inició un programa de cribado del neuroblastoma mediante la medición del ácido homovanílico y el ácido vanilmandélico en muestras de orina de bebés de seis meses. En 2003, se organizó un comité especial para evaluar la motivación del programa de cribado del neuroblastoma. Ese mismo año, el comité llegó a la conclusión de que había pruebas suficientes de que el método de cribado utilizado en aquella época conducía a un sobrediagnóstico, pero no había pruebas suficientes de que el programa redujera las muertes por neuroblastoma. Por ello, el comité recomendó no realizar el cribado y el Ministerio de Salud, Trabajo y Bienestar decidió detener el programa de cribado.
Otro ejemplo de sobrediagnóstico ocurrió con el cáncer de tiroides: su incidencia se triplicó en Estados Unidos entre 1975 y 2009, mientras que la mortalidad se mantuvo constante. En Corea del Sur, la situación fue aún peor, ya que la incidencia se multiplicó por 15 entre 1993 y 2011 (el mayor aumento de la incidencia del cáncer de tiroides en el mundo), mientras que la mortalidad se mantuvo estable. El aumento de la incidencia se asoció a la introducción del cribado por ultrasonografía.
El problema del sobrediagnóstico en el cribado del cáncer es que en el momento del diagnóstico no es posible diferenciar entre una lesión inofensiva y una letal, a menos que el paciente no se trate y muera por otras causas. Así que se tiende a tratar a casi todos los pacientes, lo que lleva a lo que se denomina sobretratamiento. Como dicen los investigadores Welch y Black, «el sobrediagnóstico -junto con el subsiguiente tratamiento innecesario con los riesgos que conlleva- es posiblemente el daño más importante asociado a la detección temprana del cáncer.»
Sesgo de tiempo de esperaEditar
Si el cribado funciona, debe diagnosticar la enfermedad objetivo antes de lo que lo haría sin el cribado (cuando aparecen los síntomas).
Incluso si en ambos casos una persona va a morir al mismo tiempo, porque diagnosticamos la enfermedad antes con el cribado el tiempo de supervivencia desde el diagnóstico es mayor con el cribado; incluso en el caso la vida no se ha prolongado, y habrá una ansiedad añadida ya que el paciente debe vivir con el conocimiento de la enfermedad durante más tiempo.
Si el cribado funciona, debe introducir un tiempo de espera. Así que las estadísticas de tiempo de supervivencia desde el diagnóstico tienden a aumentar con el cribado debido al tiempo de espera introducido, incluso cuando el cribado no ofrece beneficios. Si no pensamos en lo que significa realmente el tiempo de supervivencia en este contexto, podríamos atribuir el éxito a una prueba de cribado que no hace nada más que adelantar el diagnóstico; la comparación de las estadísticas de mortalidad debida a una enfermedad en una población cribada y no cribada da una información más significativa.
Sesgo de tiempo de duraciónEditar
Muchas pruebas de cribado implican la detección de cánceres. El cribado tiene más probabilidades de detectar tumores de crecimiento más lento (debido al mayor tiempo de permanencia preclínica) que tienen menos probabilidades de causar daños. Además, esos cánceres agresivos tienden a producir síntomas en el intervalo entre los cribados programados, siendo menos probable que sean detectados por el cribado. Así, los casos que el cribado suele detectar automáticamente tienen mejor pronóstico que los sintomáticos. La consecuencia es que esos casos de progresión más lenta se clasifican ahora como cánceres, lo que aumenta la incidencia, y debido a su mejor pronóstico, las tasas de supervivencia de las personas sometidas a cribado serán mejores que las de las personas no sometidas a él, aunque el cribado no suponga ninguna diferencia.
Sesgo de selecciónEditar
No todo el mundo participará en un programa de cribado. Hay factores que difieren entre los que están dispuestos a someterse a las pruebas y los que no.
Si las personas con un mayor riesgo de padecer una enfermedad tienen más probabilidades de someterse a las pruebas de detección, por ejemplo, las mujeres con antecedentes familiares de cáncer de mama tienen más probabilidades que otras mujeres de participar en un programa de mamografía, entonces una prueba de detección parecerá peor de lo que realmente es: los resultados negativos entre la población sometida a las pruebas de detección serán más elevados que para una muestra aleatoria.
El sesgo de selección también puede hacer que una prueba parezca mejor de lo que realmente es. Si una prueba está más disponible para las personas jóvenes y sanas (por ejemplo, si la gente tiene que viajar una larga distancia para hacerse un chequeo), entonces menos personas de la población sometida a cribado tendrán resultados negativos que para una muestra aleatoria, y la prueba parecerá marcar una diferencia positiva.
Los estudios han demostrado que las personas que acuden al cribado tienden a ser más sanas que las que no lo hacen. Esto se ha llamado el efecto del cribado saludable, que es una forma de sesgo de selección. La razón parece ser que las personas sanas, acomodadas, en buena forma física, no fumadoras y con padres longevos tienen más probabilidades de acudir a hacerse el cribado que las personas con bajos ingresos, que tienen problemas sociales y de salud. Un ejemplo de sesgo de selección se produjo en el ensayo de Edimburgo sobre cribado mamográfico, que utilizó la aleatorización por grupos. El ensayo descubrió una reducción de la mortalidad cardiovascular en quienes se sometieron a cribado de cáncer de mama. Eso ocurrió debido a las diferencias de base en cuanto al nivel socioeconómico de los grupos: el 26% de las mujeres del grupo de control y el 53% del grupo de estudio pertenecían al nivel socioeconómico más alto.
Diseño de estudios para la investigación de programas de cribadoEditar
La mejor manera de minimizar el sesgo de selección es utilizar un ensayo controlado aleatorio, aunque los estudios observacionales, naturalistas o retrospectivos pueden tener cierto valor y suelen ser más fáciles de realizar. Cualquier estudio debe ser lo suficientemente amplio (incluir muchos pacientes) y lo suficientemente largo (seguir a los pacientes durante muchos años) para tener la potencia estadística necesaria para evaluar el verdadero valor de un programa de cribado. En el caso de las enfermedades raras, pueden ser necesarios cientos de miles de pacientes para darse cuenta del valor del cribado (encontrar suficiente enfermedad tratable), y para evaluar el efecto del programa de cribado en la mortalidad un estudio puede tener que seguir la cohorte durante décadas. Estos estudios llevan mucho tiempo y son caros, pero pueden proporcionar los datos más útiles con los que evaluar el programa de cribado y practicar una medicina basada en la evidencia.
Mortalidad por todas las causas frente a mortalidad específica por la enfermedadEditar
El principal resultado de los estudios de cribado del cáncer suele ser el número de muertes causadas por la enfermedad que se está cribando, lo que se denomina mortalidad específica por la enfermedad. Por poner un ejemplo: en los ensayos de cribado con mamografía para el cáncer de mama, el resultado principal que se comunica suele ser la mortalidad por cáncer de mama. Sin embargo, la mortalidad específica de la enfermedad puede estar sesgada a favor del cribado. En el ejemplo del cribado del cáncer de mama, las mujeres sobrediagnosticadas de cáncer de mama podrían recibir radioterapia, lo que aumenta la mortalidad por cáncer de pulmón y enfermedades cardíacas. El problema es que esas muertes suelen clasificarse como otras causas y podrían ser incluso mayores que el número de muertes por cáncer de mama evitadas por el cribado. Así que el resultado no sesgado es la mortalidad por todas las causas. El problema es que se necesitan ensayos mucho más amplios para detectar una reducción significativa de la mortalidad por todas las causas. En 2016, el investigador Vinay Prasad y sus colegas publicaron un artículo en BMJ titulado «Por qué el cribado del cáncer nunca ha demostrado salvar vidas», ya que los ensayos de cribado del cáncer no mostraron una reducción de la mortalidad por todas las causas.