A molte persone, lo screening sembra istintivamente una cosa appropriata da fare, perché prendere qualcosa prima sembra meglio. Tuttavia, nessun test di screening è perfetto. Ci saranno sempre i problemi con i risultati errati e altre questioni elencate sopra. È un requisito etico che le informazioni equilibrate e accurate siano date ai partecipanti nel momento in cui viene offerto lo screening, in modo che possano fare una scelta pienamente informata sul fatto di accettare o meno.
Prima che un programma di screening sia implementato, dovrebbe essere esaminato per assicurarsi che metterlo in atto faccia più bene che male. I migliori studi per valutare se un test di screening aumenterà la salute di una popolazione sono rigorosi studi controllati randomizzati.
Quando si studia un programma di screening usando studi caso-controllo o, più di solito, di coorte, vari fattori possono far apparire il test di screening più efficace di quanto non sia in realtà. Un certo numero di distorsioni diverse, inerenti al metodo di studio, alterano i risultati.
SovradiagnosiModifica
Lo screening può identificare anomalie che non causerebbero mai un problema nel corso della vita di una persona. Un esempio di questo è lo screening del cancro alla prostata; è stato detto che “muoiono più uomini con il cancro alla prostata che per questo”. Studi di autopsia hanno dimostrato che tra il 14 e il 77% degli uomini anziani che sono morti per altre cause si scopre che avevano un cancro alla prostata.
A parte i problemi con i trattamenti non necessari (il trattamento del cancro alla prostata non è affatto privo di rischi), la sovradiagnosi fa sembrare uno studio bravo a cogliere le anomalie, anche se a volte sono innocue.
La sovradiagnosi si verifica quando tutte queste persone con anomalie innocue vengono contate come “vite salvate” dallo screening, piuttosto che come “persone sane inutilmente danneggiate dalla sovradiagnosi”. Quindi potrebbe portare a un ciclo senza fine: maggiore è la sovradiagnosi, più persone penseranno che lo screening sia più efficace di quanto non sia, il che può rafforzare le persone a fare più test di screening, portando a ancora più sovradiagnosi. Raffle Mackie e Gray chiamano questo il paradosso popolare dello screening: “Maggiore è il danno attraverso la sovradiagnosi e il sovratrattamento da screening, più persone ci sono che credono di dovere la loro salute, o addirittura la loro vita, al programma” (p56 Box 3.4)
Lo screening per il neuroblastoma, il più comune tumore solido maligno nei bambini, in Giappone è un ottimo esempio del perché un programma di screening deve essere valutato rigorosamente prima della sua attuazione. Nel 1981, il Giappone ha iniziato un programma di screening per il neuroblastoma misurando l’acido omovanillico e l’acido vanilmandelico in campioni di urina di bambini di sei mesi. Nel 2003, un comitato speciale è stato organizzato per valutare la motivazione del programma di screening del neuroblastoma. Nello stesso anno, il comitato concluse che c’erano prove sufficienti che il metodo di screening usato all’epoca portasse a una sovradiagnosi, ma non c’erano prove sufficienti che il programma riducesse le morti per neuroblastoma. Come tale, il comitato ha raccomandato contro lo screening e il Ministero della Salute, del Lavoro e del Welfare ha deciso di fermare il programma di screening.
Un altro esempio di sovradiagnosi è accaduto con il cancro alla tiroide: la sua incidenza è triplicata negli Stati Uniti tra il 1975 e il 2009, mentre la mortalità è rimasta costante. In Corea del Sud, la situazione è stata ancora peggiore con un aumento di 15 volte dell’incidenza dal 1993 al 2011 (il più grande aumento al mondo dell’incidenza del cancro alla tiroide), mentre la mortalità è rimasta stabile. L’aumento dell’incidenza è stato associato all’introduzione dello screening ecografico.
Il problema della sovradiagnosi nello screening del cancro è che al momento della diagnosi non è possibile differenziare tra una lesione innocua e una letale, a meno che il paziente non si curi e muoia per altre cause. Così quasi tutti i pazienti tendono ad essere trattati, portando a quello che viene chiamato overtreatment. Come hanno detto i ricercatori Welch e Black, “La sovradiagnosi – insieme al successivo trattamento non necessario con i relativi rischi – è probabilmente il danno più importante associato alla diagnosi precoce del cancro”.
Lead time biasEdit
Se lo screening funziona, deve diagnosticare la malattia obiettivo prima di quanto sarebbe senza screening (quando compaiono i sintomi).
Anche se in entrambi i casi una persona morirà nello stesso momento, perché abbiamo diagnosticato la malattia prima con lo screening il tempo di sopravvivenza dalla diagnosi è più lungo con lo screening; anche nel caso in cui la durata della vita non è stata prolungata, e ci sarà un’ansia in più perché il paziente deve vivere più a lungo con la conoscenza della malattia.
Se lo screening funziona, deve introdurre un tempo di anticipo. Quindi la statistica del tempo di sopravvivenza dalla diagnosi tende ad aumentare con lo screening a causa del tempo di anticipo introdotto, anche quando lo screening non offre alcun beneficio. Se non pensiamo a cosa significhi effettivamente il tempo di sopravvivenza in questo contesto, potremmo attribuire il successo a un test di screening che non fa altro che anticipare la diagnosi; confrontare le statistiche della mortalità dovuta a una malattia in una popolazione sottoposta e non sottoposta a screening fornisce informazioni più significative.
Length time biasEdit
Molti test di screening comportano l’individuazione di tumori. Lo screening ha maggiori probabilità di rilevare tumori a crescita più lenta (a causa del tempo di permanenza pre-clinica più lungo) che hanno meno probabilità di causare danni. Inoltre, questi tumori aggressivi tendono a produrre sintomi nell’intervallo tra gli screening programmati, essendo meno probabile che vengano rilevati dallo screening. Quindi, i casi che lo screening spesso rileva automaticamente hanno una prognosi migliore dei casi sintomatici. La conseguenza è che quei casi più lentamente progressivi sono ora classificati come cancri, il che aumenta l’incidenza, e a causa della migliore prognosi, i tassi di sopravvivenza delle persone sottoposte a screening saranno migliori di quelli delle persone non sottoposte a screening anche se lo screening non fa alcuna differenza.
Selection biasEdit
Non tutti parteciperanno a un programma di screening. Ci sono fattori che differiscono tra coloro che sono disposti a sottoporsi al test e coloro che non lo sono.
Se le persone con un rischio più elevato di una malattia hanno più probabilità di essere sottoposte a screening, per esempio le donne con una storia familiare di cancro al seno hanno più probabilità delle altre donne di aderire a un programma di mammografia, allora un test di screening sembrerà peggiore di quello che è in realtà: gli esiti negativi tra la popolazione sottoposta a screening saranno più alti che per un campione casuale.
Il bias di selezione può anche far sembrare un test migliore di quello che è realmente. Se un test è più disponibile per persone giovani e sane (per esempio se le persone devono percorrere una lunga distanza per essere controllate), allora meno persone nella popolazione sottoposta a screening avranno esiti negativi rispetto a un campione casuale, e il test sembrerà fare una differenza positiva.
Gli studi hanno dimostrato che le persone che partecipano allo screening tendono a essere più sane di quelle che non lo fanno. Questo è stato chiamato l’effetto healthy screenee, che è una forma di bias di selezione. La ragione sembra essere che le persone che sono sane, benestanti, fisicamente in forma, non fumatori con genitori longevi sono più propensi a venire a farsi controllare rispetto a quelli a basso reddito, che hanno problemi di salute e sociali esistenti. Un esempio di bias di selezione si è verificato nello studio di Edinburgo sullo screening mammografico, che ha utilizzato la randomizzazione a grappolo. Lo studio ha trovato una ridotta mortalità cardiovascolare in coloro che sono stati sottoposti a screening per il cancro al seno. Questo è successo perché le differenze di base per quanto riguarda lo status socio-economico nei gruppi: il 26% delle donne nel gruppo di controllo e il 53% nel gruppo di studio apparteneva al livello socio-economico più alto.
Disegno dello studio per la ricerca dei programmi di screeningModifica
Il modo migliore per minimizzare i bias di selezione è quello di utilizzare uno studio controllato randomizzato, anche se gli studi osservazionali, naturalistici o retrospettivi possono avere un certo valore e sono in genere più facili da condurre. Qualsiasi studio deve essere sufficientemente grande (includere molti pazienti) e sufficientemente lungo (seguire i pazienti per molti anni) per avere il potere statistico di valutare il vero valore di un programma di screening. Per le malattie rare, centinaia di migliaia di pazienti possono essere necessari per realizzare il valore dello screening (trovare abbastanza malattie trattabili), e per valutare l’effetto del programma di screening sulla mortalità uno studio può dover seguire la coorte per decenni. Tali studi richiedono molto tempo e sono costosi, ma possono fornire i dati più utili con cui valutare il programma di screening e praticare la medicina basata sull’evidenza.
Mortalità per tutte le cause vs. mortalità specifica della malattiaModifica
Il risultato principale degli studi di screening del cancro è di solito il numero di morti causate dalla malattia per cui si effettua lo screening – questa è chiamata mortalità specifica della malattia. Per fare un esempio: nelle prove di screening mammografico per il cancro al seno, il risultato principale riportato è spesso la mortalità per cancro al seno. Tuttavia, la mortalità specifica della malattia potrebbe essere distorta a favore dello screening. Nell’esempio dello screening del cancro al seno, le donne con una diagnosi eccessiva di cancro al seno potrebbero ricevere la radioterapia, che aumenta la mortalità per il cancro ai polmoni e le malattie cardiache. Il problema è che queste morti sono spesso classificate come altre cause e potrebbero anche essere maggiori del numero di morti per cancro al seno evitate dallo screening. Quindi il risultato non distorto è la mortalità per tutte le cause. Il problema è che sono necessari studi molto più grandi per rilevare una riduzione significativa della mortalità per tutte le cause. Nel 2016, il ricercatore Vinay Prasad e colleghi hanno pubblicato un articolo su BMJ intitolato “Perché lo screening del cancro non ha mai dimostrato di salvare vite umane”, in quanto gli studi di screening del cancro non hanno mostrato una riduzione della mortalità per tutte le cause.