domenica 16 dicembre 2018

Teorema di Bayes e diagnosi medica

Si consideri uno schema come il seguente nel quale C rappresenta una delle tante cause osservabili, E rappresenta uno dei tanti effetti osservabili, e le frecce dirette dalla causa all’effetto rappresentano i rapporti di causa/effetto.



Il "problema classico" della probabilità può essere risolto applicando la deduzione logica. Conoscendo la causa, possiamo da questa dedurre gli effetti corrispondenti. Così sapendo che un dado ha sei facce, quindi conoscendo la causa, possiamo da questa dedurre la probabilità che ha una specifica faccia di comparire al prossimo lancio del dado (l'effetto). La soluzione del cosiddetto "problema inverso", ovvero l’induzione logica, è più difficile, in quanto ad un effetto possono corrispondere più cause. Il teorema di Bayes [1] consente, a partire dagli effetti osservati, di calcolare la verosimiglianza delle cause - espressa nel solo modo possibile, cioè in termini di probabilità.

Il teorema di Bayes trova applicazione nel campo della diagnostica medica. La quale prevede che sulla base della conoscenza medica - delle malattie (cause) e dei rispettivi sintomi e segni (effetti) - in uno specifico paziente si debba invertire il processo e risalire dai sintomi e dai segni presenti (effetti) alla malattia (causa) che li ha determinati. Compito sovente non facile dato che gli effetti possono essere attribuiti a differenti cause.

Per affrontare il tema sono necessarie alcune definizioni.

La probabilità marginale che si verifichi l’evento A è

P(A)

e si legge semplicemente "la probabilità di A". Dal punto di vista numerico la probabilità marginale di un evento è un numero positivo compreso tra 0 (evento che non accade mai) e 1 (evento certo) ovvero
0 P(A) 1

Corollario: la probabilità che non si verifichi l’evento A è

P(nonA) = 1 – P(A)

La probabilità condizionata
P(A|B)

è la probabilità di un evento A condizionata ad un evento B, ovvero è la probabilità che si verifichi A a condizione che si sia verificato B e si legge "la probabilità di A, dato B" ovvero "la probabilità di A condizionata a B"

La probabilità congiunta
P(A B)

è la probabilità di due eventi congiunti, ovvero è la probabilità che si verifichino sia A sia B, e si legge "la probabilità congiunta di A e B" ovvero "la probabilità di A e B". La probabilità congiunta può essere meglio compresa facendo riferimento al diagramma seguente:


La relazione fra probabilità condizionata e probabilità congiunta è la seguente:

P(A B) = P(A|B) P(B)    (i)

ma poiché la probabilità congiunta deve necessariamente essere la stessa sia partendo dalla probabilità di A sia partendo dalla probabilità di B, deve essere anche

P(A B) = P(B|A)P(A)    (ii)

Combinando la (i) con la (ii) si ottiene il teorema delle probabilità composte

P(A B) = P(A|B) P(B) = P(B|A) P(A)

e dall'identità
P(A|B)  P(B) = P(B|A)  P(A)

si ricava il teorema di Bayes:

                                                                  P(B|A)P(A)
                                                 P(A|B) =   ----------------
                                                                        P(B)

Se poniamo A = la causa e B = l’effetto, il teorema di Bayes suona così

                                               P(dell’effetto|data la causa) × P(della causa)
P(della causa|dato l’effetto) =    --------------------------------------------------
                                                 P(dell’effetto)

Se consideriamo il problema specifico della diagnosi medica, nel caso di una malattia M (la causa) che può essere presente (soggetti malati, M+) o assente (soggetti sani, M-), e di un segno T (l'effetto) determinato da questa malattia, come è tipicamente il risultato di un test per la sua diagnosi, che può essere positivo (T+) o negativo (T-), l'espressione precedente può essere riscritta come

            P(T+|M+)P(M+)
P(M+|T+) = ----------------------  (iii)
          P(T+)

Partendo dalla probabilità condizionata


Malattia +
Malattia -
Test +
P(T+|M+)
P(T+|M-)
Test -
P(T-|M+)
P(T-|M-)

e moltiplicando le probabilità della prima colonna (Malattia +) per la probabilità di presenza della malattia nella popolazione P(M+), cioè per la prevalenza della malattia, e moltiplicando le probabilità della seconda colonna (Malattia -) per la probabilità di assenza della malattia nella popolazione P(M-), essendo P(M-) = 1 - P(M+) otteniamo 


Malattia +
Malattia -
Test +
P(T+|M+) · P(M+)
P(T+|M-) · P(M-)
Test -
P(T-|M+) · P(M+)
P(T-|M-) · P(M-)

Sostituendo la probabilità di un test positivo P(T+) riportata al denominatore della (iii) con la somma P(T+|M+) · P(M+) + P(T+|M-) · P(M-) delle probabilità riportate nella riga Test + di quest'ultima tabella, possiamo esprimere il teorema di Bayes (iii) nella forma seguente, che consente di calcolare il valore predittivo di un test positivo P(M+|T+) ovvero la probabilità di essere malato per un soggetto che presenta un test positivo

         P(T+|M+) · P(M+)
P(M+|T+) = --------------------------------------------  (iv)
            P(T+|M+) · P(M+) + P(T+|M-) · P(M-)

Le grandezze in gioco nel calcolo del valore predittivo di un test positivo P(M+|T+) sono [2]:
la sensibilità P(T+|M+) del test diagnostico, che è la probabilità che il test sia positivo in un soggetto malato;
la specificità P(T-|M-) del test diagnostico che è la probabilità che il test sia negativo in un soggetto sano;
la prevalenza della malattia P(M+) cioè la probabilità di incontrare un soggetto malato nella popolazione generale.

Il teorema di Bayes consente di calcolare anche il valore predittivo di un test negativo P(M-|T-), ovvero la probabilità di essere sano per un soggetto che presenta un test negativo, nella forma seguente

         P(T-|M-) · P(M-)
P(M-|T-) = --------------------------------------------   (v)
           P(T-|M-) · P(M-) + P(T-|M+) · P(M+)

In genere, a causa del fatto che le statistiche epidemiologiche sono effettuate contando i casi - cosicché per conoscere ad esempio la prevalenza dell'influenza si conta il numero dei malati di influenza esistenti nella popolazione [3] - spesso si preferisce, in alternativa alle probabilità della (iv) e della (v), impiegare il numero di casi osservati, riportati in questo modo


Malattia +
Malattia -
Test +
VP
FP
Test -
FN
VN

e definiti, per uno specifico test diagnostico e una specifica malattia, come [4]:
veri positivi (VP), il numero di soggetti malati con il test positivo;
falsi positivi (FP), il numero di soggetti sani con il test positivo;
falsi negativi (FN), il numero di soggetti malati con il test negativo;
veri negativi (VN), il numero di soggetti sani con il test negativo.

Queste quattro grandezze, per un dato test diagnostico, sono quindi dei semplici conteggi dei risultati ottenuti applicando il test in condizioni controllate (nell'ambito di una ricerca clinica). In questa immagine 



è riportata in altro a sinistra (Fig. 1a) la distribuzione dei risultati di un ipotetico test in un campione di soggetti non affetti (Sani) e in un campione di soggetti affetti (Malati) da una specifica malattia. Le distribuzioni si sovrappongono parzialmente (area in colore verde): ed è quanto si osserva di fatto, nella stragrande maggioranza dei casi, nella realtà.

Se, ai fini della classificazione dei pazienti che hanno eseguito il test, fissiamo come valore soglia tra sani a malati quello riportato nella Fig. 1b, ci garantiamo di individuare correttamente tutti i soggetti malati (VP), e non avremo falsi negativi (FN), ma a scapito del fatto che classificheremo come malati anche molti soggetti sani (FP) e ridurremo il numero di soggetti sani correttamente classificati come tali (VN). In altre parole, in termini di probabilità, privilegeremo la sensibilità del test a scapito della sua specificità: non avremo alcun falso negativo (FN) ma avremo molti falsi positivi (FP).

Se fissiamo come valore soglia tra sani e malati quello riportato nella Fig. 1c, ci garantiamo di individuare correttamente tutti i soggetti sani (VN), e non avremo falsi positivi (FP) ma a scapito del fatto che classificheremo come sani anche molti soggetti malati (FN) e ridurremo il numero di soggetti malati correttamente classificati come tali (VP). In altre parole, in termini di probabilità, privilegeremo la specificità del test a scapito della sua sensibilità: non avremo alcun falso positivo (FP) ma avremo molti falsi negativi (FN).

Se infine fissiamo come valore soglia tra sani e malati quello riportato nella Fig. 1d, ci garantiamo di individuare correttamente la maggior parte dei soggetti sani (VN) e di individuare correttamente la maggior parte dei soggetti malati (VP), minimizzando contemporaneamente sia la possibilità di sbagliare classificando come sani dei soggetti malati (FN) sia la possibilità di sbagliare classificando come malati dei soggetti sani (FP). In altre parole, in termini di probabilità, realizzeremo un rapporto equilibrato tra la specificità del test e la sua sensibilità.

Nella maggior parte dei casi il valore soglia è scelto sulla base della strategia rappresentata nella Fig. 1d, che minimizza sia i falsi positivi sia i falsi negativi: è proprio questa la strategia seguita dalle curve ROC (vedere il post Curve ROC e valore soglia).  Tuttavia in casi particolari è possibile che sia più appropriato impiegare la strategia rappresentata nella Fig. 1b  (massimizzare la sensibilità) o più appropriato impiegare la strategia rappresentata nella Fig. 1c (massimizzare la specificità). Per una introduzione generale all'impiego del teorema di Bayes nella diagnosi medica vedere Federspil, Galen, Gigerenzer, Gill, Goodman, Motterlini e Nordenström nella pagina della bibliografia.

Dopo avere definito il valore soglia, dal quale dipendono la sensibilità e la specificità del test:
 il valore predittivo del test positivo, cioè la probabilità di essere malato per un soggetto che presenta un test positivo [5] 
 il valore predittivo del test negativo, cioè la probabilità di essere sano per un soggetto che presenta un test negativo [5] 
possono essere calcolati - a partire dalle probabilità mediante la (iv) e la (v) o, in alternativa, a partire dal numero di casi osservati VP, FP, FN, VN - come illustrato nel post Sensibilità, specificità, valore predittivo e nel post Efficienza e accuratezza diagnostica.


----------

[1] Bayes T. An essay towards solving a problem in the doctrine of chances. By the late Rev. Mr. Bayes, F. R. S. communicated by Mr. Price, in a letter to John Canton, A. M. F. R. S. Philo. Trans. Roy. Soc. 1763;53;370-418, doi: https://doi.org/10.1098/rstl.1763.0053

[2] Altman DG, Bland JM. Statistics Notes: Diagnostic tests 1: sensitivity and specificity. BMJ 1994;308;1552. URL consultato il 29/10/2018: https://goo.gl/x7Txjz

[3] In termini di conteggi la prevalenza è il numero di casi di malattia esistenti in un determinato momento in una data popolazione. Non deve essere confusa con l'incidenza, che è il numero di nuovi casi di malattia che si verificano in un determinato arco di tempo in una data popolazione.

[4] Gerhardt W, Keller H. Evaluation of test data from clinical studies. Scand J Clin Lab Invest 1986;46(supplement 181). URL consultato il 18/06/2019: http://bit.ly/2IVp4ox

[5] Altman DG, Bland JM. Statistics Notes: Diagnostic tests 2: predictive values. BMJ 1994;309;102. URL consultato il 29/10/2018: https://goo.gl/xffgB9

Nessun commento:

Posta un commento