Si consideri uno schema come il seguente nel quale C rappresenta una delle tante cause osservabili, E rappresenta uno dei tanti effetti osservabili, e le frecce dirette dalla causa all’effetto rappresentano i rapporti di causa/effetto.
Il "problema classico" della probabilità può essere risolto applicando la deduzione logica. Conoscendo la causa, possiamo da questa dedurre gli effetti corrispondenti. Così sapendo che un dado ha sei facce, quindi conoscendo la causa, possiamo da questa dedurre la probabilità che ha una specifica faccia di comparire al prossimo lancio del dado (l'effetto). La soluzione del cosiddetto "problema inverso", ovvero l’induzione logica, è più difficile, in quanto ad un effetto possono corrispondere più cause. Il teorema di Bayes [1] consente, a partire dagli effetti osservati, di calcolare la verosimiglianza delle cause - espressa nel solo modo possibile, cioè in termini di probabilità.
Il teorema di Bayes trova applicazione nel campo della diagnostica medica. La quale prevede che sulla base della conoscenza medica - delle malattie (cause) e dei rispettivi sintomi e segni (effetti) - in uno specifico paziente si debba invertire il processo e risalire dai sintomi e dai segni presenti (effetti) alla malattia (causa) che li ha determinati. Compito sovente non facile dato che gli effetti possono essere attribuiti a differenti cause.
Per affrontare il tema sono necessarie alcune definizioni.
La
probabilità marginale
che si verifichi l’evento A è
P(A)
e si legge semplicemente "la probabilità di A". Dal
punto di vista numerico la probabilità marginale di un evento è un numero
positivo compreso tra 0 (evento che non accade mai) e 1 (evento
certo) ovvero
0
≤ P(A)
≤ 1
Corollario:
la probabilità che non si verifichi l’evento A è
P(nonA)
= 1 – P(A)
La
probabilità condizionata
P(A|B)
è
la probabilità di un evento A condizionata ad un evento B,
ovvero è la probabilità
che si verifichi A a condizione che si sia verificato B e
si legge "la probabilità di A, dato B" ovvero "la
probabilità di A condizionata a B"
La
probabilità congiunta
P(A
∩
B)
è
la probabilità di due eventi congiunti, ovvero è
la probabilità che si
verifichino sia A sia B, e si legge "la probabilità
congiunta di A e B" ovvero "la probabilità di A e B".
La probabilità congiunta può essere meglio compresa facendo
riferimento al diagramma seguente:
P(A
∩ B) =
P(A|B) ∙
P(B) (i)
ma poiché la probabilità congiunta deve necessariamente essere la stessa sia partendo dalla probabilità di A sia partendo dalla probabilità di B, deve essere anche
P(A
∩ B) =
P(B|A) ∙ P(A) (ii)
Combinando la (i) con la (ii) si ottiene il teorema
delle probabilità composte
P(A
∩ B) =
P(A|B) ∙
P(B) = P(B|A) ∙
P(A)
e dall'identità
P(A|B) ∙ P(B) = P(B|A) ∙ P(A)
si ricava il teorema di
Bayes:
P(B|A)
∙ P(A)
P(A|B)
= ----------------
P(B)
Se
poniamo A = la causa e B = l’effetto, il teorema di
Bayes suona così
P(dell’effetto|data
la causa) × P(della causa)
P(della
causa|dato l’effetto) = --------------------------------------------------
P(dell’effetto)
Se
consideriamo il problema specifico della diagnosi medica, nel caso di
una malattia M (la causa) che può essere presente (soggetti malati,
M+) o assente (soggetti sani, M-), e di un segno T (l'effetto)
determinato da questa malattia, come è tipicamente il risultato di
un test per la sua diagnosi, che può essere positivo (T+) o negativo
(T-), l'espressione precedente può essere riscritta come
P(T+|M+)
∙ P(M+)
P(M+|T+) = ---------------------- (iii)
P(M+|T+) = ---------------------- (iii)
P(T+)
Partendo dalla probabilità condizionata
Malattia
+
|
Malattia
-
|
|
Test
+
|
P(T+|M+)
|
P(T+|M-)
|
Test
-
|
P(T-|M+)
|
P(T-|M-)
|
e
moltiplicando le probabilità della prima colonna (Malattia +) per la
probabilità di presenza della malattia nella popolazione P(M+),
cioè per la prevalenza della malattia, e moltiplicando le
probabilità della seconda colonna (Malattia -) per la probabilità
di assenza della malattia nella popolazione P(M-),
essendo P(M-) = 1 - P(M+) otteniamo
Malattia
+
|
Malattia
-
|
|
Test
+
|
P(T+|M+)
· P(M+)
|
P(T+|M-)
· P(M-)
|
Test
-
|
P(T-|M+)
· P(M+)
|
P(T-|M-)
· P(M-)
|
Sostituendo la probabilità di un test positivo P(T+) riportata al denominatore della (iii) con la somma P(T+|M+) · P(M+) + P(T+|M-) · P(M-) delle probabilità riportate nella riga Test + di quest'ultima tabella, possiamo esprimere il teorema di Bayes (iii) nella forma seguente, che consente di calcolare il valore predittivo di un test positivo P(M+|T+) ovvero la probabilità di essere malato per un soggetto che presenta un test positivo
P(T+|M+) ·
P(M+)
P(M+|T+)
= -------------------------------------------- (iv)
P(T+|M+)
· P(M+) + P(T+|M-)
· P(M-)
Le
grandezze in gioco nel calcolo del valore predittivo di un test
positivo P(M+|T+) sono [2]:
→ la
sensibilità
P(T+|M+)
del
test diagnostico, che è la probabilità che il test sia positivo
in un soggetto malato;
→ la
specificità
P(T-|M-)
del
test diagnostico che è la probabilità che il test sia negativo
in un soggetto sano;
→ la
prevalenza
della malattia P(M+)
cioè la probabilità di incontrare un soggetto malato nella
popolazione generale.
Il teorema di Bayes consente di calcolare anche il valore predittivo di un test negativo P(M-|T-), ovvero la probabilità di essere sano per un soggetto che presenta un test negativo, nella forma seguente
Il teorema di Bayes consente di calcolare anche il valore predittivo di un test negativo P(M-|T-), ovvero la probabilità di essere sano per un soggetto che presenta un test negativo, nella forma seguente
P(T-|M-) · P(M-)
P(M-|T-) = -------------------------------------------- (v)
P(T-|M-) · P(M-) + P(T-|M+) · P(M+)
Malattia
+
|
Malattia
-
|
|
Test
+
|
VP
|
FP
|
Test
-
|
FN
|
VN
|
e
definiti, per uno specifico test diagnostico e una specifica malattia, come [4]:
→
veri
positivi
(VP),
il numero di soggetti malati
con il test positivo;
→
falsi
positivi
(FP),
il numero di soggetti sani
con il test positivo;
→
falsi
negativi
(FN),
il numero di soggetti malati
con il test negativo;
→ veri
negativi
(VN),
il numero di soggetti sani
con il test negativo.
Queste quattro grandezze, per un dato test diagnostico, sono quindi dei semplici conteggi dei risultati ottenuti applicando il test in condizioni controllate (nell'ambito di una ricerca clinica). In questa immagine
Se, ai fini della classificazione dei pazienti che hanno eseguito il test, fissiamo come valore soglia tra sani a malati quello riportato nella Fig. 1b, ci garantiamo di individuare correttamente tutti i soggetti malati (VP), e non avremo falsi negativi (FN), ma a scapito del fatto che classificheremo come malati anche molti soggetti sani (FP) e ridurremo il numero di soggetti sani correttamente classificati come tali (VN). In altre parole, in termini di probabilità, privilegeremo la sensibilità del test a scapito della sua specificità: non avremo alcun falso negativo (FN) ma avremo molti falsi positivi (FP).
Se fissiamo come valore soglia tra sani e malati quello riportato nella Fig. 1c, ci garantiamo di individuare correttamente tutti i soggetti sani (VN), e non avremo falsi positivi (FP) ma a scapito del fatto che classificheremo come sani anche molti soggetti malati (FN) e ridurremo il numero di soggetti malati correttamente classificati come tali (VP). In altre parole, in termini di probabilità, privilegeremo la specificità del test a scapito della sua sensibilità: non avremo alcun falso positivo (FP) ma avremo molti falsi negativi (FN).
Se infine fissiamo come valore soglia tra sani e malati quello riportato nella Fig. 1d, ci garantiamo di individuare correttamente la maggior parte dei soggetti sani (VN) e di individuare correttamente la maggior parte dei soggetti malati (VP), minimizzando contemporaneamente sia la possibilità di sbagliare classificando come sani dei soggetti malati (FN) sia la possibilità di sbagliare classificando come malati dei soggetti sani (FP). In altre parole, in termini di probabilità, realizzeremo un rapporto equilibrato tra la specificità del test e la sua sensibilità.
Nella maggior parte dei casi il valore soglia è scelto sulla base della strategia rappresentata nella Fig. 1d, che minimizza sia i falsi positivi sia i falsi negativi: è proprio questa la strategia seguita dalle curve ROC (vedere il post Curve ROC e valore soglia). Tuttavia in casi particolari è possibile che sia più appropriato impiegare la strategia rappresentata nella Fig. 1b (massimizzare la sensibilità) o più appropriato impiegare la strategia rappresentata nella Fig. 1c (massimizzare la specificità). Per una introduzione generale all'impiego del teorema di Bayes nella diagnosi medica vedere Federspil, Galen, Gigerenzer, Gill, Goodman, Motterlini e Nordenström nella pagina della bibliografia.
Dopo avere definito il valore soglia, dal quale dipendono la sensibilità e la specificità del test:
→ il valore predittivo del test positivo, cioè la probabilità di essere malato per un soggetto che presenta un test positivo [5]
→ il valore predittivo del test negativo, cioè la probabilità di essere sano per un soggetto che presenta un test negativo [5]
possono essere calcolati - a partire dalle probabilità mediante la (iv) e la (v) o, in alternativa, a partire dal numero di casi osservati VP, FP, FN, VN - come illustrato nel post Sensibilità, specificità, valore predittivo e nel post Efficienza e accuratezza diagnostica.
----------
[1] Bayes T. An essay towards solving a problem in the doctrine of chances. By the late Rev. Mr. Bayes, F. R. S. communicated by Mr. Price, in a letter to John Canton, A. M. F. R. S. Philo. Trans. Roy. Soc. 1763;53;370-418, doi: https://doi.org/10.1098/rstl.1763.0053
[2]
Altman DG, Bland JM. Statistics Notes: Diagnostic tests 1:
sensitivity and specificity. BMJ 1994;308;1552. URL consultato il
29/10/2018: https://goo.gl/x7Txjz
[4]
Gerhardt W, Keller H. Evaluation of test data from clinical studies.
Scand J Clin Lab Invest 1986;46(supplement 181). URL consultato il 18/06/2019: http://bit.ly/2IVp4ox
[5]
Altman DG, Bland JM. Statistics Notes: Diagnostic tests 2:
predictive values. BMJ 1994;309;102. URL consultato il 29/10/2018:
https://goo.gl/xffgB9
Nessun commento:
Posta un commento