[BASE Cinque - Appunti di Matematica ricreativa]

Il commissario Thomas Bayes e la macchina della verità

Nel Paese degli Onesti e dei Sinceri, qualcuno ha rubato la marmellata della nonna.

Baldo è sospettato di aver commesso tale grave delitto.

Poiché non ci sono prove decisive a carico di Baldo, il commissario Thomas Bayes decide di sottoporlo alla Macchina della Verità.

La Macchina della Verità registra alcuni parametri del corpo umano che indicano lo stato d'ansia di una persona: il ritmo della respirazione, la sudorazione delle mani, le pulsazioni cardiache. Sulla base di questi dati, la Macchina stabilisce se l'individuo mente o dice la verità, per mezzo di due luci colorate.

luce rossa = la persona ha mentito
luce verde = la persona ha detto la verità

Purtroppo la Macchina della Verità non è perfetta, può sbagliare la valutazione.

La sua sensibilità è del 76%, cioè su 100 mentitori ne scopre 76 (e ne sbaglia 24).
La sua specificità è invece del 63%, cioè su 100 persone sincere, per la Macchina della Verità solo 63 dicono la verità mentre le altre 37 mentono.

Baldo appartiene a una popolazione in cui 5 persone su 1000 sono mentitori, mentre 995 dicono la verità.

Ecco un rapporto dell'interrogatorio di Baldo.

Domanda del commissario: "Baldo, sei stato tu a rubare la marmellata della nonna?"

Risposta di Baldo: "No, io non ho rubato la marmellata della nonna."

Si accende la luce rossa. Ciò significa che Baldo ha mentito.

Il commissario, pensieroso, si domanda: "Qual è la probabilità che Baldo abbia effettivamente mentito dato l'esito positivo della Macchina della Verità?"

fig

Credit immagine: wikiHow (Creative Commons-Attribution-NonCommercial-ShareAlike)

Soluzione

Costruiamo il grafo della situazione.

fig

Osserviamo il grafo e rispondiamo alle seguenti domande.

Qual è la probabilità a priori che Baldo sia un mentitore?

La ricaviamo dalle statistica sulla popolazione.

fig

Noi però abbiamo una informazione aggiuntiva:

E = Si è accesa la luce rossa (il test ha dato esito positivo).

Qual è la probabilità totale che si accenda la luce rossa?

fig

Qual è la probabilità (condizionata) che si accenda la luce rossa nel caso Baldo abbia mentito?

La ricaviamo dalla sensibilità della macchina.

P(E | A) = 0,76

Vogliamo ora calcolare la probabilità a posteriori dell'ipotesi:

P(A | E) = Baldo ha mentito, dato l'esito positivo della Macchina della Verità.

Applichiamo la formula di Bayes:

fig

Il grafo ci aiuta a giungere allo stesso risultato con un calcolo più semplice.

fig

In conclusione, nonostante si sia accesa la luce rossa, l'ipotesi che Baldo abbia mentito è poco probabile (1%) mentre Baldo ha detto la verità al 99%.

Interessante, vero?

A questo punto sarebbe opportuno interrogare la nonna!

Note.

Questo problema è tratto e adattato da Fabio Fagnani, Introduzione alla probabilità in 4 lezioni, Dipartimento di Matematica Politecnico di Torino.

Il funzionamento della Macchina della Verità è molto più complesso di come descritto in questo problema.

Un tipo di problema analogo riguarda l'attendibilità dei test medici diagnostici.

Esempio.

La probabilità che un soggetto abbia una certa malattia è pari a 0,01 (1%).

La diagnosi della malattia è effettuata mediante un test clinico che ha le seguenti caratteristiche:

sensibilità = 0,80 (80% probabilità che un soggetto infetto risulti positivo al test);

specificità = 0,904 (90,4% probabilità che un soggetto sano risulti negativo al test).

1) Qual è la probabilità che un soggetto sia malato dato che è risultato positivo al test?

2) Qual è la probabilità che un soggetto sia malato dato che è risultato negativo al test?

Costruiamo il grafo della situazione.

fig

Rispondiamo alla domanda 1)

fig

Strano, vero?

Il test dice che uno è malato, ma la probabilità che sia veramente malato - dato il risultato del test - è minore del 10%.

Come si spiega?

Il test dà un falso positivo il 9,6% delle volte e il 99% delle persone sono sane.

Se mettiamo assieme l'alto numero di persone sane e l'abbastanza alta percentuale di falsi positivi, abbiamo come conseguenza una bassa probabilità che chi ha avuto un test positivo sia davvero malato.

Rispondiamo alla domanda 2)

fig

Questo risultato è meno strano di quello precedente. Se il test dice che uno è sano, rimane una probabilità minore dell'1% che l'individuo sia in realtà malato.

Una illuminante spiegazione di Enrico Delfini al Forum di BASE Cinque

Bayes e tutti i problemi e le conseguenze correlate, sono la delizia, ma soprattutto la croce, per chi cerca di insegnare anche solo i rudimenti della statistica applicata alla medicina agli studenti e agli specializzandi.

E anche parlando con colleghi esperti e competenti, che conosco e ammiro da decenni, mi capita spesso (troppo spesso) di incontrare sacche di "ignoranza" che sono dure a morire.

In medicina, il tipo di problema che si deve spesso affrontare, è quello di interpretare il risultato di un test; magari uno screening per identificare tumori e altre patologie.

Ogni test ha due coefficienti: specificità e sensibilità.

Con il primo termine (specificità) si intende la percentuale dei casi che risultano positivi al test e che sono realmente affetti dalla patologia. Più alto è questo numero, minore è la percentuale di "falsi positivi".

La sensibilità, invece, esprime la percentuale dei casi realmente affetti che risultano positivi all'esame. Più alto è questo parametro, minore sarà il numero di "falsi negativi".

Purtroppo, i due parametri sono, in un certo senso, mutualmente escludenti. Se pretendiamo di massimizzarne uno, dobbiamo cedere qualcosa nel secondo. Un certo numero di falsi positivi e di falsi negativi sono ineliminabili.

Oggi, esistono molti test ed esami, che esibiscono valori di sensibilità e specificità apparentemente ottimi e rassicuranti: 90-95-98 %

Ma è giusto sentirsi rassicurati?

L'esempio classico che faccio ai giovani colleghi specializzandi è qualcosa del tipo:

Un certo test per identificare l'infezione da HIV ha una sensibilità del 99,5 % e una specificità del 98%.

Un paziente riceve un test positivo; qual è la probabilità che sia affetto dal morbo? Messa in questi termini, la domanda...non ha risposta. Proprio perché (Bayes insegna), non conosciamo la probabilità a priori; ovvero, in termini clinici, non sappiamo a quale categoria di rischio appartenga il paziente.

Facciamo due esempi, estremi.

A) il paziente è un omosessuale cinquantenne tossicodipendente promiscuo, che vive in Sudafrica

B) una suora di clausura ottantenne che vive da oltre mezzo secolo in un convento abruzzese.

Senza cadere nel pecoreccio e nel cattivo gusto, possiamo prendere per ragionevole una stima di rischio "a priori" del 40% nel primo caso e dello 0,1% nel secondo. Facciamo un paio di conti. Su mille omosessuali, ce ne sono 400 che sono affetti; solo in 2 di questi (lo 0,5%) non verrà scoperto; per contro, dei seicento "sani", il 2%, cioè 12, risulterà erroneamente malato. In totale vedremo 298+12=410 test positivi, per cui la probabilità che il paziente positivo sia davvero malato è 398/410, cioè oltre il 97%.

Passando alle suorine, abbiamo una sola persona realmente malata, che sarà identificata come positiva nel 99,5% dei casi; diciamo per semplicità che viene scoperta. Delle altre 999, ben 20 risulteranno invece falsamente positive. Ricevere un referto positivo, significa ben poco: 20 volte su 21, si tratta di un errore di laboratorio.

Morale? Ogni test ha senso ed è utile se e solo se sappiamo a chi viene rivolto.

E' uno (non il solo) motivo per cui certi test di screening non vengo proposti "a tutti", ma solo a sottogruppi di popolazione. La mammografia, secondo gli epidemiologi più accorti, non dovrebbe essere proposta prima dei 45 anni (secondo alcuni, anche 50); e così la colonscopia per il tumore al colon, eccetera...

Spesso si sente dire che queste scelte sono stupide, sbagliate, che tengono conto solo dei costi... Non è così. Un eccessivo numero di falsi positivi, oltre ad essere un costo, espone un alto numero di persone a stress, esami anche invasivi e potenzialmente rischiosi, con un limitato aumento di casi identificati. Inoltre, e questo raramente viene preso in considerazione, c'è il problema della expertise e della possibile demotivazione del personale impiegato.

Nessuno si augura di fare continuamente diagnosi di cancro, ma oggettivamente il problema esiste. Il radiologo che legge le mammografie, o l'endoscopista che fa la colonscopia, deve poter "contare" su un certo numero di casi positivi ogni mese, per mantenere la competenza e la bravura per identificare le lesioni anche più piccole e difficili. Nessuno può diventare mammografista esperto, vedendo un caso ogni 6-10-12 mesi.

Tornando al caso delle monache, per una popolazione a rischio così basso, sarebbe più conveniente un esame che fosse meno sensibile, ma molto più specifico.

Immaginiamo un test con solo l'80% di sensibilità, ma il 99,9% di specificità.

La suorina malata verrebbe, molto probabilmente, scoperta lo stesso, ma solo un'altra risulterà falsamente positiva. Cosicché, a posteriori, il test positivo sarà corretto nel 50%.

Un simile esame sarebbe molto meno ragionevole proporlo alla popolazione ad altissimo rischio; nel caso A, avremmo al massimo un falso positivo (forse nessuno; e sarebbe un ottimo risultato); ma 80 malati sfuggirebbero all'identificazione.

07 agosto 2014

Data creazione: agosto 2014

Ultimo aggiornamento: agosto 2014

xhtml 1.1

Sito Web realizzato da Gianfranco Bo