[BASE Cinque - Appunti di Matematica ricreativa]

Introduzione alla regola di Bayes

Ovvero la probabilità delle cause o delle ipotesi.

Gianfranco Bo


Indice

1. Introduzione

Esempio 1 - Problema diretto - facile

Esempio 2 - Problema diretto - difficile

Esempio 3 - Problema inverso (finalmente!)

2. La regola

Dalla soluzione a una formula particolare

Dalla formula particolare a quella generale

Lessico bayesiano

Ripasso

Esempio 4 - Chi ha suonato la campana?

3. Se le ipotesi sono più di due?

Esempio 5 - Il sacchetto misterioso

4. Se qualche dato è variabile?

Esempio 6 - L'ultimo soldato


I miei esercizi preferiti sulla regola di Bayes

Vai alla pagina degli esercizi, che contiene:

1. Il commissario Thomas Bayes e la macchina della verità

2. L'arciere bugiardo

3. Caccia all'orso

4. Mentire sulla tombola

5. I due testimoni


Prima puntata - Introduzione

Dopo aver studiato la probabilità condizionata, se vogliamo fare un passo avanti significativo, potremmo imparare la formula di Bayes.

In realtà, è molto di più di una formula. E' un modo di pensare che permette di affrontare problemi inversi di probabilità.

Cosa significa?

Cominciamo con tre esempi.


Esempio 1 - Problema diretto - facile

In una scatola ci sono esattamente 7 palline bianche e 3 nere.

Se estrai una pallina a caso, qual è la probabilità che sia bianca?

Soluzione.

fig


Esempio 2 - Problema diretto - difficile

Due scatole, chiamate A, B, contengono 10 palline ciascuna.

fig

Qualcuno sceglie una scatola a caso, lanciando una moneta, e da questa estrae una pallina a caso.

Qual è la probabilità che la pallina sia nera?

Soluzione.

Qui bisogna applicare le formule della probabilità composta e della probabilità totale, che dovresti già sapere.

Disegniamo il grafo ad albero delle probabilità in questa situazione. fig

fig


Nota bene.

fig


Esempio 3 - Problema inverso (finalmente!)

Due scatole, chiamate A, B, contengono 10 palline ciascuna.

Qualcuno sceglie una scatola a caso e da questa estrae una pallina a caso.

La pallina estratta è nera.

Da quale scatola è stata estratta?

Soluzione.

Ammettetelo: sospettate che la pallina nera provenga dalla scatola A, perché ce ne sono 9 su 10, mentre nell'altra ce ne sono molto meno. Questa è un'ipotesi.

Se però voi non sapeste che la pallina estratta è nera dovreste fare due ipotesi a pari merito.

In mancanza di altre informazioni si conviene di assegnare a entrambe le ipotesi la stessa probabilità iniziale che in questo caso è 1/2. Questa si chiama probabilità a priori.

fig

Però abbiamo una informazione in più: la pallina estratta è nera.

Questa nuova informazione ci fa propendere per l'ipotesi A.

Ma di quanto?

Riprendiamo il grafo delle probabilità.

fig

La probabilità totale di estrarre una pallina nera, è:

fig

La probabilità (scegliere la scatola A) AND (estrarre una pallina nera) è:

fig

Questi due risultati significano che se facciamo moltissime estrazioni, otterremo statisticamente che:

Quindi possiamo concludere che la probabilità che una pallina nera provenga dalla scatola A è:

fig

Per scrivere quest'ultimo risultato basta applicare la definizione classica di probabilità di un evento E:

fig

dove nE = numero dei casi favorevoli all'evento E, n = numero dei casi possibili.


Nota bene.

fig


Seconda puntata - La regola di Bayes

Dalla soluzione a una formula particolare

Ripassiamo la soluzione dell'esempio 3 cercando di ricavare una formula matematica.

Usiamo la seguente notazione:

Il nostro procedimento si può sintetizzare con la seguente formula:

fig

da cui deriva:

fig


Dalla formula particolare a quella generale

Proviamo ora a generalizzare.

Abbiamo una certa stima della probabilità a priori di un evento A, che possiamo chiamare ipotesi o causa.

Veniamo a sapere che si è verificato l'evento E, che possiamo chiamare effetto.

Allora la probabilità a posteriori dell'evento A, una volta acquisita l'informazione E, é:

fig

da cui deriva:

fig

Questa è la cosiddetta formula di Bayes.


Lessico bayesiano

Da quel che ho capito, ci sono diversi punti di vista filosofici quando si affrontano problemi di probabilità inversa.

Perciò, alcune cose si possono chiamare con nomi diversi.

Dal punto di vi vista matematico, invece, non cambia nulla.

Probabilità delle cause

L'evento A si chiama causa e l'evento B effetto.

Quindi, quando calcoliamo fig stiamo calcolando la probabilità della causa A in relazione all'effetto E.

Questa definizione mette in evidenza l'aspetto oggettivo del calcolo.

Probabilità delle ipotesi

L'evento A si chiama ipotesi e l'evento B è una informazione che utilizziamo per valutare l'ipotesi.

Quindi, quando calcoliamo fig stiamo calcolando l'attendibilità dell'ipotesi A in relazione all'informazione E.

Questa definizione mette in evidenza l'aspetto soggettivo del calcolo.

Formula (o teorema) di Bayes

Si chiama così in onore di Thomas Bayes (1702-1761), il matematico e ministro presbiteriano britannico, che (probabilmente?) fu il primo a dimostrarla. La sua dimostrazione fu pubblicata postuma nel 1763.

Stephen Mack Stigler, nell'articolo "Who discovered Bayes's theorem?", The American Statistician, 37, 1983, sostiene che in realtà il teorema di Bayes fu scoperto da Nicholas Saunderson (1682-1739).

fig

Thomas Bayes (?) (1702-1761)

fig

Nicholas Saunderson (1682-1739)


Ripasso

Osserviamo amorevolmente la formula:

fig


Esempio 4 - Chi ha suonato la campana?

Aldo e Baldo sono due monelli che si divertono a lanciare palline di gomma contro le campane per farle suonare.

Hanno un sacchetto che contiene 4 palline bianche e 6 nere.

Estraggono una pallina a caso: se è bianca, la tira Aldo, se è nera, la tira Baldo.

Si sa che:

Oggi hanno fatto il loro gioco con la campana della chiesa e si è sentito "DONNN".

Chi ha suonato la campana?

Soluzione

Disegniamo il diagramma ad albero delle probabilità.

fig

Possiamo fare 2 ipotesi che hanno le seguenti probabilità a priori.

Inoltre sappiamo che:

E = la campana ha suonato.

Valutiamo l'ipotesi A.

Applichiamo la formula di Bayes

fig

Calcoliamo con lo stesso procedimento l'ipotesi che sia stato Baldo.

fig

Attenzione!

Non dobbiamo applicare la cosiddetta regola di Bayes in modo meccanico. Dobbiamo invece cercare di capire bene la situazione.

Si poteva arrivare agli stessi risultati con altri due metodi.

Medodo 2. Usare la formula delle probabilità composta (normalizzata)

fig

Metodo 3. Usare un ragionamento frequentistico

Dal diagramma delle probabilità si deduce che, in media, ogni 100 lanci la campana suona 36 + 12 = 48 volte.

Di questi 48 "DONNN", 36 sono causati da Aldo e 12 da Baldo.

Quindi, in proporzione:

fig

fig

Facile, vero?

Riepilogo della soluzione

Priori Posteriori
Ipotesi Aldo 40% 75%
Ipotesi Baldo 60% 25%


Terza puntata - Se le ipotesi sono più di due?

Esempio 5 - Il sacchetto misterioso

C'é un sacchetto che contiene delle palline, sai che sono 4.

Ci sono alcune palline bianche e alcune nere, ma non sai quante di ogni colore.

Non ci sono palline di altri colori.

Hai diritto a 3 estrazioni, rimettendo ogni volta la pallina estratta nel sacchetto.

Devi scoprire la composizione delle palline nel sacchetto, cioè quante palline nere e quante bianche ci sono.

Come fai?

Soluzione

Facciamo le tre estrazioni ed escono due palline bianche e una nera, {b, b, n}.

Riguardo alla composizione del sacchetto, a priori, abbiamo tre ipotesi equiprobabili che corrispondono alle possibili combinazioni.

fig

Indichiamo con P(b) la probabilità che esca una pallina bianca e con P(n) la probabilità che esca una pallina nera.

Ipotesi A 3 bianche + 1 nera P(b) = 3/4 P(n) = 1/4
Ipotesi B 2 bianche + 2 nere P(b) = 2/4 P(n) = 2/4
Ipotesi C 1 bianca + 3 nere P(b) = 1/4, P(n) = 3/4

Ma abbiamo un'informazione in più che è il risultato delle tre estrazioni: {b, b, n}.

Calcoliamo la probabilità di questa terna nelle tre ipotesi, applicando la regola della probabilità composta.

Ricordiamo che la terna {b, b, n} (combinazione) può comparire in tre disposizioni diverse: (b, b, n), (b, n, b), (n, b, b), perciò la probabilità di una disposizione va moltiplicata per 3.

Ipotesi A 3 b + 1 n fig
Ipotesi B 2 b + 2 n fig
Ipotesi C 1 b + 3 n fig

Detto questo, disegniamo il grafo della situazione.

fig

Calcoleremo le probabilità a posteriori delle ipotesi A, B, C con tre metodi diversi.

Calcoliamo la probabilità a posteriori dell'ipotesi A usando la formula di Bayes

fig è la probabilità a priori dell'ipotesi A
E combinazione estratta {b, b, n}, è l'informazione aggiuntiva
fig è la probabilità di estrarre {b, b, n} nell'ipotesi che il sacchetto contenga 3b + 1n
fig è la probabilità totale che esca la combinazione {b, b, n}

Applichiamo ora la formula di Bayes per valutare l'ipotesi A.

fig

Calcoliamo la probabilità a posteriori dell'ipotesi B usando la formula della probabilità composta.

fig

Calcoliamo infine la probabilità a posteriori dell'ipotesi C usando un ragionamento statistico

Dal diagramma delle probabilità si deduce che, in media, ogni 192 lanci esce 27 + 24 + 9 = 60 volte la combinazione {b, b, n}.

Nove di queste 60 volte derivano dal'ipotesi C.

Quindi, in proporzione:

fig

Facile, vero?

Riepilogo della soluzione

A priori A posteriori
Ipotesi A 33,3...% 45%
Ipotesi B 33,3...% 40%
Ipotesi C 33,3...% 15%

Quarta puntata - Se qualche dato è variabile?

Esempio 6 - L'ultimo soldato

Sei un soldato in combattimento, rannicchiato in una trincea.

Sai per certo che è rimasto UN SOLO soldato nemico sul campo di battaglia, a circa 350 m di distanza.

Sai anche che se il nemico è un soldato normale, ha il 30% di probabilità di colpirti con un tiro da quella distanza.

Ma se invece è un tiratore scelto allora la sua probabilità di colpirti con un tiro da quella distanza è dell'80%.

Ti consoli pensando che i tiratori scelti sono rari, quindi è probabilmente solo un soldato normale. Provi a sbirciare con la testa fuori dalla trincea.

BAM! Un proiettile colpisce il tuo casco militare e ti rannicchi subito nella trincea.

Pensi: "I tiratori scelti sono rari, ma quel tipo mi ha colpito con un proiettile da 350 m di distanza. Forse è un tiratore scelto!"

Dopo pochi minuti, ti fai coraggio e sbirci di nuovo con la testa fuori dalla trincea.

BAM! Un altro proiettile rimbalza sul tuo casco! Giù di nuovo nella trincea.

"Belin," - pensi - "questo dev'essere proprio un tiratore scelto! Farei meglio a chiamare aiuto."

Qual è la probabilità della tua ipotesi che il soldato nemico sia un tiratore scelto?

fig

(Per questo problema, mi sono ispirato a: http://commonsenseatheism.com/?p=13156)

Soluzione.

La probabilità a priori non è indicata nel testo. Tu ti auguri che non sia un tiratore scelto perché i tiratori scelti siano rari ma non hai dati sicuri.

Allora vediamo cosa succede facendo variare la probabilità a priori da 0 a 1. Indichiamola con x.

Disegniamo prima di tutto il grafo ad albero delle probabilità.

fig

Applichiamo la formula di Bayes per esprimere la probabilità a posteriori che il soldato nemico sia un tiratore scelto (P(A | E)).

Usiamo come dato aggiuntivo (E) il fatto che egli ha centrato il tuo casco due volte su due tiri.

fig è la probabilità a priori che il nemico sia un tiratore scelto.
E ha colpito il tuo casco due volte su due tiri, è l'informazione aggiuntiva
fig è la probabilità che il tiratore scelto ti colpisca 2 volte di seguito
fig è la probabilità totale che tu sia colpito 2 tiri di seguito

Applichiamo ora la formula di Bayes per valutare l'ipotesi A.

fig

Facendo qualche ulteriore semplificazione, possiamo scrivere una semplice funzione che lega la probabilità a posteriori (y) a quella a priori (x).

fig

Disegniamo il grafico della funzione, tra 0 e 1. E' evidente che, in questo caso, la formula di Bayes modifica notevolmente la probabilità a priori.

fig

Se vogliamo complicarci la vita, potremmo considerare variabili anche le probabilità di far centro dei due tipi di soldato.

Otterremmo così una funzione a quattro variabili.

Ma questa è un'altra storia...

Comunque, a titolo di esempio osserviamo il grafico seguente in cui il soldato normale è abbastanza abile nel tiro al bersaglio.

In questo caso la differenza fra probabilità a priori e a posteriori si riduce notevolmente.

fig

Alcune considerazioni personali

Questo metodo bayesiano è affascinante ma dipende molto dall'affidabilità dei dati iniziali. E questi, a loro volta, sono delle valutazioni di probabilità.

Come facciamo a sapere quanto sono affidabili?

Io non lo so, ma mi viene da pensare che la probabilità delle ipotesi più che essere una misura oggettiva di qualcosa, è una misura soggettiva di quanto noi riteniamo verosimile quel qualcosa stesso.

Non è una critica, è solo una considerazione, magari anche banale, chiedo scusa.

.

Pace e bene a tutti.

GfBo


Data creazione: 28 luglio 2014

Ultimo aggiornamento: 26 agosto 2014

xhtml 1.1


Sito Web realizzato da Gianfranco Bo