blog
Il teorema di Bayes, o teorema della probabilità delle cause, enunciato da Thomas Bayes all’inizio del XVIII secolo, serve per calcolare la probabilità a posteriori di un evento A, conoscendo la probabilità a priori di un evento B.
In pratica calcoli la probabilità che una causa, a priori, abbia prodotto un effetto a posteriori.
Come abbiamo detto inizialmente, il teorema di Bayes ti aiuta a calcolare la probabilità che una causa abbia provocato un effetto sull’evento che stai analizzando.
Questo evento avrà quindi una probabilità a priori, cioè la probabilità che questo evento si verifichi prima che una seconda causa vada a condizionarlo.
Per poter iniziare con il teorema di Bayes dovrai, per prima cosa, avere accesso ad alcuni dati. Questi non possono essere calcolati, dovrai averli a disposizione, o nella vita reale o nel tema d'esame universitario.
Solitamente si usano le lettere A,B,C,... per indicare gli eventi. e di conseguenza le loro probabilità, ma è solo una prassi.
\(\displaystyle P(A) \quad P(B) \quad P(C) \)
Un altro dato fondamentale che devi avere all'inzio è la probabilità che, dato che si è verificato un evento B, allora si verifichi un evento A.
\(\displaystyle P(A \mid B) \)
Questo valore viene chiamato probabilità condizionata, perché l'evento A è condizionato al fatto che è già accaduto l'evento B
Se hai problemi a comprendere la probabilità condizionata ti lascio una lezione gratuita tratta dal mio videocorso sulla probabilità e le variabili casuali.
Vediamo adesso come si applica il teorema di Bayes, ripercorrendo insieme i vari passaggi, prima dal punto di vista teorico e poi con un esempio pratico.
Come accennato prima, hai bisogno di alcune probabilità che si conoscono a priori. Indicherò con A e B due eventi e con la lettera D un terzo evento condizionato ai primi due.
P ( A ) = Probabilità a priori che accada l'evento A
P ( B ) = Probabilità a priori che accada l'evento B
P ( D | A ) = Probabilità condizionata che accada l'evento D, dato che si è verificato l'evento A
P ( D | B ) = Probabilità condizionata che accada l'evento D, dato che si è verificato l'evento B
Questi dati dovrai sempre averceli! Può capitare che in un esame universitario ti diano altre informazioni per ricavarli, ma questo fa parte del calcolo delle probabilità che ti ho spiegato in un altro articolo.
Altra cosa da sapere è che potresti avere un terzo evento C (o un quarto, un quinto...), ma lo sostanza non cambia.
Ai miei studenti dico che la cosa più importante per capire il teorema di Bayes è la comprensione del concetto di probabilità totale e te lo voglio spiegare attraverso un esempio reale.
Se devi preparare una torta, la prima cosa da fare è comprare gli ingredienti: latte, uova, farina e via dicendo.
Una volta cotta possiamo dire che gli ingredienti hanno formato il 100% della torta. Ecco, metaforicamente assumi che la torta sia la probabilità totale.
Il teorema di Bayes serve per individuare la percentuale di ogni ingrediente della torta! Ti è chiaro il concetto? Formalmente si avrà che la probabilità totale di D è:
\(\displaystyle P(D) = P(A) \times P(D \mid A) + P(B) \times P(D \mid B) \)
Ora che abbiamo calcolato la probabilità totale, il passaggio successivo è il teorema di Bayes, che entra in gioco in seguito, calcolando la probabilità a posteriori che una causa abbia realizzato un effetto.
Ritorniamo all'esempio degli ingredienti e della torta. Devi calcolare la "parte" sul "tutto" che in statistica significa trovare una percentuale.
Prenderai una parte della probabilità totale e la rapporterai a la stessa per poter calcolare quello che ti chiede l'esercizio.
Formalmente con i dati riferiti ai due eventi A e B puoi calcolare queste due probabilità a posteriori.
\(\displaystyle P(A \mid D) = \frac{P(A) \times P(D \mid A)}{P(D)} \)
\(\displaystyle P(B \mid D) = \frac{P(B) \times P(D \mid B)}{P(D)} \)
Attenzione: la somma delle due situazioni analizzate dal teorema di Bayes deve sempre fare 100! Questo perché, a logica, prende in considerazione due dati opposti l’uno all’altro, per cui un fattore o si verifica o non si verifica, non esiste una terza strada.
Per questo motivo sommando i due valori trovati devo sempre avere come risultato il 100%.
Se hai ancora dubbi sul teorema di Bayes, ti consiglio di guardarti il video iniziale dove te lo spiego con una metafora statistica.
Proviamo ad entrare nella pratica del teorema di Bayes spiegandolo con un esempio, così vedrai che, in realtà, avrai già affrontato qualcosa di simile nella vita reale
Un'azienda ha due catene di produzione. Nella catena \( A \) si produce il 70% dei pezzi con una difettosità del 7%, mentre nella catena \( B \) la difettosità è del 9%. Calcolare la probabilità che un pezzo difettoso provenga dalla prima o dalla seconda catena di produzione e verificare che la somma delle probabilità dia 1.
Tabella dei dati:
\[
\begin{array}{|c|c|}
\hline
\textbf{Evento} & \textbf{Probabilità} \\
\hline
P(A) & 0,70 \\
P(B) & 0,30 \\
P(D|A) & 0,07 \\
P(D|B) & 0,09 \\
\hline
\end{array}
\]
Passo 1: Calcolo della probabilità totale di un pezzo difettoso \( P(D) \)
Il Teorema della Probabilità Totale afferma che:
\[
P(D) = P(A) \cdot P(D|A) + P(B) \cdot P(D|B)
\]
Sostituendo i valori:
\[
P(D) = (0,70 \cdot 0,07) + (0,30 \cdot 0,09)
\]
\[
P(D) = 0,049 + 0,027 = 0,076
\]
Passo 2: Applicazione del Teorema di Bayes per \( P(B|D) \)
Il Teorema di Bayes afferma che:
\[
P(B|D) = \frac{P(B) \cdot P(D|B)}{P(D)}
\]
Sostituendo i valori:
\[
P(B|D) = \frac{0,30 \cdot 0,09}{0,076}
\]
\[
P(B|D) = \frac{0,027}{0,076} = 0,355
\]
Passo 3: Applicazione del Teorema di Bayes per \( P(A|D) \)
Analogamente, calcoliamo:
\[
P(A|D) = \frac{P(A) \cdot P(D|A)}{P(D)}
\]
Sostituendo i valori:
\[
P(A|D) = \frac{0,70 \cdot 0,07}{0,076}
\]
\[
P(A|D) = \frac{0,049}{0,076} = 0,645
\]
Passo 4: Verifica della somma delle probabilità
Poiché un pezzo difettoso può provenire solo da \( A \) o \( B \), la somma delle due probabilità deve essere pari a 1:
\[
P(A|D) + P(B|D) = 0,645 + 0,355 = 1
\]
Ciò significa che, se un pezzo è difettoso, la probabilità che provenga dalla catena \( A \) è del 64,5%, mentre la probabilità che provenga dalla catena \( B \) è del 35,5%.
Spesso per spiegare il teorema di Bayes si usa far ricorso a una trasmissione televisa che senza saperlo ha commesso un errore grave dal punto di vista statistico. Se sei curioso, leggi fino alla fine!
Negli anni ‘60 la televisione statunitense ospitava Let’s Make a Deal, un gioco a premi condotto da Maurice Halprin, noto con lo pseudonimo di Monty Hall.
Proprio da qui ha inizio il paradosso, o problema di Monty Hall nel quale a ogni concorrente venivano presentate 3 porte, chiedendogli di sceglierne solamente una.
Dietro a due di esse c’era una capra, mentre la terza nascondeva un’automobile. Il giocatore avrebbe portato a casa il premio che avrebbe trovato dietro alla porta da esso selezionata.
Nel caso del problema di Monty Hall, la probabilità che il concorrente scelga la porta giusta è, banalmente di 1/3.
Si tratta del rapporto tra i casi favorevoli (1 porta vincente) e i casi possibili (3 porte totali): la probabilità è del 33,3%.
Chiamiamo la prima porta A, la seconda B, la terza C e supponiamo che il concorrente scelga la prima. Pertanto avremo:
\(\displaystyle P(V \mid A) = 0.333 \)
A questo punto Monty Hall fa una cosa che non avrebbe dovuto fare e cioè apre una nuova porta al giocatore, chiedendogli poi se vuole cambiare scelta. Poniamo che gli mostri la porta B.
Ovviamente tra le due che non aveva scelto all'inizio il giocatore, Monty Hall apre quella che aveva dietro la capra e non la macchina.
Qui entra in gioco la probabilità condizionata, cioè come si modifica la probabilità dopo che un nuovo evento è entrato in scena, creando un effetto sulla prima situazione.
Il giocatore sapeva con certezza che la macchina poteva essere o dietro la porta A (da lui scelta) o dietro la porta C, e Monty Hall chiedeva: “Vuoi cambiare porta o confermi quella selezionata?”
Da questo momento, se il concorrente decide effettivamente di cambiare porta, la probabilità di vittoria raddoppia, passando dal 33,3% al 66,6%. Vediamo come.
Con 2 porte chiuse su 3, si potrebbe pensare che le probabilità di vittoria ora siano 50/50 per ognuna, e che quindi non ci sia motivo di cambiare porta selezionata.
Invece è proprio il teorema di Bayes che ci mostra che non è così, ma che per i concorrenti di Let’s Make a Deal era sempre consigliabile cambiare porta.
Ci sono tre scenari possibili, e ognuno di essi ha probabilità di vittoria del 33,3% a priori, ma a posteriori dopo l'informazione data da Monty Hall diventano del 66,6% qualsiasi porta abbia scelto.
In questo immagine ti rappresento la realtà di un'ipotetica puntata del programma di Monty Hall.
1 - Il giocatore sceglie la porta numero 1, che nasconde una capra. Il conduttore sceglie l'altra capra, la numero 2. Cambiando, il giocatore VINCE l'auto.
2 - Il giocatore sceglie la porta numero 2, che nasconde una capra. Il conduttore sceglie l'altra capra, la numero 1. Cambiando, il giocatore VINCE l'auto.
3 - Il giocatore sceglie la porta numero 3, che nasconde l'auto. Il conduttore sceglie una capra, non importa quale. Cambiando, il giocatore PERDE l'auto.
Nei primi due scenari, se il giocatore cambia vince l'auto, nel terzo invece se il giocatore cambia non vince.
Dal momento che la strategia "cambiare" porta alla vittoria in due casi su tre, allora la probabilità che questa si verifichi è del 66,6%, passando da una probabilità iniziale di 1/3 a quella a posteriori di 2/3.
Il calcolo appena effettuato, cioè la probabilità che la percentuale di vittoria del concorrente sia aumentata a causa dell'intervento di Monty Hall è proprio il teorema di Bayes.
Non c’è un comando specifico ma si utilizzano le celle per inserire i dati e fare i calcoli necessari
Non c’è un comando
“La teoria della probabilità non è in fondo che il buon senso ridotto a calcolo: essa fa apprezzare con precisione ciò che gli spiriti giusti sentono per una sorta di istinto, senza che essi possano, sovente, rendersene conto.”
Pierre Simon Laplace
Iscriviti alla Newsletter