whatsapp

adriano gilardone Docente di Statistica Matematica Excel Spss sfruttare excel consulenze statistiche lezione videocorsi

blog

blog

P-value

Ultima modifica (7 Aprile 2025)

YouTube video

Postato il 15 Ottobre 2021

Tag

Contenuti nascondi

1 Il significato del p-value

2 Il test d'ipotesi

3 Come calcolare il p-value

3.1 Esempio calcolo p-value

4 Come interpretare il p-value

4.1 Accettare o rifiutare l'ipotesi nulla (H0)

4.2 L'effect size

4.3 Quando il p-value non è significativo

4.4 Gli errori comuni del p-value

4.5 L'interpretazione corretta del p-value

5 P-value EXCEL

Il significato del p-value

Il p-value, o valore p, è la probabilità di ottenere uno specifico insieme di osservazioni nel caso in cui l’ipotesi nulla fosse vera cioè che quanto stiamo sostenendo sia corretto con un piccolo margine di errore.

Per questo si cade spesso nell’errore di pensare che, se il p-value ha un valore minore a 0.05, allora siamo davanti a un’ipotesi dimostrata correttamente. Vedremo in questo articolo come, in realtà, non sia così, e come non basti un valore del p-value minore di 0.05 per affermare che la tua ipotesi è vera o, viceversa, un valore maggiore di 0.05 per affermare che è sbagliata.

Ma facciamo un passo indietro, e vediamo insieme come si ottiene il p-value: questo numero viene calcolato a partire da un test statistico basato sui risultati osservati durante l’analisi, chiamato test d’ipotesi.

corso statistica

Il test d'ipotesi

Quando esegui un test d’ipotesi, il p-value ti aiuta a determinare la significatività del risultato del test in relazione all’ipotesi nulla.

In molti test condotti in settori quali biologia, psicologia e medicina, spesso si studiano gli effetti che una o più variabili (indipendenti) hanno su un’altra (dipendente). In questi tipi di test, l’ipotesi nulla afferma che non c’è relazione tra le due variabili oggetto di studio (una variabile non influenza l’altra).

In altre parole, l’ipotesi nulla, detta H0, afferma che i risultati del test sono dovuti al caso e quindi non è significativo supportarla. Ancora, l’ipotesi nulla assume che qualsiasi cosa tu stia provando a testare, non andrà a buon fine.

L’ipotesi alternativa invece, detta H1, è quella che tu accetteresti se l’ipotesi nulla fosse falsa. Essa afferma l’opposto dell’ipotesi nulla, e cioè che la variabile indipendente non influenza quella dipendente e che è significativo supportare la questione investigata.

A dir la verità, in statistica si preferisce parlare solo dell'ipotesi nulla di partenza H0, commentando nello specifico solo il rifiuto.

p-value — Probabilità dell'osservazione

Se hai dei dubbi su cosa sia il test d'ipotesi e lo vuoi ripassare velocemente, guarda il mio video su questo argomento in cui te lo spiego in modo semplice e chiaro attraverso una metafora statistica.

YouTube video — Il test d'ipotesi spiegato semplice con una metafora

Come calcolare il p-value

Il calcolo del p-value dipende dal tipo di test che hai scelto per testare le tue ipotesi:

ogni test statistico ha le proprie assunzioni e genera specifici risultati, per tale motivo dovresti scegliere un test statistico appropriato per i tuoi dati e per il tipo di studio che vuoi fare
il tipo di test da scegliere è anche in funzione del numero di variabili indipendenti da includere dato che questo influenza il valore p (vedi t-test a campioni indipendenti per il confronto fra due gruppi e ANOVA per il confronto tra più di due gruppi)

Una volta scelto e condotto il test, il valore del p-value può essere ricavato o tramite le tavole statistiche (Normale, Student, Chi-quadro, Fisher, ecc…) o più semplicemente mediante software quali R, SPSS ed Excel inserendo gli opportuni parametri, che puoi trovare riportati in fondo all'articolo.

Esempio calcolo p-value

Test di ipotesi sulla media

Abbiamo un test bilaterale con:

\[
H_0: \mu = 60, \quad H_1: \mu \neq 60
\]

Dati del campione:

\[
n = 180, \quad \sum X_i = 11232, \quad \sum X_i^2 = 727892
\]

Passo 1: Calcolo della media campionaria

\[
\bar{X} = \frac{\sum X_i}{n}
\]

\[
\bar{X} = \frac{11232}{180} = 62.4
\]

Passo 2: Calcolo della varianza campionaria

\[
s^2_{\text{camp}} = \frac{\sum X_i^2}{n} - \left(\frac{\sum X_i}{n}\right)^2
\]

\[
s^2_{\text{camp}} = \frac{727892}{180} - \left(\frac{11232}{180}\right)^2
\]

\[
s^2_{\text{camp}} = 4043.84 - 3893.76 = 150.084
\]

Passo 3: Calcolo della varianza campionaria corretta

\[
s^2 = \frac{n}{n-1} \cdot s^2_{\text{camp}}
\]

\[
s^2 = \frac{180}{179} \times 150.084 = 150.923
\]

Passo 4: Calcolo dell'errore standard

\[
\text{Errore Standard} = \sqrt{\frac{s^2}{n}}
\]

\[
\text{Errore Standard} = \sqrt{\frac{150.923}{180}} = \sqrt{0.8385} = 0.916
\]

Passo 5: Calcolo del test Z

\[
Z = \frac{\bar{X} - \mu_0}{\text{Errore Standard}}
\]

\[
Z = \frac{62.4 - 60}{0.916} = 2.621
\]

Passo 6: Calcolo del p-value

\[
p = 2 \times (1 - P(Z < 2.621)) \] \[ p = 2 \times (1 - 0.9956) = 0.00877 \]

Decisione: Poiché \( p = 0.00877 \) è inferiore a \( \alpha = 0.05 \), rifiutiamo \(H_0\) e concludiamo che la media di PM10 è significativamente diversa da 60 \(\mu g/m^3\).

corso statistica

Come interpretare il p-value

Per interpretare il p-value devi seguire diversi passaggi. Vediamoli insieme.

Accettare o rifiutare l'ipotesi nulla (H0)

Quando effettui un test statistico il p-value ti aiuta a decidere se rifiutare l’ipotesi nulla. Esso è più piccolo tanto più i tuoi dati si allontanano dal range del test statistico previsto dall’ipotesi nulla.

Prima di condurre un qualsiasi test di ipotesi, si fissa un livello di significatività (di solito α=0,05) sotto il quale il test può ritenersi statisticamente significativo e si confronta quest’ultimo con il valore di probabilità p seguendo la seguente regola pratica:

Se p-value ≤ α si rifiuta l’ipotesi nulla H0
Se p-value > α non si rifiuta H0

Facciamo un esempio pratico, che ti permetta di capire in fondo il significato di p-value.

Supponiamo che vuoi verificare se c’è differenza di peso tra due gruppi di persone a cui vengono somministrate due diete A e B differenti. In questo caso puoi condurre un t-test bilaterale, per ottenere risultati che possano dirti se esiste differenza significativa tra le due diete e che quindi il tipo di dieta (variabili indipendente) influenza il peso (variabile dipendente) dei due gruppi di persone.

Lo schema d’ipotesi è il seguente:

H0 (Ipotesi nulla): “Non c’è differenza di peso tra due i due gruppi”
H1 (Ipotesi alternativa): “C’è differenza di peso tra due i due gruppi”

Se le persone appartenenti ai due gruppi hanno lo stesso peso, vorrà dire che non si hanno sufficienti prove per rifiutare l’ipotesi nulla e il p-value risultante sarà più vicino ad 1.

Nella realtà il valore di probabilità p non sarà esattamente 1, perché i gruppi non saranno perfettamente uguali.

Se invece il risultato osservato sarà che le medie dei pesi dei due gruppi sono differenti, allora il test statistico non cadrà più nella zona dei valori previsti dall’ipotesi nulla e il valore di p sarà più vicino a 0.

Anche in questo caso, il p non sarà perfettamente 0, perché ci sarà sempre una minima probabilità che i risultati del test siano stati ottenuti accidentalmente.

Puoi dunque dire che più piccolo è il p-value, maggiore è l’evidenza che dovresti rifiutare l’ipotesi nulla.

In base al range in cui varia il valore p, si ha un certo grado di significatività, come ti illustro di seguito:

Se il p-value ≤ 0.001 il test si dice estremamente significativo e si rifiuta l’ipotesi nulla.
Se il 0.001 < p-value ≤ 0.01 il test si dice molto significativo e si rifiuta l’ipotesi nulla.
Se il 0.01 < p-value ≤ 0.05 il test si dice significativo e si rifiuta l’ipotesi nulla.
Se il p-value > 0.05 il test non è significativo e non si può rifiutare l’ipotesi nulla.

analisi dati tesi

L'effect size

Una bassa probabilità del p-value (quindi la significatività statistica) è, in realtà, un indicatore che ha il minor peso sui tuoi risultati.

Infatti, tale valore ti dice soltanto se c’è relazione tra variabili dipendente e indipendente e non con quale intensità questa relazione sussiste. Quest’ultima informazione ti viene invece data dall’effect size, letteralmente tradotto come grandezza dell’effetto: maggiore esso è, più forte sarà la relazione tra le due variabili.

Ci sono differenti effect size a seconda della tecnica statistica che stai utilizzando: per esempio la V di Cramer, l’eta quadrato o l’R-quadrato (o R-quadro).

Una delle più importanti misure dell’effect size è fornito dal coefficiente di correlazione di Pearson R. Tale coefficiente varia da -1 (massima correlazione negativa) a 1 (massima correlazione positiva). Qui sotto trovi un elenco che riporta la forza di correlazione in base al valore di r in valore assoluto:

Se 0 ≤ R ≤ 0.2 si ha una correlazione piccola/nulla
Se 0.2 < R ≤ 0.4 si ha una correlazione bassa
Se 0.4 < R ≤ 0.6 si ha una correlazione buona
Se 0.6 < R ≤ 0.8 si ha una correlazione alta
Se 0.8 < R ≤ 1 si ha una correlazione molto alta

Ti lascio un video su calcolare facilmente questo indice utilizzando la calcolatrice SHARP.

YouTube video — La correlazione lineare con la calcolatrice SHARP

Inoltre, a differenza del p-value, il coefficiente di correlazione o, in generale, l’effect size, non è affetto dalla dimensione del campione e può essere usato per confrontare risultati ottenuti da studi condotti in maniera diversa (con setting diversi).

Quando il p-value non è significativo

Come ti ho subito sottolineato all'inizio di questo articolo, un p-value minore di 0.05 non significa necessariamente che la tua ipotesi sia corretta.

Viceversa, però, cosa implica avere un p-value maggiore di 0.05?
L'unica risposta che posso darti è: dipende da quello che stai testando!

Un classico esempio di situazione in cui potresti desiderare un p-value maggiore di 0.05, anche perchè andrebbe in seguito a rendere più facile il tuo lavoro, è il test di normalità di Shapiro-Wilk.

Si tratta di uno dei test più potenti per la verifica della normalità, soprattutto se si ha a che fare con campioni piccoli, e si utilizza per verificare l'ipotesi nulla che un campione provenga da una popolazione che è distribuita normalmente.

Proprio questo è il motivo per cui un p-value maggiore di 0.05 è positivo, in quanto andrebbe a non rifiutare l'ipotesi nulla e, di conseguenza, la variabile analizzata si presuppone sia distribuita normalmente.

Un altro esempio in cui è auspicabile avere un p-value maggiore di 0.05 è il test di Kolmogorov-Smirnov, utilizzato per stabilire il grado di somiglianza tra due diverse distribuzioni.

Se vuoi approfondire la tua conoscenza su SPSS del test di normalità di Shapiro-Wilk o del test di Kolmogorov-Smirnov, ti lascio questo breve video di presentazione del capitolo 9 del mio corso.

YouTube video — Video presentazione cap. 9

Gli errori comuni del p-value

Pensare che un p-value ≤ 0.05 sia abbastanza per poter affermare che la tua ipotesi è corretta è solo uno di alcuni errori che spesso capitano quando si approccia questo argomento. Vediamo insieme gli altri.

Il p-value non è la probabilità:

che l'ipotesi nulla sia vera o falsa.
di rifiutare l'ipotesi nulla quando questa è vera.
che un'osservazione sia dovuta al caso.
che, continuando a ripetere l’esperimento, si otterrebbe sempre lo stesso risultato.

corsi statistica

L'interpretazione corretta del p-value

Un concetto che voglio che ti sia molto chiaro, prima di concludere questo articolo, è che il valore del p-value, da solo, non può farti capire se la tua ipotesi nulla sia giusta o sbagliata.

Riprendiamo l'esempio che abbiamo visto precedentemente, dove avevamo due gruppi di persone A e B, con due diete differenti, e volevamo verificare se questa alimentazione influenzasse il loro peso. In questo caso, l'ipotesi nulla H0 era che non ci fosse differenza di peso tra i due gruppi.

Nel caso tu abbia un p > 0.05, quello che puoi dire è che non possiamo affermare che l'ipotesi nulla sia corretta, ma solo che non vi è evidenza statistica (significatività) che il peso dei due gruppi sia diverso.

Questo dettaglio è fondamentale: la tua interpretazione finale del test non può essere basata unicamente sul valore del p-value, devi sempre tenere conto di tutti gli elementi statistici e applicarli in modo logico.

Se hai ancora dei dubbi, guarda il mio video sul p-value all'inizio dell'articolo che è spiegato semplice con una metafora statistica.

P-value EXCEL

Dipende dal comando usato

P-value SPSS

Sempre presente in qualsiasi statistica lo richieda

Riassumendo

Il p-value è un indicatore di significatività dei test statistici
Se p-value ≤ 0.05 il test è significativo e si rifiuta l’ipotesi nulla H0; se p-value > 0.05 non si rifiuta H0 perchè non c’è effettiva evidenza del contrario
Un p-value piccolo non è abbastanza se non si considera l’effect size
L’effect size misura quanto è grande il legame tra una variabile endogena e una o più variabili esogene

I feel torn between asking questions that I know will lead to statistical significance and asking questions that matter.
(Uno scienziato americano)

Iscriviti alla Newsletter

Se hai bisogno d’informazioni che non hai trovato nella sezione servizi o dei video corsi, scrivimi un messaggio o chiamami.
Domande, prezzi, richieste, delucidazioni...tutto quello che ti serve. Cercherò di risponderti entro le 24h.