fbpx

P-value

Postato il 15 Ottobre 2021
Tag

Significato del p-value

Il p-value, o valore p è la probabilità di ottenere uno specifico insieme di osservazioni nel caso in cui l’ipotesi nulla fosse vera. Questo numero viene calcolato a partire da un test statistico basato appunto sui risultati osservati. Quando esegui un test d’ipotesi, il p-value ti aiuta a determinare la significatività del risultato del test in relazione all’ipotesi nulla. 

Molti test condotti in settori quali biologia, psicologia e medicina, spesso si studiano gli effetti che una o più variabili (indipendenti) hanno su un’altra (dipendente). In questi tipi di test, l’ipotesi nulla afferma che non c’è relazione tra le due variabili oggetto di studio (una variabile non influenza l’altra). In altre parole, l’ipotesi nulla, detta H0, afferma che i risultati del test sono dovuti al caso e quindi non è significativo supportarla. Ancora, l’ipotesi nulla assume che qualsiasi cosa tu stia provando a testare, non andrà a buon fine.

L’ipotesi alternativa invece, detta H1, è quella che tu accetteresti se l’ipotesi nulla fosse falsa. Essa afferma l’opposto dell’ipotesi nulla e cioè che la variabile indipendente non influenza quella dipendente e che è significativo supportare la questione investigata.

A dir la verità in statistica si preferisci parlare solo dell'ipotesi nulla di partenza H0 commentando nello specifico solo il rifiuto.

p-value

Come riconoscere quando il p-value è significativo

Quando effettui un test statistico il p-value ti aiuta a decidere se rifiutare l’ipotesi nulla. Esso è più piccolo tanto più i tuoi dati si allontanano dal range del test statistico previsto dall’ipotesi nulla. Prima di condurre un qualsiasi test di ipotesi, si fissa un livello di significatività (di solito =0,05) sotto il quale il test statistico può ritenersi significativo e si confronta quest’ultimo con il valore di probabilità p seguendo la seguente regola pratica:

  • Se p-value <=   si rifiuta l’ipotesi nulla H0
  • Se p-value >   non si rifiuta H0

Facciamo un esempio pratico che ti permetta di capire in fondo il significato di p-value. Supponiamo che vuoi verificare se c’è differenza di longevità tra due gruppi di topi a cui vengono somministrate due diete A e B differenti. In questo caso puoi condurre un t-test bilaterale per poter dire se esiste differenza significativa tra le due diete e che quindi il tipo di dieta (variabili indipendente) influenza la longevità (variabile dipendente) dei due gruppi di topi. Lo schema d’ipotesi è il seguente:

H0 (Ipotesi nulla): “Non c’è differenza in longevità tra due i due gruppi”

H1 (Ipotesi alternativa): “C’è differenza in longevità tra due i due gruppi”

Se i topi appartenenti ai due gruppi hanno la stessa durata di vita, vorrà dire che non si hanno sufficienti prove per rifiutare l’ipotesi nulla e il p-value risultante sarà più vicino ad 1. Nella realtà il valore di probabilità p non sarà esattamente 1 perché i gruppi non saranno perfettamente uguali.

Se invece le medie delle durate di vita dei due gruppi sono differenti, allora il test statistico non cadrà più nella zona dei valori previsti dall’ipotesi nulla e il valore di p sarà più vicino a 0. Anche in questo caso, il p non sarà perfettamente 0 perché ci sarà sempre una minima probabilità che i risultati del test siano stati ottenuti accidentalmente.

Puoi dunque dire che più piccolo è il p-value, maggiore è l’evidenza che dovresti rifiutare l’ipotesi nulla. In base al range in cui varia il valore p, si ha un certo grado di significatività come ti illustro di seguito:

  • Se il p-value <= 0.001 il test si dice estremamente significativo e si rifiuta l’ipotesi nulla.
  • Se il 0.001 < p-value <= 0.01 il test si dice molto significativo e si rifiuta l’ipotesi nulla.
  • Se il 0.01 < p-value <= 0.05 il test si dice significativo e si rifiuta l’ipotesi nulla.
  • Se il p-value > 0.05 il test non è significativo e non si può rifiutare l’ipotesi nulla.

Come calcolare il valore p

Il calcolo del p-value dipende dal tipo di test che hai scelto per testare le tue ipotesi:

  • ogni test statistico ha le proprie assunzioni e genera specifici risultati, per tale motivo dovresti scegliere un test statistico appropriato per i tuoi dati e per il tipo di studio che vuoi fare
  • Il tipo di test da scegliere è anche in funzione del numero di variabili indipendenti da includere dato che questo influenza il valore p (vedi t-test confronto tra due gruppi e ANOVA per il confronto tra più di due gruppi)

Una volta scelto e condotto il test, il valore del p-value può essere ricavato o tramite le tavole statistiche (Normale, Student, Chi-quadro, Fisher, ecc…) o più semplicemente mediante software quali R, SPSS ed excel (vai in fondo alla pagina per i comandi) inserendo gli opportuni parametri.

Se vuoi capire meglio il concetto del p-value guarda il mio video in cui lo spiego con una metafora

Un p-value piccolo non è abbastanza

Un basso p-value e quindi la significatività statistica è, in realtà, un indicatore che ha il minor peso sui tuoi risultati. Infatti, tale valore ti dice soltanto se c’è relazione tra variabili dipendente e indipendente e non con quale intensità questa relazione sussiste. Quest’ultima informazione ti viene invece data dall’effect size letteralmente tradotto come grandezza dell’effetto: maggiore esso è, più forte sarà la relazione tra le due variabili. Una delle più importanti misure dell’effect size è fornito dal coefficiente di correlazione di Pearson r. Tale coefficiente varia da -1 (massima correlazione negativa) a 1 (massima correlazione positiva). Qui sotto un elenco che riporta la forza di correlazione in base al valore di r in valore assoluto:

  • Se 0 <= r <= 0.2 si ha una correlazione piccola/nulla.
  • Se 0.2 < r <= 0.4 si ha una correlazione bassa
  • Se 0.4 < r <= 0.6 si ha una correlazione buona
  • Se 0.6 < r <= 0.8 si ha una correlazione alta
  • Se 0.8 < r <= 1 si ha una correlazione molto alta

Inoltre, a differenza del p-value, il coefficiente di correlazione o, in generale, l’effect size, non è affetto dalla dimensione del campione e può essere usato per confrontare risultati ottenuti da studi condotti in maniera diversa (con settings diversi)

COMANDI SOFTWARE:

  • P-value EXCEL: Dipende dal comando usato
  • P-value SPSS: Sempre presente in qualsiasi statistica lo richieda

Riassumendo

  • Il p-value è un indicatore di significatività dei test statistici
  • Se p-value<=0.05 il test è significativo e si rifiuta l’ipotesi nulla H0; se p-value>0.05 non si rifiuta H0 perchè non c’è effettiva evidenza del contrario.
  • Un p-value piccolo non è abbastanza se non si considera l’effect size
  • L’effect size misura quanto è grande il legame tra una variabile endogena e una o più variabili esogene

I feel torn between asking questions that I know will lead to statistical significance and asking questions that matter.

(Uno scienziato americano)

Iscriviti alla Newsletter

Se hai bisogno d’informazioni che non hai trovato nella sezione servizi o dei video corsi, scrivimi un messaggio o chiamami.
Domande, prezzi, richieste, delucidazioni...tutto quello che ti serve. Cercherò di risponderti entro le 24h.

Consenso al trattamento dei dati
Utilizzerò i tuoi dati (nome ed indirizzo mail) solo per inviarti gratuitamente via mail la newsletter mensile. Niente spam, niente scocciature, ti disiscrivi in un click quando vuoi.

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram