L'effect size quantifica l'importanza pratica dei risultati ottenuti da uno studio.
In questo articolo, esploreremo cos'è l'effect size, i diversi tipi esistenti, come si calcola e come interpretare correttamente i risultati ottenuti.
L'effect size è una misura statistica che quantifica la magnitudine di un effetto o una relazione tra variabili in uno studio.
A differenza del p-value, che indica solo se un effetto è statisticamente significativo, l'effect size fornisce informazioni sulla dimensione dell'effetto, permettendo di capire quanto sia rilevante dal punto di vista pratico.
Permette di confrontare direttamente i risultati di studi diversi, indipendentemente dalla dimensione del campione. Questo è fondamentale nelle meta-analisi, dove l'obiettivo è sintetizzare i risultati di molteplici studi per trarre conclusioni più robuste.
L'effect size è fondamentale per interpretare i risultati della ricerca, poiché aiuta a determinare se un effetto osservato è abbastanza grande da essere significativo nella realtà. Esistono diversi tipi di effect size, ognuno dei quali viene utilizzato in specifici contesti di analisi statistica.
Ogni tipo di effect size ha il suo contesto di applicazione e offre insight specifici sulle dimensioni e sull'importanza degli effetti osservati. Vediamo i principali.
L'indice V di Cramer è utile per misurare la forza dell'associazione tra due variabili categoriali in una tabella di contingenza.
Ad esempio, in uno studio sulla relazione tra il fumo e lo sviluppo di malattie cardiovascolari, si vuole valutare se esiste un'associazione tra queste due variabili.
Raccogliendo i dati, si crea una tabella di contingenza a doppia entrata che mostra la variabile fumatore incrociata con la variabile malattie cardiovascolari.
Dopo aver calcolato il valore del chi-quadro e il p-value per determinare se l'associazione è significativa (con un p-value minore del 5%), l'indice V di Cramer fornisce una misura dell'intensità di tale associazione, aiutando a comprendere quanto strettamente sono legate le due variabili.
I valori tipici dell'indice V di Cramer sono interpretati come segue:
Cohen's d è utile per misurare la dimensione dell'effetto quando si confrontano le medie di due gruppi per determinare quanto una media differisce dall'altra.
Ad esempio, in uno studio per migliorare i livelli di colesterolo nel sangue, vuoi valutare l'efficacia di un nuovo farmaco rispetto a un placebo.
Dopo aver somministrato il farmaco a un gruppo e il placebo a un altro, confronti le due medie e se il p-value è minore del 5% allora c'è una significativa differenza.
Dopodiché entra in gioco l'indice d di Cohen che fornisce una misura standardizzata della differenza tra queste medie, aiutando a comprendere quanto è grande tale differenza.
I valori tipici dell'indice D di Cohen sono interpretati come segue:
Eta Squared è utilizzato per quantificare la proporzione della varianza tra gruppi rispetto alla variabilità totale.
È applicato nell'analisi della varianza per determinare l'importanza relativa del fattore (o dei fattori) che contribuisce alla variabilità dei dati.
Ad esempio, se stai conducendo un'ANOVA per verificare l'effetto di diverse strategie di marketing sulle vendite mensili, utilizzi l'indice eta quadro per determinare quanto della varianza totale nelle vendite può essere spiegata dalla strategia di marketing utilizzata.
Valori tipici di η² sono interpretati come segue:
La correlazione di Pearson misura la forza e la direzione della relazione lineare tra due variabili quantitative.
Ad esempio, se stai esaminando la relazione tra ore di esercizio fisico settimanale e livello di stress in un gruppo di adulti, utilizzi r per determinare quanto fortemente le ore di esercizio siano correlate con il livello di stress.
Probabilmente troveresti un valore di r elevato, ma negativo, indicando una forte correlazione tra le due variabili dove l'esercizio fisico ha un impatto significativo nella riduzione del livello di stress.
Valori tipici di r sono interpretati come segue:
L'Odds Ratio (OR) è una misura di effect size utilizzata principalmente negli studi di coorte e nei casi di controllo per valutare l'associazione tra un'esposizione e un esito. OR confronta le probabilità che un determinato evento si verifichi nei gruppi esposti e non esposti.
Ad esempio, in uno studio epidemiologico che esamina l'associazione tra il fumo e lo sviluppo di una malattia polmonare, l'OR viene utilizzato per confrontare le probabilità che i fumatori sviluppino la malattia rispetto ai non fumatori.
Valori tipici di OR sono interpretati come segue:
Il Risk Ratio (RR), a differenza dell’odds ratio, viene utilizzato negli studi prospettici. In questo caso la popolazione viene suddivisa in soggetti esposti e non esposti, e si osserva nel tempo quanti soggetti sviluppano la malattia e quanti non la sviluppano.
Ad esempio, in uno studio clinico che valuta l'efficacia di un nuovo farmaco nel prevenire l'influenza, il RR viene utilizzato per confrontare il rischio che i pazienti che assumono il farmaco sviluppino l'influenza rispetto a quelli che non lo assumono.
Valori tipici di RR sono interpretati come segue:
L'effect size e il p-value sono due misure fondamentali ma servono a scopi diversi. Eppure, nei miei anni di esperienza come docente freelance di statistica ho notato che vengono spesso confusi da studenti e professionisti. Facciamo chiarezza.
Il p-value misura la significatività statistica di un risultato, ossia la probabilità che l'effetto osservato sia dovuto al caso. Un p-value inferiore a 0.05, ad esempio, indica che c'è meno del 5% di probabilità che i risultati siano dovuti al caso, suggerendo una relazione significativa tra le variabili studiate.
Guarda il video della metafora statistica sul p-value se vuoi approfondire.
L'effect size, invece, misura l'entità o la forza dell'effetto osservato. Mentre il p-value ci dice se un effetto esiste, l'effect size ci dice quanto è grande o importante quell'effetto. Ad esempio, un test può rilevare una differenza significativa tra due gruppi, ma l'effect size ci dirà se quella differenza è piccola, moderata o grande.
Riepilogo dei punti chiave sotto forma di bullet point: