whatsapp
Adriano Gilardone
Adriano Gilardone
adriano gilardone Docente di Statistica Matematica Excel Spss sfruttare excel consulenze statistiche lezione videocorsi
blog

blog

L'ABC dell'effect size: cosa è e come utilizzarlo

Ultima modifica (19 Marzo 2025)
Effect Size
Postato il 6 Gennaio 2025
Tag

L'effect size quantifica l'importanza pratica dei risultati ottenuti da uno studio. 

In questo articolo, esploreremo cos'è l'effect size, i diversi tipi esistenti, come si calcola e come interpretare correttamente i risultati ottenuti. 

corso statistica

Cos'è l'effect size?

L'effect size è una misura statistica che quantifica la magnitudine di un effetto o una relazione tra variabili in uno studio. 

A differenza del p-value, che indica solo se un effetto è statisticamente significativo, l'effect size fornisce informazioni sulla dimensione dell'effetto, permettendo di capire quanto sia rilevante dal punto di vista pratico. 

Confronta direttamente i risultati di studi diversi, indipendentemente dalla dimensione del campione. Questo è fondamentale nelle meta-analisi, dove l'obiettivo è sintetizzare i risultati di molteplici studi per trarre conclusioni più robuste.

L'effect size è fondamentale per interpretare i risultati della ricerca, poiché aiuta a determinare se un effetto osservato è abbastanza grande da essere significativo nella realtà.

Esistono diversi tipi di effect size, ognuno dei quali viene utilizzato in specifici contesti di analisi statistica.

Esempi effect size

A seconda della tecnica statistica utilizzata si avranno differenti effect size. Vediamone i principali.

Indice di Cramer (V)

YouTube video
Indice V di Cramer spiegato semplice con una metafora

L'indice V di Cramer è utile per misurare la forza dell'associazione tra due variabili categoriali in una tabella di contingenza.

Ad esempio, in uno studio sulla relazione tra il fumo e lo sviluppo di malattie cardiovascolari, si vuole valutare se esiste un'associazione tra queste due variabili.

Raccogliendo i dati, si crea una tabella di contingenza a doppia entrata che mostra la variabile fumatore incrociata con la variabile malattie cardiovascolari.

Dopo aver calcolato il valore del chi-quadro e il p-value per determinare se l'associazione è significativa (con un p-value minore del 5%), l'indice V di Cramer fornisce una misura dell'intensità di tale associazione.

I valori tipici dell'indice V di Cramer sono interpretati come segue:

  • 0.0 - 0.1: associazione molto debole
  • 0.1 - 0.3: associazione debole
  • 0.3 - 0.5: associazione moderata
  • > 0.5: associazione forte

Formula

\(\displaystyle
V = \sqrt{\frac{\chi^2 / N}{\min(k-1, r-1)}}
\)

Dove:

  • \(\chi^2\) è il valore del chi quadrato dalla tabella di contingenza.
  • \(N\) è il numero totale delle osservazioni.
  • \(k\) è il numero delle colonne nella tabella.
  • \(r\) è il numero delle righe nella tabella.

Indice di Cohen (D)

YouTube video
Indice D di Cohen spiegato semplice con una metafora

Cohen's d è utile per misurare la dimensione dell'effetto quando si confrontano le medie di due gruppi per determinare quanto una media differisce dall'altra.

Ad esempio, in uno studio per migliorare i livelli di colesterolo nel sangue, vuoi valutare l'efficacia di un nuovo farmaco rispetto a un placebo.

Dopo aver somministrato il farmaco a un gruppo e il placebo a un altro, confronti le due medie e se il p-value è minore del 5% allora c'è una significativa differenza.

Dopodiché entra in gioco l'indice d di Cohen che fornisce una misura standardizzata della differenza tra queste medie, aiutando a comprendere quanto è grande tale differenza.

I valori tipici dell'indice D di Cohen sono interpretati come segue:

  • 0.0 - 0.2: effetto piccolo
  • 0.2 - 0.5: effetto medio
  • 0.5 - 0.8: effetto grande
  • > 0.8: effetto grandissimo

Formula

\(\displaystyle
d = \frac{M_1 - M_2}{s}
\)

Dove:

  • \(M_1\) è la media del primo gruppo.
  • \(M_2\) è la media del secondo gruppo.
  • \(s\) è la deviazione standard combinata dei due gruppi.

Per calcolare la deviazione standard combinata \(s\), puoi usare questa formula:

\(\displaystyle
s = \sqrt{\frac{(n_1 - 1)s_1^2 + (n_2 - 1)s_2^2}{n_1 + n_2 - 2}}
\)

Dove:

  • \(s_1\) è la deviazione standard del primo gruppo.
  • \(s_2\) è la deviazione standard del secondo gruppo.
  • \(n_1\) è il numero di osservazioni nel primo gruppo.
  • \(n_2\) è il numero di osservazioni nel secondo gruppo.

Indice eta quadro (η²)

YouTube video
Anova a una via spiegata semplice con una metafora

L'eta quadro, o in inglese eta squared, è utilizzato per quantificare la proporzione della varianza tra gruppi rispetto alla variabilità totale.

È applicato nell'analisi della varianza per determinare l'importanza relativa del fattore (o dei fattori) che contribuisce alla variabilità dei dati.

Se stai conducendo un'ANOVA per testare l'effetto di diverse strategie di marketing sulle vendite, utilizzi l'indice eta quadro per determinare quanto della varianza totale nelle vendite può essere spiegata dalla strategia di marketing.

Valori tipici di η² sono interpretati come segue:

  • 0.0 - 0.1: Effetto piccolo
  • 0.1 - 0.3: Effetto medio
  • > 0.3: Effetto grande

Formula

\(\displaystyle
\eta^2 = \frac{SS_{\text{between}}}{SS_{\text{total}}}
\)

\(\displaystyle
SS_{\text{total}} = \sum_{i=1}^{N} (X_i - \bar{X})^2
\)

Dove:

  • \(N\) è il numero totale di osservazioni.
  • \(X_i\) è il valore individuale.
  • \(\bar{X}\) è la media generale di tutti i valori.

\(\displaystyle
SS_{\text{between}} = \sum_{j=1}^{k} n_j (\bar{X}_j - \bar{X})^2
\)

Dove:

  • \(k\) è il numero di gruppi.
  • \(n_j\) è il numero di osservazioni nel gruppo \(j\).
  • \(\bar{X}_j\) è la media del gruppo \(j\).
  • \(\bar{X}\) è la media generale di tutti i valori.
corso statistica

Indice di correlazione lineare (R)

YouTube video
L'indice di correlazione di Pearson spiegato semplice con una metafora

La correlazione di Pearson misura la forza e la direzione della relazione lineare tra due variabili quantitative. 

Ad esempio, se stai esaminando la relazione tra ore di esercizio fisico settimanale e livello di stress in un gruppo di adulti, utilizzi R per determinare quanto fortemente le ore di esercizio siano correlate con il livello di stress.

Probabilmente troveresti un valore di R elevato, ma negativo, indicando una forte correlazione tra le due variabili dove l'esercizio fisico ha un impatto significativo nella riduzione del livello di stress.

Valori tipici di R sono interpretati come segue:

  • 0.0 - 0.2: Correlazione piccola
  • 0.2 - 0.4: Correlazione bassa
  • 0.4 - 0.6: Correlazione regolare
  • 0.6 - 0.8: Correlazione alta
  • 0.8 - 1.0: Correlazione altissima

Formula

\(\displaystyle
r = \frac{\text{Cov}(X,Y)}{\sigma_X \sigma_Y}
\)

Dove:

  • \(\text{Cov}(X,Y)\) è la covarianza tra le variabili \(X\) e \(Y\).
  • \(\sigma_X\) è la deviazione standard della variabile \(X\).
  • \(\sigma_Y\) è la deviazione standard della variabile \(Y\).

La covarianza \(\text{Cov}(X,Y)\) può essere calcolata con la seguente formula:

\(\displaystyle
\text{Cov}(X,Y) = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{n}
\)

Dove:

  • \(x_i\) e \(y_i\) sono i singoli valori delle variabili \(X\) e \(Y\).
  • \(\bar{x}\) e \(\bar{y}\) sono le medie delle variabili \(X\) e \(Y\).
  • \(n\) è il numero di coppie di dati.

Le deviazioni standard \(\sigma_X\) e \(\sigma_Y\) sono calcolate come:

\(\displaystyle
\sigma_X = \sqrt{\frac{\sum (x_i - \bar{x})^2}{n}}
\)

\(\displaystyle
\sigma_Y = \sqrt{\frac{\sum (y_i - \bar{y})^2}{n}}
\)

Odds Ratio (OR)

YouTube video
Odds ratio spiegati semplice con una metafora

L'Odds Ratio (OR) è una misura di effect size utilizzata principalmente negli studi di coorte e nei casi di controllo per valutare l'associazione tra un'esposizione e un esito.

OR confronta le probabilità che un determinato evento si verifichi nei gruppi esposti e non esposti.

Ad esempio, in uno studio epidemiologico che esamina l'associazione tra il fumo e lo sviluppo di una malattia polmonare, l'OR viene utilizzato per confrontare le probabilità che i fumatori sviluppino la malattia rispetto ai non fumatori.

Valori tipici di OR sono interpretati come segue:

  • OR = 1: non c'è alcuna associazione tra l'esposizione e l'esito. Le probabilità dell'evento sono uguali nei gruppi esposti e non esposti.
  • OR > 1: c'è un'associazione positiva tra l'esposizione e l'esito. Le probabilità dell'evento sono maggiori nei gruppi esposti. 
  • OR < 1: c'è un'associazione negativa tra l'esposizione e l'esito. Le probabilità dell'evento sono minori nei gruppi esposti. 

Formula

\(\displaystyle
OR = \frac{(a/c)}{(b/d)} = \frac{a \cdot d}{b \cdot c}
\)

Dove:

  • \( a \) è il numero di casi con esposizione presente.
  • \( b \) è il numero di controlli con esposizione presente.
  • \( c \) è il numero di casi con esposizione assente.
  • \( d \) è il numero di controlli con esposizione assente.
Effect size

Rischio Relativo (RR)

Il Risk Ratio (RR), a differenza dell’odds ratio, viene utilizzato negli studi prospettici. In questo caso la popolazione viene suddivisa in soggetti esposti e non esposti, e si osserva nel tempo quanti soggetti sviluppano la malattia e quanti non la sviluppano. 

Ad esempio, in uno studio clinico che valuta l'efficacia di un nuovo farmaco nel prevenire l'influenza, il RR viene utilizzato per confrontare il rischio che i pazienti che assumono il farmaco sviluppino l'influenza rispetto a quelli che non lo assumono.

Valori tipici di RR sono interpretati come segue:

  • RR = 1: non c'è alcuna differenza nel rischio dell'evento tra i gruppi esposti e non esposti. Il rischio dell'evento è lo stesso in entrambi i gruppi.
  • RR > 1: c'è un aumento del rischio dell'evento nel gruppo esposto rispetto al gruppo non esposto.
  • RR < 1: c'è una diminuzione del rischio dell'evento nel gruppo esposto rispetto al gruppo non esposto.

Formula

\(\displaystyle
RR = \frac{a / (a+b)}{c / (c+d)}
\)

Dove:

  • \( a \) è il numero di casi con esposizione presente.
  • \( b \) è il numero di non-casi con esposizione presente.
  • \( c \) è il numero di casi con esposizione assente.
  • \( d \) è il numero di non-casi con esposizione assente.
Effect size

Effect size e p-value: le differenze

L'effect size e il p-value sono due misure fondamentali ma servono a scopi diversi. Eppure, nei miei anni di esperienza come docente freelance di statistica ho notato che vengono spesso confusi da studenti e professionisti. Facciamo chiarezza.

Il p-value misura la significatività statistica di un risultato, ossia la probabilità che l'effetto osservato sia dovuto al caso.

Un p-value inferiore a 0.05, ad esempio, indica che c'è meno del 5% di probabilità che i risultati siano dovuti al caso, suggerendo una relazione significativa tra le variabili studiate.

YouTube video
P-value spiegato semplice con una metafora

L'effect size, invece, misura l'entità o la forza dell'effetto osservato. Mentre il p-value ci dice se un effetto esiste, l'effect size ci dice quanto è grande o importante quell'effetto.

Ad esempio, un test può rilevare una differenza significativa tra due gruppi, ma l'effect size ci dirà se quella differenza è piccola, moderata o grande.

Riassumendo

Riepilogo dei punti chiave sotto forma di bullet point:

  • L'effect size quantifica l'importanza pratica dei risultati ottenuti da uno studio.
  • È una misura statistica che fornisce informazioni sulla dimensione dell'effetto, permettendo di capire quanto sia rilevante dal punto di vista pratico.
  • Esistono diversi tipi di effect size, tra cui Cohen's d, r (correlazione), eta squared (η²), Cohen's f², Odds Ratio (OR) e Risk Ratio (RR).
  • Mentre il p-value indica se un effetto è statisticamente significativo, l'effect size indica quanto è grande o importante quell'effetto.

Iscriviti alla Newsletter

Se hai bisogno d’informazioni che non hai trovato nella sezione servizi o dei video corsi, scrivimi un messaggio o chiamami.
Domande, prezzi, richieste, delucidazioni...tutto quello che ti serve. Cercherò di risponderti entro le 24h.
Newsletter

Consenso al trattamento dei dati
Utilizzerò i tuoi dati (nome ed indirizzo mail) solo per inviarti gratuitamente via mail la newsletter mensile. Niente spam, niente scocciature, ti disiscrivi in un click quando vuoi.

arrow-up-circle
linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram