
blog

Il test di Kruskal-Wallis (che deve il nome al suo inventore Allen Wallis) noto anche come test H, è l'alternativa non parametrica all'Anova a una via.
È un'estensione del test di Mann-Whitney, poiché lo utilizzerai quando avrai più di due gruppi all'interno di una variabile indipendente qualitativa, mentre una delle limitazione del test di Mann-Whitney è il fatto di poterlo usare solo con variabili dicotomiche.
Si tratta, quindi, di un test non parametrico che utilizza gli intervalli per verificare l'ipotesi che k campioni siano stati ottenuti dalla stessa popolazione.
A differenza dell'ANOVA, in cui si confrontano le medie dei gruppi, il test di Kruskal-Wallis verifica se i diversi campioni sono equidistribuiti e quindi appartengono alla stessa distribuzione, cioè alla stessa popolazione.
Con alcune semplificazioni, il test di Kruskal-Wallis può anche essere considerato per confrontare le mediane.
Il sistema di ipotesi del test di Kruskal-Wallis è il seguente:
Se vuoi ripassare velocemente che cos'è il test d'ipotesi, guarda questo mio video in cui te lo spiego in modo chiaro e semplice attraverso una metafora statistica.
Il test di Kruskal-Wallis si usa in alternativa all'ANOVA quando non sono soddisfatte le assunzioni. I dati della variabile dipendente quantitativa devono essere ordinati per dare loro un senso.
Per semplificare e farti capire meglio, se vuoi studiare la differenza tra uomini e donne in una gara, puoi avere due tipi di dati:
I tempi di ogni partecipante, in cui puoi fare il test ANOVA o le posizioni in cui ogni partecipante ha terminato la gara, in cui puoi eseguire il test di Kruskal-Wallis.
Il test di Kruskal-Wallis si può applicare sotto determinate ipotesi, che dovrai verificare prima di poterlo effettuare.
I campioni confrontati non devono necessariamente provenire da una distribuzione normale
Poiché l'ipotesi nulla presuppone che tutti i gruppi appartengano alla stessa popolazione e quindi abbiano le stesse mediane, è requisito necessario che tutti i gruppi abbiano la stessa varianza.
Questa specifica caratteristica può essere verificata attraverso delle rappresentazioni grafiche o attraverso l'applicazione dei test di Levene o di Barttlet.
La distribuzione dei gruppi non deve essere necessariamente normale, come abbiamo già detto, ma deve essere la stessa in tutti, ad esempio, che tutti mostrino asimmetria a destra.
Se, dopo aver analizzato i tuoi campioni e gruppi, hai confermato di aver soddisfatto questi requisiti, allora puoi confrontare la statistica H del test di Kruskal-Wallis.
Ho parlato delle assunzioni nel capitolo 9 del mio video corso su SPSS, di cui qui puoi vedere l'introduzione.
Ci sono due diversi modi per eseguire il confronto, e la scelta di quale utilizzare dipende dalla dimensione dei gruppi k e dal numero di osservazioni presente in ciascuno.
Se la dimensione dei gruppi k è uguale a 3 e il numero di osservazioni in ciascuno non è maggiore di 5, per confrontare la statistica H vengono utilizzate tabelle tabulate con valori teorici di H.
In tutti gli altri casi, si assume semplicemente che la statistica H segua una distribuzione chi-quadro χ2 con k-1 gradi di libertà, dove k è il numero di gruppi da confrontare.
Tuttavia si ritiene che l'ANOVA sia una tecnica abbastanza robusta anche in assenza di normalità, soprattutto con campioni medi o grandi.
Per tale ragione, si raccomanda l'uso del test di Kruskal-Wallis solo quando le popolazioni da confrontare sono chiaramente asimmetriche tutte nella stessa direzione e quando la loro varianza è omogenea.
Se la varianza non è omogenea, il test appropriato è un'ANOVA con correzione di Welch. Nei casi in cui abbiamo a che fare con dati puramente ordinali, l’ANOVA non può essere utilizzata.
Detto questo ti espongo un esempio di calcolo supponendo di avere k gruppi, ciascuno di essi con n osservazioni.
Se tutte le osservazioni sono ordinate dal più basso al più alto e a ognuna di esse viene assegnato il proprio rango, quando si ottiene la somma dei ranghi per ciascuno dei gruppi (Ri), ci si aspetta che, se l'ipotesi nulla è soddisfatta, tutti i gruppi abbiano un valore simile.
Partendo da questa idea, la statistica H è calcolata seguendo questa formula:

Un'azienda farmaceutica sta testando tre diversi trattamenti per il dolore muscolare e vuole confrontare l'efficacia dei tre gruppi in base al livello di riduzione del dolore riportato dai pazienti.
Tabella dei dati:
\[
\begin{array}{|c|c|c|}
\hline
\textbf{G1} & \textbf{G2} & \textbf{G3} \\
\hline
20 & 50 & 15 \\
23 & 50 & 26 \\
50 & 23 & 23 \\
12 & 15 & 49 \\
20 & 16 & 12 \\
29 & 10 & 39 \\
16 & 36 & 37 \\
45 & 14 & 15 \\
26 & 50 & 50 \\
42 & 44 & \\
38 & & \\
20 & & \\
\hline
\end{array}
\]
Passo 1: Ordinamento dei dati
\[
\begin{array}{|c|c|c|}
\hline
\textbf{G1} & \textbf{G2} & \textbf{G3} \\
\hline
12 & 10 & 12 \\
16 & 14 & 15 \\
20 & 15 & 15 \\
20 & 16 & 23 \\
20 & 23 & 26 \\
23 & 36 & 37 \\
26 & 44 & 39 \\
29 & 50 & 49 \\
38 & 50 & \\
42 & 50 & \\
45 & & \\
50 & & \\
\hline
\end{array}
\]
Passo 2: Assegnazione dei ranghi
\[
\begin{array}{|c|c|c|}
\hline
\textbf{Gruppo} & \textbf{Valore} & \textbf{Rango} \\
\hline
G2 & 10 & 1 \\
G1 & 12 & 2.5 \\
G3 & 12 & 2.5 \\
G2 & 14 & 4 \\
G2 & 15 & 6 \\
G3 & 15 & 6 \\
G3 & 15 & 6 \\
G1 & 16 & 8.5 \\
G2 & 16 & 8.5 \\
G1 & 20 & 11 \\
G1 & 20 & 11 \\
G1 & 20 & 11 \\
G1 & 23 & 14 \\
G2 & 23 & 14 \\
G3 & 23 & 14 \\
G1 & 26 & 16.5 \\
G3 & 26 & 16.5 \\
G1 & 29 & 18 \\
G2 & 36 & 19 \\
G3 & 37 & 20 \\
G1 & 38 & 21 \\
G3 & 39 & 22 \\
G1 & 42 & 23 \\
G2 & 44 & 24 \\
G1 & 45 & 25 \\
G3 & 49 & 26 \\
G1 & 50 & 28.5 \\
G2 & 50 & 28.5 \\
G2 & 50 & 28.5 \\
G2 & 50 & 28.5 \\
\hline
\end{array}
\]
Passo 3: Calcolo della somma e della media dei ranghi
\[
\begin{array}{|c|c|c|}
\hline
N & \text{Somma Rk} & \text{Media Rk} \\
\hline
12 & 190 & 15.83 \\
10 & 162 & 16.20 \\
8 & 113 & 14.13 \\
\hline
\end{array}
\]
Passo 4: Calcolo della statistica di Kruskal-Wallis
La formula del test è:
\[
H = \frac{12}{N(N+1)} \sum \frac{R_i^2}{n_i} - 3(N+1)
\]
Sostituendo i valori:
\[
H = \frac{12}{30 \cdot 31} \left( \frac{190^2}{12} + \frac{162^2}{10} + \frac{113^2}{8} \right) - 3 \cdot 31
\]
\[
H = 0.27559
\]
Confronto con il valore critico
Il valore critico per \( k-1 = 2 \) gradi di libertà e \( \alpha = 0.05 \) è:
\[
\chi^2_{0.05,2} = 5.991
\]
Poiché:
\[
H = 0.276 \ll 5.991
\]
non possiamo rifiutare \( H_0 \).
Conclusione
Il p-value calcolato è:
\[
p = 0.871
\]
Poiché il p-value è molto alto \( (p > 0.05) \), non ci sono differenze significative tra i gruppi, quindi non abbiamo prove sufficienti per affermare che almeno un gruppo differisca dagli altri.
Esattamente come l’ANOVA, se il test di Kruskal-Wallis è significativo, si afferma che almeno due gruppi tra quelli confrontati sono significativamente diversi, ma non si sanno quali.
Per scoprirlo, è necessario confrontarli tutti. Ciò implica l'esecuzione di una correzione del livello di significatività per evitare di aumentare l'errore di tipo I. I due metodi di confronto post-hoc più comunemente utilizzati per un test di Kruskal-Wallis sono:
Sappi che non esiste un modo generale per calcolare la dimensione dell'effetto di un test di Kruskal-Wallis, ossia la misura della relazione che sussiste tra due variabili.
Di solito si calcola la dimensione dell'effetto sulle coppie che sono risultate significativamente diverse nell'analisi post-hoc. Se i confronti post-hoc vengono effettuati utilizzando il test di Mann-Whitney, allora si dovrà calcolare l'effetto associato a tale test.
Componente aggiuntivo PH STAT >>> Multiple-sample test >>> Kruskal-Wallis Rank Test
N.B. PH STAT è un componente aggiuntivo di Excel che puoi acquistare a circa 12€. Io lo trovo molto utile, soprattutto per quei test che non puoi fare con i comandi abituali di questo programma, come per esempio i test non parametrici e quindi anche il test di Kruskal-Wallis. Puoi scaricarlo seguendo le istruzioni qui.
Analizza >>> Test non parametrici >>> Finestre di dialogo precedenti >>> 2 campioni indipendenti
Se vuoi sapere quando usare i test non parametrici ti consiglio di guardare il video di introduzione al capitolo 10 del mio videocorso SPSS che trovi all'inizio dell'articolo.
Io sono il più grande, l’ho detto prima ancora di sapere che lo fossi.
(Muhammad Ali)
Iscriviti alla Newsletter