whatsapp
Adriano Gilardone
Adriano Gilardone
adriano gilardone Docente di Statistica Matematica Excel Spss sfruttare excel consulenze statistiche lezione videocorsi
blog

blog

Test di Kruskal-Wallis

Ultima modifica (26 Febbraio 2025)
YouTube video
Postato il 23 Febbraio 2022
Tag

Il test di Kruskal-Wallis (che deve il nome al suo inventore Allen Wallis) noto anche come test H, è l'alternativa non parametrica all'Anova a una via.

È un'estensione del test di Mann-Whitney, poiché lo utilizzerai quando avrai più di due gruppi all'interno di una variabile indipendente qualitativa, mentre una delle limitazione del test di Mann-Whitney è il fatto di poterlo usare solo con variabili dicotomiche.

corso spss

Si tratta, quindi, di un test non parametrico che utilizza gli intervalli per verificare l'ipotesi che k campioni siano stati ottenuti dalla stessa popolazione.

A differenza dell'ANOVA, in cui si confrontano le medie dei gruppi, il test di Kruskal-Wallis verifica se i diversi campioni sono equidistribuiti e quindi appartengono alla stessa distribuzione, cioè alla stessa popolazione.

Con alcune semplificazioni, il test di Kruskal-Wallis può anche essere considerato per confrontare le mediane.

Ipotesi del test di Kruskal-Wallis

Il sistema di ipotesi del test di Kruskal-Wallis è il seguente:

  • Ipotesi nulla H0: Tutti i campioni provengono dalla stessa popolazione (distribuzione).
  • Ipotesi alternativa H1: Almeno un campione proviene da una popolazione con una distribuzione diversa.

Se vuoi ripassare velocemente che cos'è il test d'ipotesi, guarda questo mio video in cui te lo spiego in modo chiaro e semplice attraverso una metafora statistica.

YouTube video
Test d'ipotesi spiegato semplice con una metafora statistica

Quando utilizzare il test di Kruskal-Wallis

Il test di Kruskal-Wallis si usa in alternativa all'ANOVA quando non sono soddisfatte le assunzioni. I dati della variabile dipendente quantitativa devono essere ordinati per dare loro un senso.

Per semplificare e farti capire meglio, se vuoi studiare la differenza tra uomini e donne in una gara, puoi avere due tipi di dati:

I tempi di ogni partecipante, in cui puoi fare il test ANOVA o le posizioni in cui ogni partecipante ha terminato la gara, in cui puoi eseguire il test di Kruskal-Wallis.

YouTube video
L'ANOVA a una via spiegata semplice con una metafora statistica

Le assunzioni del test di Kruskal-Wallis

Il test di Kruskal-Wallis si può applicare sotto determinate ipotesi, che dovrai verificare prima di poterlo effettuare.

Assunzione di normalitá

I campioni confrontati non devono necessariamente provenire da una distribuzione normale

Assunzione di omoschedasticità

Poiché l'ipotesi nulla presuppone che tutti i gruppi appartengano alla stessa popolazione e quindi abbiano le stesse mediane, è requisito necessario che tutti i gruppi abbiano la stessa varianza.

Questa specifica caratteristica può essere verificata attraverso delle rappresentazioni grafiche o attraverso l'applicazione dei test di Levene o di Barttlet.

Assunzione di distribuzione

La distribuzione dei gruppi non deve essere necessariamente normale, come abbiamo già detto, ma deve essere la stessa in tutti, ad esempio, che tutti mostrino asimmetria a destra.

Se, dopo aver analizzato i tuoi campioni e gruppi, hai confermato di aver soddisfatto questi requisiti, allora puoi confrontare la statistica H del test di Kruskal-Wallis.

analisi dati tesi

Ho parlato delle assunzioni nel capitolo 9 del mio video corso su SPSS, di cui qui puoi vedere l'introduzione.

YouTube video
Assunzioni del modello lineare su SPSS

Come calcolare il test di Kruskal-Wallis

Ci sono due diversi modi per eseguire il confronto, e la scelta di quale utilizzare dipende dalla dimensione dei gruppi k e dal numero di osservazioni presente in ciascuno.

Se la dimensione dei gruppi k è uguale a 3 e il numero di osservazioni in ciascuno non è maggiore di 5, per confrontare la statistica H vengono utilizzate tabelle tabulate con valori teorici di H.

In tutti gli altri casi, si assume semplicemente che la statistica H segua una distribuzione chi-quadro χ2 con k-1 gradi di libertà, dove k è il numero di gruppi da confrontare.

Tuttavia si ritiene che l'ANOVA sia una tecnica abbastanza robusta anche in assenza di normalità, soprattutto con campioni medi o grandi.

Per tale ragione, si raccomanda l'uso del test di Kruskal-Wallis solo quando le popolazioni da confrontare sono chiaramente asimmetriche tutte nella stessa direzione e quando la loro varianza è omogenea.

Se la varianza non è omogenea, il test appropriato è un'ANOVA con correzione di Welch. Nei casi in cui abbiamo a che fare con dati puramente ordinali, l’ANOVA non può essere utilizzata.

Detto questo ti espongo un esempio di calcolo supponendo di avere k gruppi, ciascuno di essi con n osservazioni.

Se tutte le osservazioni sono ordinate dal più basso al più alto e a ognuna di esse viene assegnato il proprio rango, quando si ottiene la somma dei ranghi per ciascuno dei gruppi (Ri), ci si aspetta che, se l'ipotesi nulla è soddisfatta, tutti i gruppi abbiano un valore simile.

Partendo da questa idea, la statistica H è calcolata seguendo questa formula:

Test di Kruskal-Wallis

Esempio test di Kruskal-Wallis

Un'azienda farmaceutica sta testando tre diversi trattamenti per il dolore muscolare e vuole confrontare l'efficacia dei tre gruppi in base al livello di riduzione del dolore riportato dai pazienti.

Tabella dei dati:

\[
\begin{array}{|c|c|c|}
\hline
\textbf{G1} & \textbf{G2} & \textbf{G3} \\
\hline
20 & 50 & 15 \\
23 & 50 & 26 \\
50 & 23 & 23 \\
12 & 15 & 49 \\
20 & 16 & 12 \\
29 & 10 & 39 \\
16 & 36 & 37 \\
45 & 14 & 15 \\
26 & 50 & 50 \\
42 & 44 & \\
38 & & \\
20 & & \\
\hline
\end{array}
\]


Passo 1: Ordinamento dei dati

\[
\begin{array}{|c|c|c|}
\hline
\textbf{G1} & \textbf{G2} & \textbf{G3} \\
\hline
12 & 10 & 12 \\
16 & 14 & 15 \\
20 & 15 & 15 \\
20 & 16 & 23 \\
20 & 23 & 26 \\
23 & 36 & 37 \\
26 & 44 & 39 \\
29 & 50 & 49 \\
38 & 50 & \\
42 & 50 & \\
45 & & \\
50 & & \\
\hline
\end{array}
\]


Passo 2: Assegnazione dei ranghi

\[
\begin{array}{|c|c|c|}
\hline
\textbf{Gruppo} & \textbf{Valore} & \textbf{Rango} \\
\hline
G2 & 10 & 1 \\
G1 & 12 & 2.5 \\
G3 & 12 & 2.5 \\
G2 & 14 & 4 \\
G2 & 15 & 6 \\
G3 & 15 & 6 \\
G3 & 15 & 6 \\
G1 & 16 & 8.5 \\
G2 & 16 & 8.5 \\
G1 & 20 & 11 \\
G1 & 20 & 11 \\
G1 & 20 & 11 \\
G1 & 23 & 14 \\
G2 & 23 & 14 \\
G3 & 23 & 14 \\
G1 & 26 & 16.5 \\
G3 & 26 & 16.5 \\
G1 & 29 & 18 \\
G2 & 36 & 19 \\
G3 & 37 & 20 \\
G1 & 38 & 21 \\
G3 & 39 & 22 \\
G1 & 42 & 23 \\
G2 & 44 & 24 \\
G1 & 45 & 25 \\
G3 & 49 & 26 \\
G1 & 50 & 28.5 \\
G2 & 50 & 28.5 \\
G2 & 50 & 28.5 \\
G2 & 50 & 28.5 \\
\hline
\end{array}
\]


Passo 3: Calcolo della somma e della media dei ranghi

\[
\begin{array}{|c|c|c|}
\hline
N & \text{Somma Rk} & \text{Media Rk} \\
\hline
12 & 190 & 15.83 \\
10 & 162 & 16.20 \\
8 & 113 & 14.13 \\
\hline
\end{array}
\]


Passo 4: Calcolo della statistica di Kruskal-Wallis

La formula del test è:

\[
H = \frac{12}{N(N+1)} \sum \frac{R_i^2}{n_i} - 3(N+1)
\]

Sostituendo i valori:

\[
H = \frac{12}{30 \cdot 31} \left( \frac{190^2}{12} + \frac{162^2}{10} + \frac{113^2}{8} \right) - 3 \cdot 31
\]

\[
H = 0.27559
\]


Confronto con il valore critico

Il valore critico per \( k-1 = 2 \) gradi di libertà e \( \alpha = 0.05 \) è:

\[
\chi^2_{0.05,2} = 5.991
\]

Poiché:

\[
H = 0.276 \ll 5.991
\]

non possiamo rifiutare \( H_0 \).


Conclusione

Il p-value calcolato è:

\[
p = 0.871
\]

Poiché il p-value è molto alto \( (p > 0.05) \), non ci sono differenze significative tra i gruppi, quindi non abbiamo prove sufficienti per affermare che almeno un gruppo differisca dagli altri.

Confronti post hoc

Esattamente come l’ANOVA, se il test di Kruskal-Wallis è significativo, si afferma che almeno due gruppi tra quelli confrontati sono significativamente diversi, ma non si sanno quali.

Per scoprirlo, è necessario confrontarli tutti. Ciò implica l'esecuzione di una correzione del livello di significatività per evitare di aumentare l'errore di tipo I. I due metodi di confronto post-hoc più comunemente utilizzati per un test di Kruskal-Wallis sono:

  • Il test di Mann-Whitney tra ciascuna coppia di gruppi con correzione della significatività.
  • Il test dell'intervallo di Tukey
YouTube video
I test post-hoc spiegati semplice con una metafora statistica

Calcolo dell’effect size

Sappi che non esiste un modo generale per calcolare la dimensione dell'effetto di un test di Kruskal-Wallis, ossia la misura della relazione che sussiste tra due variabili.

Di solito si calcola la dimensione dell'effetto sulle coppie che sono risultate significativamente diverse nell'analisi post-hoc. Se i confronti post-hoc vengono effettuati utilizzando il test di Mann-Whitney, allora si dovrà calcolare l'effetto associato a tale test.

corso spss

Test di Kruskal-Wallis EXCEL

Componente aggiuntivo PH STAT >>> Multiple-sample test >>> Kruskal-Wallis Rank Test

N.B. PH STAT è un componente aggiuntivo di Excel che puoi acquistare a circa 12€. Io lo trovo molto utile, soprattutto per quei test che non puoi fare con i comandi abituali di questo programma, come per esempio i test non parametrici e quindi anche il test di Kruskal-Wallis. Puoi scaricarlo seguendo le istruzioni qui.

Test di Kruskal-Wallis SPSS

Analizza >>> Test non parametrici >>> Finestre di dialogo precedenti >>> 2 campioni indipendenti

Se vuoi sapere quando usare i test non parametrici ti consiglio di guardare il video di introduzione al capitolo 10 del mio videocorso SPSS che trovi all'inizio dell'articolo.

Riassumendo

  • Il test di Kruskal-Wallis è un test non parametrico che si utilizza in alternativa all’Anova a una via.
  • I requisiti necessari per eseguire il test di Kruskal-Wallis sono uguale simmetria della distribuzione dei campioni e omogeneità della varianza.
  • Se il test di Kruskal-Wallis è significativo si procede con l’analisi post hoc per capire quali gruppi differiscono.

Io sono il più grande, l’ho detto prima ancora di sapere che lo fossi.

(Muhammad Ali)

Iscriviti alla Newsletter

Se hai bisogno d’informazioni che non hai trovato nella sezione servizi o dei video corsi, scrivimi un messaggio o chiamami.
Domande, prezzi, richieste, delucidazioni...tutto quello che ti serve. Cercherò di risponderti entro le 24h.
Newsletter

Consenso al trattamento dei dati
Utilizzerò i tuoi dati (nome ed indirizzo mail) solo per inviarti gratuitamente via mail la newsletter mensile. Niente spam, niente scocciature, ti disiscrivi in un click quando vuoi.

arrow-up-circle
linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram