Il test di Kruskal-Wallis (che deve il nome al suo inventore Allen Wallis) noto anche come test H, è l'alternativa non parametrica al test ANOVA unidirezionale per dati non accoppiati. È, inoltre, un'estensione del test di Mann-Whitney, poichè lo utilizzerai quando avrai più di due gruppi di variabili indipendenti (mentre una delle limitazione del test di Mann-Whitney è proprio che ci siano solamente due gruppi).
Si tratta, quindi, di un test non parametrico che utilizza gli intervalli per verificare l'ipotesi che k campioni siano stati ottenuti dalla stessa popolazione.
A differenza dell'ANOVA, in cui le medie vengono confrontate, il test di Kruskal-Wallis verifica se i diversi campioni sono equidistribuiti e quindi appartengono alla stessa distribuzione (cioè alla stessa popolazione). Con alcune semplificazioni, il test di Kruskal-Wallis può anche essere considerato per confrontare le mediane.
Il sistema di ipotesi del test di Kruskal-Wallis è il seguente:
Se vuoi ripassare velocemente che cos'è il test d'ipotesi, guarda questo mio video in cui te lo spiego in modo chiaro e semplice attraverso una metafora statistica.
Il test di Kruskal-Wallis è il test che devi utilizzare quando i tuoi dati hanno un ordine naturale, cioè quando devono essere ordinati per dare loro un senso, o quando non sono soddisfatte le condizioni per l'applicazione di un’ANOVA.
Ad esempio, se vuoi studiare la differenza tra uomini e donne in una gara, puoi avere due tipi di dati: i tempi di ogni partecipante (analisi ANOVA) o le posizioni in cui ogni partecipante ha terminato la gara (analisi ANOVA con il test di Kruskal-Wallis).
Supponiamo di avere k gruppi, ciascuno di essi con n osservazioni. Se tutte le osservazioni sono ordinate dal più basso al più alto e a ognuna di esse viene assegnato il proprio rango, quando si ottiene la somma dei ranghi per ciascuno dei gruppi (Ri), ci si aspetta che, se l'ipotesi nulla è soddisfatta, tutti i gruppi abbiano un valore simile. Partendo da questa idea, la statistica H è calcolata seguendo questa formula:
Il test di Kruskal-Wallis si può applicare solo sotto determinate ipotesi, che dovrai verificare prima di poterlo effettuare:
Se, dopo aver analizzato i tuoi campioni e gruppi, hai confermato di aver soddisfatto questi requisiti, allora puoi confrontare la statistica H del test di Kruskal-Wallis. Ci sono due diversi modi per eseguire il confronto, e la scelta di quale utilizzare dipende dalla dimensione dei gruppi k e dal numero di osservazioni presente in ciascuno.
Avrai quindi che:
Tuttavia si ritiene che l'ANOVA sia una tecnica abbastanza robusta anche in assenza di normalità, soprattutto con campioni medi o grandi. Per tale ragione, si raccomanda l'uso del test di Kruskal-Wallis solo quando le popolazioni da confrontare sono chiaramente asimmetriche tutte nella stessa direzione e quando la loro varianza è omogenea. Se la varianza non è omogenea, il test appropriato è un'ANOVA con correzione di Welch. Nei casi in cui abbiamo a che fare con dati puramente ordinali, l’ANOVA non può essere utilizzata.
Ho parlato delle assunzioni nel capitolo 9 del mio video corso su SPSS, di cui qui puoi vedere l'introduzione.
Esattamente come l’ANOVA, se il test di Kruskal-Wallis è significativo, si afferma che almeno due gruppi tra quelli confrontati sono significativamente diversi, ma non si sanno quali. Per scoprirlo, è necessario confrontarli tutti. Ciò implica l'esecuzione di una correzione del livello di significatività per evitare di aumentare l'errore di tipo I. I due metodi di confronto post-hoc più comunemente utilizzati per un test di Kruskal-Wallis sono:
Sappi che non esiste un modo generale per calcolare la dimensione dell'effetto di un test di Kruskal-Wallis, ossia la misura della relazione che sussiste tra due variabili. Di solito si calcola la dimensione dell'effetto sulle coppie che sono risultate significativamente diverse nell'analisi post-hoc. Se i confronti post-hoc vengono effettuati utilizzando il test di Mann-Whitney, allora si dovrà calcolare l'effetto associato a tale test.
Componente aggiuntivo PH STAT >>> Multiple-sample test >>> Kruskal-Wallis Rank Test
N.B. PH STAT è un componente aggiuntivo di Excel che puoi acquistare a circa 12€. Io lo trovo molto utile, soprattutto per quei test che non puoi fare con i comandi abituali di questo programma, come per esempio i test non parametrici e quindi anche il test di Kruskal-Wallis. Puoi scaricarlo seguendo le istruzioni qui.
Analizza >>> Test non parametrici >>> Finestre di dialogo precedenti >>> 2 campioni indipendenti
Se vuoi sapere quando usare i test non parametrici ti consiglio di guardare il video di introduzione al capitolo 10 del mio videocorso SPSS che trovi all'inizio dell'articolo.
Io sono il più grande, l’ho detto prima ancora di sapere che lo fossi.
(Muhammad Ali)