adriano gilardone Docente di Statistica Matematica Excel Spss sfruttare excel consulenze statistiche lezione videocorsi

blog

blog

Il test di Kruskal-Wallis

YouTube video
Postato il 23 Febbraio 2022
Tag

Il test di Kruskal-Wallis (che deve il nome al suo inventore Allen Wallis) noto anche come test H, è l'alternativa non parametrica al test ANOVA unidirezionale per dati non accoppiati. È, inoltre, un'estensione del test di Mann-Whitney, poichè lo utilizzerai quando avrai più di due gruppi di variabili indipendenti (mentre una delle limitazione del test di Mann-Whitney è proprio che ci siano solamente due gruppi).

corso spss

Si tratta, quindi, di un test non parametrico che utilizza gli intervalli per verificare l'ipotesi che k campioni siano stati ottenuti dalla stessa popolazione.

A differenza dell'ANOVA, in cui le medie vengono confrontate, il test di Kruskal-Wallis verifica se i diversi campioni sono equidistribuiti e quindi appartengono alla stessa distribuzione (cioè alla stessa popolazione). Con alcune semplificazioni, il test di Kruskal-Wallis può anche essere considerato per confrontare le mediane.

Ipotesi del test di Kruskal-Wallis

Il sistema di ipotesi del test di Kruskal-Wallis è il seguente:

  • Ipotesi nulla H0: Tutti i campioni provengono dalla stessa popolazione (distribuzione).
  • Ipotesi alternativa H1: Almeno un campione proviene da una popolazione con una distribuzione diversa.

Se vuoi ripassare velocemente che cos'è il test d'ipotesi, guarda questo mio video in cui te lo spiego in modo chiaro e semplice attraverso una metafora statistica.

YouTube video
Test d'ipotesi spiegato con una metafora statistica

Quando utilizzare il test di Kruskal-Wallis

Il test di Kruskal-Wallis è il test che devi utilizzare quando i tuoi dati hanno un ordine naturale, cioè quando devono essere ordinati per dare loro un senso, o quando non sono soddisfatte le condizioni per l'applicazione di un’ANOVA.

Ad esempio, se vuoi studiare la differenza tra uomini e donne in una gara, puoi avere due tipi di dati: i tempi di ogni partecipante (analisi ANOVA) o le posizioni in cui ogni partecipante ha terminato la gara (analisi ANOVA con il test di Kruskal-Wallis).

Come utilizzare il test di Kruskal-Wallis

Supponiamo di avere k gruppi, ciascuno di essi con n osservazioni. Se tutte le osservazioni sono ordinate dal più basso al più alto e a ognuna di esse viene assegnato il proprio rango, quando si ottiene la somma dei ranghi per ciascuno dei gruppi (Ri), ci si aspetta che, se l'ipotesi nulla è soddisfatta, tutti i gruppi abbiano un valore simile. Partendo da questa idea, la statistica H è calcolata seguendo questa formula:

test di kruskal-wallis

Le assunzioni del test di Kruskal-Wallis

Il test di Kruskal-Wallis si può applicare solo sotto determinate ipotesi, che dovrai verificare prima di poterlo effettuare:

  • I campioni confrontati non devono necessariamente provenire da una distribuzione normale
  • L'omoschedasticità: poiché l'ipotesi nulla presuppone che tutti i gruppi appartengano alla stessa popolazione e quindi abbiano le stesse mediane, è requisito necessario che tutti i gruppi abbiano la stessa varianza. Questa specifica caratteristica può essere verificata attraverso delle rappresentazioni grafiche o attraverso l'applicazione dei test di Levene o di Barttlet.
  • Stessa distribuzione per tutti i gruppi: la distribuzione dei gruppi non deve essere necessariamente normale, come abbiamo già visto, ma deve essere la stessa in tutti (ad esempio, che tutti mostrino asimmetria a destra)

Se, dopo aver analizzato i tuoi campioni e gruppi, hai confermato di aver soddisfatto questi requisiti, allora puoi confrontare la statistica H del test di Kruskal-Wallis. Ci sono due diversi modi per eseguire il confronto, e la scelta di quale utilizzare dipende dalla dimensione dei gruppi k e dal numero di osservazioni presente in ciascuno.

analisi dati tesi

Avrai quindi che:

  1. Se la dimensione dei gruppi k è uguale a 3 e il numero di osservazioni in ciascuno non è maggiore di 5, per confrontare la statistica H vengono utilizzate tabelle tabulate con valori teorici di H.
  2. In tutti gli altri casi, si assume semplicemente che la statistica H segua una distribuzione χ2 con k-1 gradi di libertà (dove k è il numero di gruppi da confrontare).

Tuttavia si ritiene che l'ANOVA sia una tecnica abbastanza robusta anche in assenza di normalità, soprattutto con campioni medi o grandi. Per tale ragione, si raccomanda l'uso del test di Kruskal-Wallis solo quando le popolazioni da confrontare sono chiaramente asimmetriche tutte nella stessa direzione e quando la loro varianza è omogenea. Se la varianza non è omogenea, il test appropriato è un'ANOVA con correzione di Welch. Nei casi in cui abbiamo a che fare con dati puramente ordinali, l’ANOVA non può essere utilizzata.

Ho parlato delle assunzioni nel capitolo 9 del mio video corso su SPSS, di cui qui puoi vedere l'introduzione.

YouTube video
Assunzioni del modello lineare su SPSS

Confronti post hoc

Esattamente come l’ANOVA, se il test di Kruskal-Wallis è significativo, si afferma che almeno due gruppi tra quelli confrontati sono significativamente diversi, ma non si sanno quali. Per scoprirlo, è necessario confrontarli tutti. Ciò implica l'esecuzione di una correzione del livello di significatività per evitare di aumentare l'errore di tipo I. I due metodi di confronto post-hoc più comunemente utilizzati per un test di Kruskal-Wallis sono:

  • Il test di Mann-Whitney tra ciascuna coppia di gruppi con correzione della significatività.
  • Il test dell'intervallo di Tukey
corso spss

Calcolo dell’effect size

Sappi che non esiste un modo generale per calcolare la dimensione dell'effetto di un test di Kruskal-Wallis, ossia la misura della relazione che sussiste tra due variabili. Di solito si calcola la dimensione dell'effetto sulle coppie che sono risultate significativamente diverse nell'analisi post-hoc. Se i confronti post-hoc vengono effettuati utilizzando il test di Mann-Whitney, allora si dovrà calcolare l'effetto associato a tale test.

Test di Kruskal-Wallis EXCEL

Componente aggiuntivo PH STAT >>> Multiple-sample test >>> Kruskal-Wallis Rank Test

N.B. PH STAT è un componente aggiuntivo di Excel che puoi acquistare a circa 12€. Io lo trovo molto utile, soprattutto per quei test che non puoi fare con i comandi abituali di questo programma, come per esempio i test non parametrici e quindi anche il test di Kruskal-Wallis. Puoi scaricarlo seguendo le istruzioni qui.

Test di Kruskal-Wallis SPSS

Analizza >>> Test non parametrici >>> Finestre di dialogo precedenti >>> 2 campioni indipendenti

Se vuoi sapere quando usare i test non parametrici ti consiglio di guardare il video di introduzione al capitolo 10 del mio videocorso SPSS che trovi all'inizio dell'articolo.

Riassumendo

  • Il test di Kruskal-Wallis è un test non parametrico che si utilizza in alternativa all’Anova a una via.
  • I requisiti necessari per eseguire il test di Kruskal-Wallis sono uguale simmetria della distribuzione dei campioni e omogeneità della varianza.
  • Se il test di Kruskal-Wallis è significativo si procede con l’analisi post hoc per capire quali gruppi differiscono.

Io sono il più grande, l’ho detto prima ancora di sapere che lo fossi.

(Muhammad Ali)

Ripetizioni private

Ho intrapreso una interessante collaborazione con il sito di TROVAPROF.IT

Questa start-up mette in relazione studenti che cercano lezioni private con professori di qualsiasi materia. Se stai cercano delle ripetizioni per le materie che non tratto io, allora ti consiglio di fare un salto su TROVAPROF.IT, un portale completamente gratuito per dare o ricevere lezioni private.

Iscriviti alla Newsletter

Se hai bisogno d’informazioni che non hai trovato nella sezione servizi o dei video corsi, scrivimi un messaggio o chiamami.
Domande, prezzi, richieste, delucidazioni...tutto quello che ti serve. Cercherò di risponderti entro le 24h.
Newsletter

Consenso al trattamento dei dati
Utilizzerò i tuoi dati (nome ed indirizzo mail) solo per inviarti gratuitamente via mail la newsletter mensile. Niente spam, niente scocciature, ti disiscrivi in un click quando vuoi.

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram