Il test di Mann-Whitney è il test non parametrico che si usa al posto del t-test a campioni indipendenti quando non è soddisfatta la normalità nella distribuzione dei due campioni. Deve il suo nome allo statistico statunitense Donald Ransom Whitney e al suo collega Henry Berthold Mann.
Sebbene sia vero che il test t richiede come condizione che le popolazioni originarie seguano una distribuzione normale, all'aumentare della dimensione dei campioni, diventa meno sensibile al mancato rispetto di questa condizione. Per questo motivo, molto spesso, di fronte a campioni numerosi si assume vera l’ipotesi di normalità e si esegue il classico t-test.
In ambito lavorativo e di ricerca, invece, si è soliti utilizzare il test di Mann–Whitney quando l’ipotesi di normalità non è soddisfatta.
Tale test è anche noto come test della somma dei ranghi di Wilcoxon o test U di Mann-Whitney ed è, come detto, un test non parametrico che verifica se due campioni provengono da popolazioni equidistribuite.
L'idea su cui si basa questo test è la seguente: se i due campioni confrontati provengono dalla stessa popolazione, unendo tutte le osservazioni e ordinandole dal più piccolo al più grande, ci si aspetta che le osservazioni dell'uno e dell'altro campione siano intervallate casualmente. Al contrario, se uno dei campioni appartiene a una popolazione con valori superiori o inferiori rispetto all'altra, ordinando le osservazioni queste tenderanno a raggrupparsi in modo che quelli di un campione siano superiori a quelli dell'altro.
In accordo con l’idea espressa sopra, il test di Mann-Whitney verifica se la probabilità che un'osservazione della popolazione X superi un'osservazione della popolazione Y è uguale alla probabilità che un'osservazione della popolazione Y superi una della popolazione X. In altre parole, se i valori di una popolazione non tendono a essere maggiori di quelli di un'altra.
Dunque si può dire che l'ipotesi nulla e l'ipotesi alternativa sono le seguenti:
o analogamente:
Mentre il t-test a campioni indipendenti confronta sempre le medie dei due gruppi, il test di Mann-Whitney confronta altri indici di tendenza centrale: le mediane. Tuttavia, questo è vero solo quando le popolazioni confrontate differiscono solo per la loro posizione, ma il resto delle caratteristiche (dispersione, asimmetria...) sono le stesse.
Come con molti test non parametrici, il test di Mann–Whitney è meno potente del test t (è meno probabile che si rifiuti H0 quando è effettivamente falsa) poiché ignora gli outliers, cioè i valori anomali estremi, che si distanziano di molto rispetto agli altri valori che hai osservato.
Questa caratteristica, però, a sua volta rende il test di Mann–Whitney un test più robusto del test t. In particolare, la perdita di potenza è del 5%.
Se vuoi ripassare velocemente cos'è il t-test a campioni indipendenti, guarda questo mio video in cui te lo spiego in modo semplice e veloce attraverso una metafora statistica.
Per effettuare il test di Mann-Whitney è necessario che i tuoi dati e campioni siano conformi ad alcune condizioni:
Vediamo ora quali sono i passaggi che devi eseguire per calcolare manualmente il test di Mann-Whitney.
Come primo passo, è necessario che tutte le osservazioni vengano raggruppate, ordinate e assegnate a un numero di posizione, dove alla posizione 1 troveremo il valore più piccolo. Con questa operazione stai quindi creando una variabile chiamata rango.
Il secondo passaggio è calcolare la statistica U, che si trova seguendo questa formula:
U=min(U1,U2)
con:
dove:
A questo punto, devi scegliere un valore di ⍶ (di solito 0,05) e, considerando anche le numerosità campionarie n1 e n2, trovare il valore critico corrispondente nella tavola statistica di Mann-Whitney.
Arrivato a questo punto, devi prendere una decisione. Se la dimensione dei due campioni è inferiore a 10, allora rifiuti l'ipotesi nulla H0 se:
U > u⍶
affermando così che le differenze tra i due gruppi sono statisticamente significative.
Se la dimensione dei due campioni superiore a 10, però, il tuo lavoro non è finito e devi eseguire altri passaggi.
la cui formula è:
Per reperire tale valore devi semplicemente consultare la tavola della distribuzione normale.
Se hai qualche difficoltà a leggere la tavola della distribuzione normale standardizzata, ti lascio questa mia lezione gratuita in cui te lo spiego in modo semplice e veloce.
A questo punto, ti troverai nuovamente nella situazione di dover prendere una decisione. Dovrai rifiutare l'ipotesi nulla H0 se:
Z > z⍶
Non esiste un comando specifico ma bisogna installare PH STAT
Two-sample test (Unsummarized data) >>> Wilcoxon Rank Sum Test
Analizza >>> Test non parametrici >>> Finestre di dialogo precedenti >>> 2 campioni indipendenti
Se vuoi sapere quando usare i test non parametrici, ti consiglio di guardare questo il video di introduzione al capitolo 10 del mio videocorso su SPSS che trovi all'inizio dell'articolo.
Quanti statistici ci vogliono per cambiare una lampadina?
(Autore sconosciuto)
A) Il calcolo dovrebbe essere determinato mediante una procedura non-parametrica, dato che gli statistici non sono normali;
B) 1 più o meno 3 (campione di piccole dimensioni).