blog
Il test di Mann-Whitney è il test non parametrico che si usa al posto del t-test a campioni indipendenti quando non è soddisfatta la normalità nella distribuzione dei due campioni.
Deve il suo nome allo statistico statunitense Donald Ransom Whitney e al suo collega Henry Berthold Mann.
Sebbene sia vero che il test t a campioni indipendenti richiede come condizione che le popolazioni originarie seguano una distribuzione normale, all'aumentare della dimensione dei campioni, diventa meno sensibile al mancato rispetto di questa condizione.
Per questo motivo, molto spesso, di fronte a campioni numerosi si assume vera l’ipotesi di normalità e si esegue il classico t-test a campioni indipendenti.
In ambito lavorativo e di ricerca, invece, si è soliti utilizzare il test di Mann–Whitney quando l’ipotesi di normalità non è soddisfatta.
Tale test è anche noto come test della somma dei ranghi di Wilcoxon o test U di Mann-Whitney ed è, come detto, un test non parametrico che verifica se due campioni provengono da popolazioni equidistribuite.
L'idea su cui si basa questo test è la seguente: se i due campioni confrontati provengono dalla stessa popolazione, unendo tutte le osservazioni e ordinandole dal più piccolo al più grande, ci si aspetta che le osservazioni dell'uno e dell'altro campione siano intervallate casualmente.
Al contrario, se uno dei campioni appartiene a una popolazione con valori superiori o inferiori rispetto all'altra, ordinando le osservazioni queste tenderanno a raggrupparsi in modo che quelli di un campione siano superiori a quelli dell'altro.
In accordo con l’idea espressa sopra, il test di Mann-Whitney verifica se la probabilità che un'osservazione della popolazione X superi un'osservazione della popolazione Y è uguale alla probabilità che un'osservazione della popolazione Y superi una della popolazione X.
In altre parole, se i valori di una popolazione non tendono a essere maggiori di quelli di un'altra, si può dire che l'ipotesi nulla e l'ipotesi alternativa sono le seguenti:
o analogamente:
Mentre il t-test a campioni indipendenti confronta sempre le medie dei due gruppi, il test di Mann-Whitney confronta un altro indice di tendenza centrale: le mediane.
Tuttavia, questo è vero solo quando le popolazioni confrontate differiscono solo per la loro posizione, ma il resto delle caratteristiche (dispersione, asimmetria...) sono le stesse.
Come con molti test non parametrici, il test di Mann–Whitney è meno potente del test t a campioni indipendenti (è meno probabile che si rifiuti H0 quando è effettivamente falsa) poiché ignora gli outliers che si distanziano di molto rispetto agli altri valori che hai osservato.
Questa caratteristica, però, a sua volta rende il test di Mann–Whitney un test più robusto del test t. In particolare, la perdita di potenza è del 5%.
Se vuoi ripassare velocemente cos'è il t-test a campioni indipendenti, guarda questo mio video in cui te lo spiego in modo semplice e veloce attraverso una metafora statistica.
Per effettuare il test di Mann-Whitney è necessario che i tuoi dati e campioni siano conformi ad alcune condizioni:
Vediamo ora quali sono i passaggi che devi eseguire per calcolare manualmente il test di Mann-Whitney.
Come primo passo, è necessario che tutte le osservazioni vengano raggruppate, ordinate e assegnate a un numero di posizione, dove alla posizione 1 troveremo il valore più piccolo. Con questa operazione stai quindi creando una variabile chiamata rango.
Il secondo passaggio è calcolare la statistica U, che si trova seguendo questa formula:
U = min ( U1 ; U2)
con:
dove:
la cui formula è:
Per reperire tale valore devi semplicemente consultare la tavola della distribuzione normale.
Se hai qualche difficoltà a leggere la tavola della distribuzione normale standardizzata, ti lascio questa mia lezione gratuita in cui te lo spiego in modo semplice e veloce.
A questo punto, ti troverai nuovamente nella situazione di dover prendere una decisione. Dovrai rifiutare l'ipotesi nulla H0 se:
Z > z⍶
Due gruppi di 10 persone di diverse capacità hanno eseguito lo stesso lavoro impiegando i tempi in tabella. Si stabilisca con un livello di confidenza del 95% se c’è differenza tra i due gruppi utilizzando il test di Mann-Whitney.
Tabella dei dati:
\[
\begin{array}{|c|c|}
\hline
\textbf{Gruppo 1} & \textbf{Gruppo 2} \\
\hline
25 & 24 \\ 30 & 28 \\ 21 & 20 \\ 26 & 31 \\ 24 & 22 \\
22 & 23 \\ 27 & 21 \\ 29 & 28 \\ 22 & 21 \\ 24 & 23 \\
\hline
\end{array}
\]
Passo 1: Ordinamento dei dati
\[
\begin{array}{|c|c|}
\hline
\textbf{G1 Ordinato} & \textbf{G2 Ordinato} \\
\hline
21 & 20 \\ 22 & 21 \\ 22 & 21 \\ 24 & 22 \\ 24 & 23 \\
25 & 23 \\ 26 & 24 \\ 27 & 28 \\ 29 & 28 \\ 30 & 31 \\
\hline
\end{array}
\]
Passo 2: Assegnazione dei ranghi
\[
\begin{array}{|c|c|c|}
\hline
\textbf{Gruppo} & \textbf{Valore} & \textbf{Rank} \\
\hline
2 & 20 & 1 \\ 1 & 21 & 3 \\ 2 & 21 & 3 \\ 2 & 21 & 3 \\ 1 & 22 & 6 \\
1 & 22 & 6 \\ 2 & 22 & 6 \\ 2 & 23 & 8.5 \\ 2 & 23 & 8.5 \\ 1 & 24 & 11 \\
1 & 24 & 11 \\ 2 & 24 & 11 \\ 1 & 25 & 13 \\ 1 & 26 & 14 \\ 1 & 27 & 15 \\
2 & 28 & 16.5 \\ 2 & 28 & 16.5 \\ 1 & 29 & 18 \\ 1 & 30 & 19 \\ 2 & 31 & 20 \\
\hline
\end{array}
\]
Passo 3: Somma dei ranghi
\[
R_1 = 3 + 6 + 6 + 11 + 11 + 13 + 14 + 15 + 18 + 19 = 116
\]
\[
R_2 = 1 + 3 + 3 + 6 + 8.5 + 8.5 + 11 + 16.5 + 16.5 + 20 = 94
\]
Passo 4: Calcolo della statistica \( U \)
\[
U_1 = n_1 n_2 + \frac{n_1 (n_1 + 1)}{2} - R_1 = (10 \times 10) + \frac{10(10+1)}{2} - 116 = 39
\]
\[
U_2 = n_1 n_2 - U_1 = (10 \times 10) - 39 = 61
\]
\[
U = \min(39, 61) = 39
\]
Passo 5: Media e deviazione standard
\[
\mu_U = \frac{n_1 n_2}{2} = \frac{10 \times 10}{2} = 50
\]
\[
\sigma_U = \sqrt{\frac{n_1 n_2 (n_1 + n_2 + 1)}{12}} = \sqrt{\frac{10 \times 10 \times (10+10+1)}{12}} = 13.23
\]
Passo 6: Calcolo dello z-score
\[
z = \frac{U - \mu_U}{\sigma_U} = \frac{39 - 50}{13.23} = -0.832
\]
Passo 7: Calcolo del p-value
\[
p = 2 \times (1 - \Phi(|z|)) = 2 \times (1 - \Phi(0.832)) = 0.406
\]
Passo 8: Confronto con il livello di significatività
Poiché il p-value \( 0.406 \) è maggiore di \( 0.05 \), non possiamo rifiutare l'ipotesi nulla.
Conclusione: Non ci sono differenze statisticamente significative tra i due gruppi con un livello di confidenza del 95%.
Non esiste un comando specifico ma bisogna installare PH STAT
Two-sample test (Unsummarized data) >>> Wilcoxon Rank Sum Test
Analizza >>> Test non parametrici >>> Finestre di dialogo precedenti >>> 2 campioni indipendenti
Se vuoi sapere quando usare i test non parametrici, ti consiglio di guardare questo il video di introduzione al capitolo 10 del mio videocorso su SPSS che trovi all'inizio dell'articolo.
Quanti statistici ci vogliono per cambiare una lampadina?
(Autore sconosciuto)
A) Il calcolo dovrebbe essere determinato mediante una procedura non-parametrica, dato che gli statistici non sono normali;
B) 1 più o meno 3 (campione di piccole dimensioni).
Iscriviti alla Newsletter