whatsapp
Adriano Gilardone
Adriano Gilardone
adriano gilardone Docente di Statistica Matematica Excel Spss sfruttare excel consulenze statistiche lezione videocorsi
blog

blog

Test di Mann-Whitney

Ultima modifica (26 Febbraio 2025)
YouTube video
Postato il 23 Febbraio 2022
Tag

Il test di Mann-Whitney è il test non parametrico che si usa al posto del t-test a campioni indipendenti quando non è soddisfatta la normalità nella distribuzione dei due campioni.

Deve il suo nome allo statistico statunitense Donald Ransom Whitney e al suo collega Henry Berthold Mann.

Sebbene sia vero che il test t a campioni indipendenti richiede come condizione che le popolazioni originarie seguano una distribuzione normale, all'aumentare della dimensione dei campioni, diventa meno sensibile al mancato rispetto di questa condizione.

Per questo motivo, molto spesso, di fronte a campioni numerosi si assume vera l’ipotesi di normalità e si esegue il classico t-test a campioni indipendenti.

corso spss

In ambito lavorativo e di ricerca, invece, si è soliti utilizzare il test di Mann–Whitney quando l’ipotesi di normalità non è soddisfatta.

Tale test è anche noto come test della somma dei ranghi di Wilcoxon o test U di Mann-Whitney ed è, come detto, un test non parametrico che verifica se due campioni provengono da popolazioni equidistribuite.

L'idea su cui si basa questo test è la seguente: se i due campioni confrontati provengono dalla stessa popolazione, unendo tutte le osservazioni e ordinandole dal più piccolo al più grande, ci si aspetta che le osservazioni dell'uno e dell'altro campione siano intervallate casualmente.

Al contrario, se uno dei campioni appartiene a una popolazione con valori superiori o inferiori rispetto all'altra, ordinando le osservazioni queste tenderanno a raggrupparsi in modo che quelli di un campione siano superiori a quelli dell'altro.

Le ipotesi del test di Mann-Whitney

In accordo con l’idea espressa sopra, il test di Mann-Whitney verifica se la probabilità che un'osservazione della popolazione X superi un'osservazione della popolazione Y è uguale alla probabilità che un'osservazione della popolazione Y superi una della popolazione X.

In altre parole, se i valori di una popolazione non tendono a essere maggiori di quelli di un'altra, si può dire che l'ipotesi nulla e l'ipotesi alternativa sono le seguenti:

  • Ipotesi nulla H0: P ( X > Y ) = P ( Y > X )
  • Ipotesi alternativa H1: P ( X > Y ) ≠ P ( Y > X )

o analogamente:

  • Ipotesi nulla H0: P ( X > Y ) = 0,5
  • Ipotesi alternativa H1: P ( X > Y ) ≠ 0,5

Test di Mann-Whitney vs T-test a campioni indipendenti

Mentre il t-test a campioni indipendenti confronta sempre le medie dei due gruppi, il test di Mann-Whitney confronta un altro indice di tendenza centrale: le mediane.

Tuttavia, questo è vero solo quando le popolazioni confrontate differiscono solo per la loro posizione, ma il resto delle caratteristiche (dispersione, asimmetria...) sono le stesse.

Come con molti test non parametrici, il test di Mann–Whitney è meno potente del test t a campioni indipendenti (è meno probabile che si rifiuti H0 quando è effettivamente falsa) poiché ignora gli outliers che si distanziano di molto rispetto agli altri valori che hai osservato.

Questa caratteristica, però, a sua volta rende il test di Mann–Whitney un test più robusto del test t. In particolare, la perdita di potenza è del 5%.

Se vuoi ripassare velocemente cos'è il t-test a campioni indipendenti, guarda questo mio video in cui te lo spiego in modo semplice e veloce attraverso una metafora statistica.

YouTube video
Il t-test a campioni indipendenti spiegato semplice con una metafora

Assunzioni del test di Mann-Whitney

Per effettuare il test di Mann-Whitney è necessario che i tuoi dati e campioni siano conformi ad alcune condizioni:

  • I due gruppi di dati devono essere reciprocamente indipendenti.
  • I dati devono essere almeno ordinali, cioè tali che si possono ordinare dal più piccolo al più grande.
  • Non è necessario presumere che i campioni siano distribuiti normalmente o che provengano da popolazioni normali, ma affinché il test confronti le mediane, entrambe devono avere lo stesso tipo di distribuzione (varianza, asimmetria...).
  • Ci deve essere uguaglianza della varianza tra i gruppi (cioè omoschedasticità).
analisi dati tesi

Come calcolare il test di Mann-Whitney

Vediamo ora quali sono i passaggi che devi eseguire per calcolare manualmente il test di Mann-Whitney.

Ordina le osservazioni

Come primo passo, è necessario che tutte le osservazioni vengano raggruppate, ordinate e assegnate a un numero di posizione, dove alla posizione 1 troveremo il valore più piccolo. Con questa operazione stai quindi creando una variabile chiamata rango.

Calcola la statistica U

Il secondo passaggio è calcolare la statistica U, che si trova seguendo questa formula:

U = min ( U1 ; U2)

con:

Mann-Whitney

dove:

  • n1 = numero di osservazioni del primo gruppo
  • n2 = numero di osservazioni del secondo gruppo
  • R1 = somma delle posizioni (ranghi) del primo gruppo
  • R2 = somma delle posizioni (ranghi) del secondo gruppo
corso spss

Calcola la statistica Z

la cui formula è:

test di Mann-Whitney

Trova il valore critico z

Per reperire tale valore devi semplicemente consultare la tavola della distribuzione normale.

tavola normale standardizzata

Se hai qualche difficoltà a leggere la tavola della distribuzione normale standardizzata, ti lascio questa mia lezione gratuita in cui te lo spiego in modo semplice e veloce.

YouTube video
Come leggere la tavola normale standardizzata

Confronta la statistica Z con z

A questo punto, ti troverai nuovamente nella situazione di dover prendere una decisione. Dovrai rifiutare l'ipotesi nulla H0 se:

Z > z

Esempio Test di Mann-Withney

Due gruppi di 10 persone di diverse capacità hanno eseguito lo stesso lavoro impiegando i tempi in tabella. Si stabilisca con un livello di confidenza del 95% se c’è differenza tra i due gruppi utilizzando il test di Mann-Whitney.

Tabella dei dati:

\[
\begin{array}{|c|c|}
\hline
\textbf{Gruppo 1} & \textbf{Gruppo 2} \\
\hline
25 & 24 \\ 30 & 28 \\ 21 & 20 \\ 26 & 31 \\ 24 & 22 \\
22 & 23 \\ 27 & 21 \\ 29 & 28 \\ 22 & 21 \\ 24 & 23 \\
\hline
\end{array}
\]


Passo 1: Ordinamento dei dati

\[
\begin{array}{|c|c|}
\hline
\textbf{G1 Ordinato} & \textbf{G2 Ordinato} \\
\hline
21 & 20 \\ 22 & 21 \\ 22 & 21 \\ 24 & 22 \\ 24 & 23 \\
25 & 23 \\ 26 & 24 \\ 27 & 28 \\ 29 & 28 \\ 30 & 31 \\
\hline
\end{array}
\]


Passo 2: Assegnazione dei ranghi

\[
\begin{array}{|c|c|c|}
\hline
\textbf{Gruppo} & \textbf{Valore} & \textbf{Rank} \\
\hline
2 & 20 & 1 \\ 1 & 21 & 3 \\ 2 & 21 & 3 \\ 2 & 21 & 3 \\ 1 & 22 & 6 \\
1 & 22 & 6 \\ 2 & 22 & 6 \\ 2 & 23 & 8.5 \\ 2 & 23 & 8.5 \\ 1 & 24 & 11 \\
1 & 24 & 11 \\ 2 & 24 & 11 \\ 1 & 25 & 13 \\ 1 & 26 & 14 \\ 1 & 27 & 15 \\
2 & 28 & 16.5 \\ 2 & 28 & 16.5 \\ 1 & 29 & 18 \\ 1 & 30 & 19 \\ 2 & 31 & 20 \\
\hline
\end{array}
\]


Passo 3: Somma dei ranghi

\[
R_1 = 3 + 6 + 6 + 11 + 11 + 13 + 14 + 15 + 18 + 19 = 116
\]

\[
R_2 = 1 + 3 + 3 + 6 + 8.5 + 8.5 + 11 + 16.5 + 16.5 + 20 = 94
\]


Passo 4: Calcolo della statistica \( U \)

\[
U_1 = n_1 n_2 + \frac{n_1 (n_1 + 1)}{2} - R_1 = (10 \times 10) + \frac{10(10+1)}{2} - 116 = 39
\]

\[
U_2 = n_1 n_2 - U_1 = (10 \times 10) - 39 = 61
\]

\[
U = \min(39, 61) = 39
\]


Passo 5: Media e deviazione standard

\[
\mu_U = \frac{n_1 n_2}{2} = \frac{10 \times 10}{2} = 50
\]

\[
\sigma_U = \sqrt{\frac{n_1 n_2 (n_1 + n_2 + 1)}{12}} = \sqrt{\frac{10 \times 10 \times (10+10+1)}{12}} = 13.23
\]


Passo 6: Calcolo dello z-score

\[
z = \frac{U - \mu_U}{\sigma_U} = \frac{39 - 50}{13.23} = -0.832
\]


Passo 7: Calcolo del p-value

\[
p = 2 \times (1 - \Phi(|z|)) = 2 \times (1 - \Phi(0.832)) = 0.406
\]


Passo 8: Confronto con il livello di significatività

Poiché il p-value \( 0.406 \) è maggiore di \( 0.05 \), non possiamo rifiutare l'ipotesi nulla.


Conclusione: Non ci sono differenze statisticamente significative tra i due gruppi con un livello di confidenza del 95%.

Test di Mann-Whitney EXCEL

Non esiste un comando specifico ma bisogna installare PH STAT

Two-sample test (Unsummarized data) >>> Wilcoxon Rank Sum Test

Test di Mann-Whitney SPSS

Analizza >>> Test non parametrici >>> Finestre di dialogo precedenti >>> 2 campioni indipendenti

Se vuoi sapere quando usare i test non parametrici, ti consiglio di guardare questo il video di introduzione al capitolo 10 del mio videocorso su SPSS che trovi all'inizio dell'articolo.

YouTube video

Riassumendo

  • Il test di Mann-Whitney è l’alternativa non parametrica al t-test a campioni indipendenti.
  • Il test di Mann-Whitney si utilizza quando i campioni da confrontare non presentano distribuzione normale.
  • I requisiti necessari per il test di Mann-Whitney sono l’indipendenza dei gruppi e l’omoschedasticità. Inoltre, bisogna avere dati ordinali.

Quanti statistici ci vogliono per cambiare una lampadina? 
A) Il calcolo dovrebbe essere determinato mediante una procedura non-parametrica, dato che gli statistici non sono normali; 
B) 1 più o meno 3 (campione di piccole dimensioni).

(Autore sconosciuto)

Iscriviti alla Newsletter

Se hai bisogno d’informazioni che non hai trovato nella sezione servizi o dei video corsi, scrivimi un messaggio o chiamami.
Domande, prezzi, richieste, delucidazioni...tutto quello che ti serve. Cercherò di risponderti entro le 24h.
Newsletter

Consenso al trattamento dei dati
Utilizzerò i tuoi dati (nome ed indirizzo mail) solo per inviarti gratuitamente via mail la newsletter mensile. Niente spam, niente scocciature, ti disiscrivi in un click quando vuoi.

arrow-up-circle
linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram