Il test di Mann-Whitney è il test non parametrico che si usa al posto del t-test a campioni indipendenti quando non è soddisfatta la normalità nella distribuzione dei due campioni.
Sebbene sia vero che il test t richiede come condizione che le popolazioni originarie seguano una distribuzione normale, all'aumentare della dimensione dei campioni, diventa meno sensibile al mancato rispetto di questa condizione. Per questo motivo, molto spesso, di fronte a campioni numerosi si assume vera l’ipotesi di normalità e si esegue il classico t-test.
In ambito lavorativo e di ricerca invece si è soliti utilizzare il test di Mann–Whitney quando l’ipotesi di normalità non è soddisfatta.
Tale test è anche noto come test della somma dei ranghi di Wilcoxon o test U di Mann-Whitney ed è, come detto, un test non parametrico che verifica se due campioni provengono da popolazioni equidistribuite.
L'idea su cui si basa questo test è la seguente: se i due campioni confrontati provengono dalla stessa popolazione, unendo tutte le osservazioni e ordinandole dal più piccolo al più grande, ci si aspetta che le osservazioni dell'uno e dell'altro campione siano intervallate casualmente. Al contrario, se uno dei campioni appartiene a una popolazione con valori superiori o inferiori all'altra popolazione, ordinando le osservazioni queste tenderanno a raggrupparsi in modo che quelli di un campione siano superiori a quelli dell'altro.
In accordo con l’idea espressa sopra, il test di Mann-Whitney verifica se la probabilità che un'osservazione della popolazione X superi un'osservazione della popolazione Y è uguale alla probabilità che un'osservazione della popolazione Y superi una della popolazione X. Cioè, i valori di una popolazione non tendono a essere maggiori di quelli di un'altra.
Dunque si può dire che le ipotesi nulla e alternativa sono le seguenti:
H0: P(X>Y) = P(Y>X)
H1: P(X>Y) ≠ P(Y>X)
o analogamente:
H0: P(X>Y) = 0,5
H1: P(X>Y) ≠ 0,5
Mentre il t-test a campioni indipendenti confronta sempre le medie dei due gruppi, il test di Mann-Whitney confronta altri indici di tendenza centrale: le mediane. Tuttavia, questo è vero solo quando le popolazioni confrontate differiscono solo per la loro posizione, ma il resto delle caratteristiche (dispersione, asimmetria...) sono le stesse.
Come con molti test non parametrici, il test di Mann–Whitney è meno potente del test t (è meno probabile che si rifiuti H0 quando è effettivamente falsa) poiché ignora i valori anomali. Questo a sua volta rende il test di Mann–Whitney un test più robusto del test t. In particolare, la perdita di potenza è del 5%.
Tutte le osservazioni vengono raggruppate, ordinate e assegnate a un numero di posizione. La posizione 1 è il valore più piccolo. Stai quindi creando una variabile chiamata rango.
U=min(U1,U2)
con
dove:
Devi scegliere un valore di ⍶ (di solito 0,05) e, considerando pure le numerosità campionarie n1 e n2 trova il valore critico corrispondente nella tavola statistica di Mann-Whitney.
Se la dimensione dei due campioni è inferiore a 10 rifiuti H0 se
U > u⍶
affermando che le differenze tra i due gruppi sono statisticamente significative.
Solo nel caso in cui n,n>10 esegui anche i seguenti passi.
Reperisci tale valore consultando la tavola della distribuzione normale.
Rifiuta H0 se
Z > z⍶
COMANDI SOFTWARE:
Componente aggiuntivo PH STAT >>> Two-sample test (Unsummarized data) >>> Wilcoxon Rank Sum Test
Quanti statistici ci vogliono per cambiare una lampadina?
A) Il calcolo dovrebbe essere determinato mediante una procedura non-parametrica, dato che gli statistici non sono NORMALI;
B) 1 piu' o meno 3 (campione di piccole dimensioni).
(Autore sconosciuto)