Il t-test a campioni indipendenti, chiamato anche t-test dei due campioni, o test t di Student, è un test statistico inferenziale che determina se esiste una differenza significativa tra le medie di due gruppi non correlati.
Se non sai come capire se due campioni sono dipendenti o indipendenti, ti consiglio di consultare anche il mio altro articolo, che parla invece del t-test per campioni accoppiati, in cui i due gruppi sono dipendenti o correlati.
All'interno di un t-test a campioni indipendenti troverai due diverse tipologie di ipotesi: l'ipotesi nulla e l'ipotesi alternativa.
L'ipotesi nulla afferma che le medie della popolazione dei due gruppi siano uguali:
H0: µ1 = µ2
o analogamente che la differenza tra le due medie sia nulla:
H0: µ1 - µ2 = 0
Proprio come ti ho mostrato nel caso di un t-test a campioni accoppiati, si distinguono diversi tipi di test a seconda dell’ipotesi alternativa che si vuole sottoporre a verifica. In particolare:
H1: µ1 - µ2 ≠ 0
cioè la differenza tra le medie è diversa da zero.
H1: µ1 - µ2 > 0
cioè la differenza tra le medie è maggiore di zero.
H1: µ1 - µ2 < 0
cioè la differenza tra le medie è minore di zero.
Per eseguire un t-test a campioni indipendenti sono necessarie due variabili:
Ad esempio, se si vuole verificare che la differenza di altezza tra un gruppo di maschi e uno di femmine sia diversa da zero, la variabile indipendente sarà il sesso mentre quella dipendente sarà rappresentata dalle diverse altezze delle singole persone.
Ma perchè i gruppi sono indipendenti? I gruppi devono essere indipendenti perchè i gruppi non correlati rappresentano le due categorie della variabile indipendente in cui i casi (per esempio le persone) sono differenti.
Spesso potrai avere la necessità di esaminare le differenze presenti tra gli individui, e di conseguenza quando si confrontano due gruppi, un individuo in un gruppo non potrà essere anche membro dell'altro, e viceversa.
Proviamo a ripensare all'esempio che abbiamo citato precedentemente: per essere parte dell'analisi, un individuo deve essere classificato o nel gruppo dei maschi o in quello delle femmine, ma non potrà essere parte di entrambi.
Indicando con n1 e n2 rispettivamente le numerosità campionarie dei due gruppi, la procedura per un t-test a campioni indipendenti può essere riassunta in 6 passaggi.
Come primo passaggio devi sommare i valori della variabile numerica e dividerli per la numerosità del proprio gruppo. Tali medie le indico con x1 e x2.
A questo punto, chiamerò s1 e s2 rispettivamente la deviazione standard del primo e del secondo gruppo. Se non ricordi come si effettua il calcolo della deviazione standard consulta il mio articolo, dove potrai trovare elencati i vari passaggi da seguire.
Per calcolare i gradi di libertà usa la formula:
g.d.l = n1+n2-2
Questa è una sorta di varianza pesata, al cui denominatore compaiono i gradi di libertà calcolati nel punto precedente:
A questo punto, fai la radice quadrata della moltiplicazione tra la varianza congiunta e la quantità (1 / n1 + 1 / n2).
Dividi adesso la differenza delle medie per l’errore standard:
Fissato un livello di significatività α, e n-1 gradi di libertà (calcolati nel punto 3), adesso devi consultare la tavola statistica della distribuzione t di Student per reperire il valore critico (come ti dicevo in apertura, il test t di Student è un altro modo di chiamare il t-test a campioni indipendenti).
L'ultimi passaggio da seguire per effettuare un t-test a campioni indipendenti è confrontare la statistica test calcolata nel punto 6) con il valore critico ottenuto nel punto 7), per capire se il t-test è significativo. In particolare potrai quindi avere due situazioni:
Alternativamente, per determinare l’esito del test puoi calcolare il p-value con il tuo software statistico preferito e dire che:
In generale valori p più grandi di 0,05 rappresentano test non significativi.
Se non ricordi nel dettaglio cosa sia il p-value, ti lascio questo mio video in cui te lo spiego in modo chiaro e semplice utilizzando una metafora statistica.
Il t-test a campioni indipendenti richiede che la variabile dipendente sia distribuita approssimativamente normalmente all'interno di ciascun gruppo e che le varianze dei due gruppi siano uguali.
Nota che, tecnicamente, sono i residui che devono essere distribuiti normalmente, ma per un test t di Student entrambi daranno lo stesso risultato.
Puoi verificare tale assunzione eseguendo una serie di test diversi o plottando un grafico. Tra i più comuni ci sono:
Il primo è il test di normalità più potente soprattutto nel caso di piccoli campioni. Si basa sulla verifica dell’ipotesi nulla che la variabile dipendente (da ora in poi la chiamo variabile osservata) provenga da una distribuzione normale. Pertanto, si potrà assumere vera l’ipotesi di normalità se il test non risulta significativo (p-value > 0,05).
Il secondo è la rappresentazione grafica dei quantili di una distribuzione. Questo grafico confronta la distribuzione cumulata della variabile osservata con la distribuzione cumulata della normale. Se la variabile osservata si distribuisce normalmente, i punti di questa distribuzione congiunta si addensano sulla diagonale che va dal basso verso l'alto e da sinistra verso destra. Nel grafico sotto ti mostro un esempio di come viene violata l'assunzione di normalità in quanto i pallini verdi non si distribuiscono sulla bisettrice.
Puoi eseguire questi test utilizzando il software statistico SPSS, di cui trovi il comando a fondo pagina.
Tuttavia, il test t è descritto come un test robusto rispetto all'ipotesi di normalità. Ciò significa che qualche deviazione dalla normalità non ha una grande influenza sui tassi di errore di tipo I. L'eccezione è se il rapporto tra la dimensione del gruppo più piccola e quella più grande è maggiore di 1,5 (il più grande rispetto al più piccolo).
Se scopri che uno o entrambi i dati del tuo gruppo non sono distribuiti approssimativamente normalmente e le dimensioni dei gruppi differiscono notevolmente, puoi eseguire il test U di Mann-Whitney, che è un test non parametrico e che non richiede l'assunzione di normalità.
Il t-test a campioni indipendenti presuppone che le varianze dei due gruppi che stai misurando siano uguali nella popolazione. Se le tue varianze non sono uguali, ciò può influire sul tasso di errore di tipo I. L'ipotesi di omogeneità della varianza può essere verificata utilizzando il test di uguaglianza delle varianze di Levene.
Questo test fornisce una statistica F e un valore di significatività (p-value). A te interessa principalmente il valore di significatività: se è maggiore di 0,05 (cioè, p > 0,05), le varianze di gruppo possono essere trattate come uguali. Tuttavia, se p < 0,05, hai varianze disuguali e quindi hai violato l'ipotesi di omogeneità delle varianze.
Se il test di Levene per l'uguaglianza delle varianze è statisticamente significativo, il che indica che le varianze di gruppo non sono uguali nella popolazione, è possibile correggere questa violazione non utilizzando la stima aggregata per il termine di errore per la statistica t, ma utilizzando invece una adeguamento ai gradi di libertà con il metodo Welch-Satterthwaite.
Se hai ancora qualche dubbio sul t-test a campioni indipendenti, guarda il video iniziale in cui te lo spiego in modo semplice e veloce utilizzando una metafora statistica.
Scheda Dati >>> Analisi dati >>> Test t: due campioni assumendo uguale varianza
Scheda Dati >>> Analisi dati >>> Test t: due campioni assumendo varianze diverse
Analizza >>> Confronta medie >>> Test T: campioni indipendenti
Se vuoi approfondire la tua conoscenza su SPSS del t-test a campioni indipendenti e di altri test t, ti lascio questo breve video di presentazione del capitolo 5 del mio corso.
Le persone dipendenti hanno bisogno degli altri per ottenere quello che vogliono. Le persone indipendenti possono ottenere quello che vogliono attraverso i loro sforzi individuali. Le persone interdipendenti combinano i loro sforzi individuali con quelli degli altri per conseguire un successo più grande.
(Stephen Covey - Scrittore statunitense)