fbpx

T-test a campioni indipendenti. 2 gruppi per 1 sola statistica

Postato il 14 Febbraio 2022
Tag

Il t-test a campioni indipendenti, chiamato anche t-test dei due campioni, o test t di Student, è un test statistico inferenziale che determina se esiste una differenza significativa tra le medie di due gruppi non correlati. 

Nota la differenza con il t-test per campioni accoppiati in cui i due gruppi sono dipendenti o correlati.

Ipotesi del t-test a campioni indipendenti

Ipotesi nulla

L'ipotesi nulla afferma che le medie della popolazione dei due gruppi siano uguali:

H0: µ1 = µ2

o analogamente che la differenza tra le due medie sia nulla:

H0: µ1 - µ2 = 0

Ipotesi alternativa

Proprio come ti ho mostrato nel caso di un t-test a campioni accoppiati, si distinguono diversi tipi di test a seconda dell’ipotesi alternativa che si vuole sottoporre a verifica. In particolare:

1)Ipotesi alternativa bilaterale

H1: µ1 - µ2 ≠ 0

cioè la differenza tra le medie è diversa da zero

2)Ipotesi alternativa unilaterale destra

H1: µ1 - µ2 > 0

cioè la differenza tra le medie è maggiore di zero

3)Ipotesi alternativa unilaterale sinistra

H1: µ1 - µ2 < 0

cioè la differenza tra le medie è minore di zero

Cosa serve per un t-test a campioni indipendenti

Per eseguire questo test sono necessarie due variabili:

  • Una variabile categoriale indipendente con due livelli/gruppi.
  • Una variabile dipendente numerica continua.

Ad esempio, se si vuole verificare che la differenza di altezza tra un gruppo di maschi e uno di femmine, la variabile indipendente è il sesso mentre quella dipendente è rappresentata dalle altezze delle persone.

Perché i gruppi sono indipendenti

I gruppi non correlati, rappresentano le due categorie della variabile indipendente  in cui i casi (ad es. Partecipanti) sono differenti.

Spesso hai la necessità di esaminare le differenze negli individui, il che significa che quando si confrontano due gruppi, un individuo in un gruppo non può essere anche membro dell'altro e viceversa. 

Nell’esempio riportato sopra un individuo deve essere classificato o nel gruppo dei maschi o in quello delle femmine, ma non in entrambi.

Come si esegue il t-test a campioni indipendenti

Indicando con n1 e n2 rispettivamente le numerosità campionarie dei due gruppi, la procedura per un t-test a campioni indipendenti può essere riassunta in 6 passaggi. 

1)Calcola le medie dei due gruppi

Somma i valori della variabile continua e dividili per la numerosità del proprio gruppo. Tali medie le indico con x1 e x2

2)Calcola le deviazioni standard dei due gruppi

Queste le chiamo s1 e s2e sono rispettivamente la deviazione standard del primo e del secondo gruppo. Se non ricordi il calcolo della deviazione standard non ti preoccupare, ho scritto un articolo a riguardo.

3)Calcola i gradi di libertà

Usa la formula:

g.d.l = n1+n2-2

4)Calcola la varianza congiunta S2

Questa è una sorta di varianza pesata al cui denominatore compaiono i gradi di libertà calcolati nel punto precedente:

5)Calcola l’errore standard della stima SE

6)Calcola il valore della statistica T

Dividi la differenza delle medie per l’errore standard:

7)Trova il valore critico t𝛼/2 sulle tavole

Fissato un livello di significatività α, e n-1  gradi di libertà (gdl calcolati nel punto 3), consulta la tavola statistica della distribuzione t di Student per reperire il valore critico.

8)Prendi una decisione

Si confronta la statistica test calcolata nel punto 6) con il valore critico ottenuto nel punto 7) e in particolare:

  • Se |T|> t𝛼/2 allora il test è significativo e puoi rifiutare H0 dicendo che le due medie differiscono significativamente.
  • Se |T|> t𝛼/2 non puoi rifiutare H0 e concludi dicendo che non hai sufficienti prove per affermare che le due medie differiscano significativamente.

Alternativamente, per determinare l’esito del test puoi calcolare il p-value con il tuo software statistico preferito e dire che:

  • Se p-value < α il test è significativo e quindi rifiuti H0.
  • Se p-value > α Il test non è significativo e non puoi rifiutare H0.

In generale valori p più grandi di 0,05 rappresentano test non significativi.

Requisiti del t-test di Student

Il t-test a campioni indipendenti richiede che la variabile dipendente sia distribuita approssimativamente normalmente all'interno di ciascun gruppo e che le varianze dei due gruppi siano uguali.

1)Assunzione di normalità

Nota che tecnicamente, sono i residui che devono essere distribuiti normalmente, ma per un test t di Student, entrambi daranno lo stesso risultato.

Puoi verificare tale assunzione eseguendo una serie di test diversi o plottando un grafico. Tra i più comuni ci sono:

  1. Il test di normalità di Shapiro-Wilks
  2. Il grafico Q-Q plot

Il primo è il test di normalità più potente soprattutto nel caso di piccoli campioni. Si basa sulla verifica dell’ipotesi nulla che la variabile dipendente (da ora in poi la chiamo variabile osservata) provenga da una distribuzione normale. Pertanto, si potrà assumere vera l’ipotesi di normalità se il test non risulta significativo (p-value > 0,05).

Il secondo è la rappresentazione grafica dei quantili di una distribuzione. Questo grafico confronta la distribuzione cumulata della variabile osservata con la distribuzione cumulata della normale. Se la variabile osservata si distribuisce normalmente, i punti di questa distribuzione congiunta si addensano sulla diagonale che va dal basso verso l'alto e da sinistra verso destra come puoi vedere qui sotto.

Puoi eseguire questi test utilizzando il software statistico SPSS il cui comando lo trovi a fondo pagina. 

Tuttavia, il test t è descritto come un test robusto rispetto all'ipotesi di normalità. Ciò significa che qualche deviazione dalla normalità non ha una grande influenza sui tassi di errore di tipo I. L'eccezione è se il rapporto tra la dimensione del gruppo più piccola e quella più grande è maggiore di 1,5 (il più grande rispetto al più piccolo).

Cosa fare quando si viola l’ipotesi di normalità

Se scopri che uno o entrambi i dati del tuo gruppo non sono distribuiti approssimativamente normalmente e le dimensioni dei gruppi differiscono notevolmente, puoi eseguire il test U di Mann-Whitney che è un test non parametrico e che non richiede l'assunzione di normalità.

2)Assunzione di omogeneità delle varianze

Il test t a campioni indipendenti presuppone che le varianze dei due gruppi che stai misurando siano uguali nella popolazione. Se le tue varianze non sono uguali, ciò può influire sul tasso di errore di tipo I. L'ipotesi di omogeneità della varianza può essere verificata utilizzando il test di uguaglianza delle varianze di Levene.

Questo test fornisce una statistica F e un valore di significatività (valore p). A te interessa principalmente il valore di significatività: se è maggiore di 0,05 (cioè, p > 0,05), le varianze di gruppo possono essere trattate come uguali. Tuttavia, se p < 0,05, hai varianze disuguali e quindi hai violato l'ipotesi di omogeneità delle varianze.

Cosa fare quando si viola l’ipotesi di omogeneità delle varianze

Se il test di Levene per l'uguaglianza delle varianze è statisticamente significativo, il che indica che le varianze di gruppo non sono uguali nella popolazione, è possibile correggere questa violazione non utilizzando la stima aggregata per il termine di errore per la statistica t, ma utilizzando invece una adeguamento ai gradi di libertà con il metodo Welch-Satterthwaite. 

COMANDI SOFTWARE:

  • Test t a campioni indipendenti EXCEL: 

Scheda Dati >>> Analisi dati >>> Test t: due campioni assumendo uguale varianza

T-test a campioni indipendenti EXCEL
T-test a campioni indipendenti

Scheda Dati >>> Analisi dati >>> Test t: due campioni assumendo varianze diverse

  • Test t a campioni indipendenti SPSS: 

Analizza >>> Confronta medie >>> Test T: campioni indipendenti

Riassumendo

  • Il t-test a campioni indipendenti è utilizzato quando vuoi confrontare le medie tra due gruppi non correlati tra loro.
  • Richiede che siano soddisfatte le ipotesi di normalità e di omogeneità delle varianze.
  • Se l’assunzione di normalità non è soddisfatta si esegue il test non parametrico U di Mann-Whitney
  • se le varianze sono eterogenee si può usare l’equazione di Welch-Satterthwaite.

Le persone dipendenti hanno bisogno degli altri per ottenere quello che vogliono. Le persone indipendenti possono ottenere quello che vogliono attraverso i loro sforzi individuali. Le persone interdipendenti combinano i loro sforzi individuali con quelli degli altri per conseguire un successo più grande.

(Stephen Covey - Scrittore statunitense)

Iscriviti alla Newsletter

Se hai bisogno d’informazioni che non hai trovato nella sezione servizi o dei video corsi, scrivimi un messaggio o chiamami.
Domande, prezzi, richieste, delucidazioni...tutto quello che ti serve. Cercherò di risponderti entro le 24h.

Consenso al trattamento dei dati
Utilizzerò i tuoi dati (nome ed indirizzo mail) solo per inviarti gratuitamente via mail la newsletter mensile. Niente spam, niente scocciature, ti disiscrivi in un click quando vuoi.

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram