whatsapp
Adriano Gilardone
Adriano Gilardone
adriano gilardone Docente di Statistica Matematica Excel Spss sfruttare excel consulenze statistiche lezione videocorsi
blog

blog

T-test a campioni indipendenti: 2 gruppi

Ultima modifica (6 Aprile 2025)
YouTube video
Postato il 14 Febbraio 2022
Tag

Il t-test a campioni indipendenti, o test t di Student per campioni indipendenti, è un test statistico inferenziale che determina se esiste una differenza significativa tra le medie di due gruppi non correlati. 

Se non sai come capire se due campioni sono dipendenti o indipendenti, ti consiglio di consultare anche l'altro mio articolo, che parla invece del t-test per campioni accoppiati, in cui i due gruppi sono dipendenti o correlati.

corso spss

Ipotesi del t-test a campioni indipendenti

All'interno di un t-test a campioni indipendenti troverai due diverse tipologie di ipotesi: l'ipotesi nulla e l'ipotesi alternativa.

L'ipotesi nulla

L'ipotesi nulla afferma che le medie della popolazione dei due gruppi siano uguali:

H0: µ1 = µ2

o analogamente che la differenza tra le due medie sia nulla:

H0: µ1 - µ2 = 0

L'ipotesi alternativa

Proprio come ti ho mostrato nel caso di un t-test a campioni accoppiati, si distinguono diversi tipi di test a seconda dell’ipotesi alternativa che si vuole sottoporre a verifica. In particolare:

Ipotesi alternativa bilaterale

H1: µ1 - µ2 ≠ 0

cioè la differenza tra le medie è diversa da zero.

Ipotesi alternativa unilaterale destra

H1: µ1 - µ2 > 0

cioè la differenza tra le medie è maggiore di zero.

Ipotesi alternativa unilaterale sinistra

H1: µ1 - µ2 < 0

cioè la differenza tra le medie è minore di zero.

Cosa serve per un t-test a campioni indipendenti

Per eseguire un t-test a campioni indipendenti sono necessarie due variabili:

Una variabile qualitativa (nominale o ordinale) indipendente con due modalità. In questo caso la variabile si dice dicotomica. Esempi sono i fenomeni che hanno come modalità SI/No, Vero/Falso, Maschio/Femmina, Italia/Estero...

Una variabile quantitativa (discreta o continua) dipendente.

Ad esempio, se si vuole verificare che la differenza di altezza tra un gruppo di maschi e uno di femmine sia diversa da zero, la variabile indipendente sarà il sesso mentre quella dipendente sarà rappresentata dalle diverse altezze delle singole persone.

Se hai dubbi sulla classificazione delle scale di modalità guardati questa lezione tratta dai miei video corsi di statistica

YouTube video

I gruppi indipendenti

Ma perchè i gruppi sono indipendenti? I gruppi devono essere indipendenti perchè i gruppi non correlati rappresentano le due categorie della variabile indipendente in cui i casi (per esempio le persone) sono differenti.

Spesso potrai avere la necessità di esaminare le differenze presenti tra gli individui, e di conseguenza quando si confrontano due gruppi, un individuo in un gruppo non potrà essere anche membro dell'altro, e viceversa. 

Proviamo a ripensare all'esempio che abbiamo citato precedentemente: per essere parte dell'analisi, un individuo deve essere classificato o nel gruppo dei maschi o in quello delle femmine, ma non potrà essere parte di entrambi.

corso spss

t-test a campioni indipendenti con varianze uguali

Indicando con n1 e n2 rispettivamente le numerosità campionarie dei due gruppi, la procedura per un t-test a campioni indipendenti può essere riassunta in 6 passaggi. 

Calcola le medie dei due gruppi

Come primo passaggio devi sommare i valori della variabile numerica e dividerli per la numerosità del proprio gruppo. Tali medie le indico con x1 e x2.

Calcola le deviazioni standard dei due gruppi

A questo punto, chiamerò s1 e s2 rispettivamente la deviazione standard del primo e del secondo gruppo. Se non ricordi come si effettua il calcolo della deviazione standard consulta il mio articolo, dove potrai trovare elencati i vari passaggi da seguire.

Calcola i gradi di libertà

Per calcolare i gradi di libertà usa la formula:

g.d.l = n1 + n2 - 2

Calcola la varianza congiunta Sp2

Questa è una sorta di varianza pesata, al cui denominatore compaiono i gradi di libertà calcolati nel punto precedente:

Varianza pooled

Calcola l’errore standard della stima SE

A questo punto, fai la radice quadrata della moltiplicazione tra la varianza congiunta e la quantità (1 / n1 + 1 / n2).

errore standard

Calcola il valore della statistica T

Dividi adesso la differenza delle medie per l’errore standard:

t-test a campioni indipendenti

Trova il valore critico t𝛼/2 sulle tavole

Fissato un livello di significatività α, e n-1  gradi di libertà (calcolati nel punto 3), adesso devi consultare la tavola statistica della distribuzione t di Student per reperire il valore critico (come ti dicevo in apertura, il test t di Student è un altro modo di chiamare il t-test a campioni indipendenti).

Tavola t-student
Tavola t-student

Accettare o Rifiutare H0

L'ultimi passaggio da seguire per effettuare un t-test a campioni indipendenti è confrontare la statistica test calcolata nel punto 6) con il valore critico ottenuto nel punto 7), per capire se il t-test è significativo. In particolare potrai quindi avere due situazioni:

Se | T | > t𝛼/2 allora il test è significativo e puoi rifiutare H0, dicendo che le due medie differiscono significativamente.

Se | T | > t𝛼/2 non puoi rifiutare H0, e concludi dicendo che non hai sufficienti prove per affermare che le due medie differiscano significativamente.

Alternativamente, per determinare l’esito del test puoi calcolare il p-value con il tuo software statistico preferito e dire che:

Se p-value < α il test è significativo e quindi rifiuti H0.

Se p-value > α Il test non è significativo e non puoi rifiutare H0.

In generale valori p più grandi di 0,05 rappresentano test non significativi.

Se non ricordi nel dettaglio cosa sia il p-value, ti lascio questo mio video in cui te lo spiego in modo chiaro e semplice utilizzando una metafora statistica.

YouTube video
Il p-value spiegato semplice con una metafora

Esempio t-test a campioni indipendenti con varianze uguali

Due gruppi di 10 persone di diverse capacità hanno eseguito lo stesso lavoro impiegando i tempi in tabella. Si stabilisca con un livello di confidenza del 95% se c’è differenza tra i due gruppi.

N.B: SUPPONIAMO CHE LE VARIANZE SIANO UGUALI

Tabella dei dati:

\[
\begin{array}{|c|c|}
\hline
\textbf{Gruppo 1} & \textbf{Gruppo 2} \\
\hline
25 & 24 \\
30 & 28 \\
21 & 20 \\
26 & 31 \\
24 & 22 \\
22 & 23 \\
27 & 21 \\
29 & 28 \\
22 & 21 \\
24 & 23 \\
\hline
\end{array}
\]


Passo 1: Calcolo delle statistiche descrittive

\[
\bar{X}_1 = \frac{25 + 30 + 21 + 26 + 24 + 22 + 27 + 29 + 22 + 24}{10} = 25.0
\]

\[
\bar{X}_2 = \frac{24 + 28 + 20 + 31 + 22 + 23 + 21 + 28 + 21 + 23}{10} = 24.1
\]


Passo 2: Calcolo delle varianze

Varianze non corrette (divise per \( n \)):

\[
s_{nc,1}^2 = \frac{\sum (X_i - \bar{X}_1)^2}{n_1} = 8.2
\]

\[
s_{nc,2}^2 = \frac{\sum (X_i - \bar{X}_2)^2}{n_2} = 12.09
\]

Varianze corrette (divise per \( n-1 \)):

\[
s_1^2 = \frac{\sum (X_i - \bar{X}_1)^2}{n_1 - 1} = 9.11
\]

\[
s_2^2 = \frac{\sum (X_i - \bar{X}_2)^2}{n_2 - 1} = 13.43
\]


Passo 3: Calcolo della varianza congiunta

\[
s_p^2 = \frac{(n_1 - 1) s_1^2 + (n_2 - 1) s_2^2}{n_1 + n_2 - 2} = \frac{(10 - 1) \cdot 9.11 + (10 - 1) \cdot 13.43}{10 + 10 - 2} = 11.27
\]


Passo 4: Calcolo dello standard error

\[
SE = \sqrt{s_p^2 \left( \frac{1}{n_1} + \frac{1}{n_2} \right)} = \sqrt{11.27 \left( \frac{1}{10} + \frac{1}{10} \right)} = 1.501
\]


Passo 5: Calcolo del test t

\[
t = \frac{\bar{X}_1 - \bar{X}_2}{SE} = \frac{25.0 - 24.1}{1.501} = 0.599
\]

\[
df = n_1 + n_2 - 2 = 10 + 10 - 2 = 18
\]


Passo 6: Confronto con il valore critico

\[
t_{critico} = 2.101
\]

\[
p = 0.556
\]

Poiché \( |t| = 0.599 < t_{critico} = 2.101 \) e il p-value è maggiore di 0.05, non possiamo rifiutare l'ipotesi nulla.


Conclusione: Non ci sono differenze statisticamente significative tra i due gruppi con un livello di confidenza del 95%.

Assunzioni del t-test a campioni indipendenti

Il t-test a campioni indipendenti richiede che la variabile dipendente sia distribuita approssimativamente normalmente all'interno di ciascun gruppo e che le varianze dei due gruppi siano uguali.

analisi dati tesi

Assunzione di normalità

Nota che, tecnicamente, sono i residui che devono essere distribuiti normalmente, ma per un test t di Student entrambi daranno lo stesso risultato.

Puoi verificare tale assunzione eseguendo una serie di test diversi o plottando un grafico. Tra i più comuni ci sono il test di normalità di Shapiro-Wilks e il grafico Q-Q plot.

Test di Shapiro-Wilks

Il primo è il test di normalità più potente soprattutto nel caso di piccoli campioni. Si basa sulla verifica dell’ipotesi nulla che la variabile dipendente (da ora in poi la chiamo variabile osservata) provenga da una distribuzione normale.

Pertanto, si potrà assumere vera l’ipotesi di normalità se il test non risulta significativo (p-value > 0,05).

Q-Q Plot

Il secondo è la rappresentazione grafica dei quantili di una distribuzione. Questo grafico confronta la distribuzione cumulata della variabile osservata con la distribuzione cumulata della normale.

Se la variabile osservata si distribuisce normalmente, i punti di questa distribuzione congiunta si addensano sulla diagonale che va dal basso verso l'alto e da sinistra verso destra.

Nel grafico sotto ti mostro un esempio di come viene violata l'assunzione di normalità in quanto i pallini verdi non si distribuiscono sulla bisettrice.

Q-Q plot
Grafico Q-Q plot

Puoi eseguire questi test utilizzando il software statistico SPSS, di cui trovi il comando a fondo pagina. 

Tuttavia, il t-test a campioni indipendenti è descritto come un test robusto rispetto all'ipotesi di normalità. Ciò significa che qualche deviazione dalla normalità non ha una grande influenza sui tassi di errore di tipo I. L'eccezione è se il rapporto tra la dimensione del gruppo più piccola e quella più grande è maggiore di 1,5 (il più grande rispetto al più piccolo).

Cosa fare quando si viola l’ipotesi di normalità

Se scopri che uno o entrambi i dati del tuo gruppo non sono distribuiti approssimativamente normalmente e le dimensioni dei gruppi differiscono notevolmente, puoi eseguire il test U di Mann-Whitney, che è un test non parametrico e che non richiede l'assunzione di normalità.

YouTube video
Intro Capitolo 10 - Test non parametrici

Assunzione di omogeneità delle varianze

Il t-test a campioni indipendenti presuppone che le varianze dei due gruppi che stai misurando siano uguali nella popolazione. Se le tue varianze non sono uguali, ciò può influire sul tasso di errore di tipo I

L'ipotesi di omogeneità della varianza può essere verificata utilizzando il test di uguaglianza delle varianze di Levene.

Questo test fornisce una statistica F e un valore di significatività (p-value). A te interessa principalmente il valore di significatività: se è maggiore di 0,05 (cioè, p > 0,05), le varianze di gruppo possono essere trattate come uguali. Tuttavia, se p < 0,05, hai varianze disuguali e quindi hai violato l'ipotesi di omogeneità delle varianze.

Cosa fare quando si viola l’ipotesi di omogeneità delle varianze

Se il test di Levene per l'uguaglianza delle varianze è statisticamente significativo, il che indica che le varianze di gruppo non sono uguali nella popolazione, è possibile correggere questa violazione non utilizzando la stima aggregata per il termine di errore per la statistica t, ma utilizzando invece una adeguamento ai gradi di libertà con il metodo Welch.

Test t di Welch

Se hai ancora qualche dubbio sul t-test a campioni indipendenti, guarda il video iniziale in cui te lo spiego in modo semplice e veloce utilizzando una metafora statistica.

Esempio t-test a campioni indipendenti con varianze diverse

Due gruppi di 10 persone di diverse capacità hanno eseguito lo stesso lavoro impiegando i tempi in tabella. Si stabilisca con un livello di confidenza del 95% se c’è differenza tra i due gruppi.

N.B: SUPPONIAMO CHE LE VARIANZE SIANO DIVERSE

Tabella dei dati:

\[
\begin{array}{|c|c|}
\hline
\textbf{Gruppo 1} & \textbf{Gruppo 2} \\
\hline
25 & 24 \\
30 & 28 \\
21 & 20 \\
26 & 31 \\
24 & 22 \\
22 & 23 \\
27 & 21 \\
29 & 28 \\
22 & 21 \\
24 & 23 \\
\hline
\end{array}
\]


Passo 1: Calcolo delle statistiche descrittive

\[
\bar{X}_1 = \frac{25 + 30 + 21 + 26 + 24 + 22 + 27 + 29 + 22 + 24}{10} = 25.0
\]

\[
\bar{X}_2 = \frac{24 + 28 + 20 + 31 + 22 + 23 + 21 + 28 + 21 + 23}{10} = 24.1
\]


Passo 2: Calcolo delle varianze

Varianze non corrette (divise per \( n \)):

\[
s_{nc,1}^2 = \frac{\sum (X_i - \bar{X}_1)^2}{n_1} = 8.2
\]

\[
s_{nc,2}^2 = \frac{\sum (X_i - \bar{X}_2)^2}{n_2} = 12.09
\]

Varianze corrette (divise per \( n-1 \)):

\[
s_1^2 = \frac{\sum (X_i - \bar{X}_1)^2}{n_1 - 1} = 9.11
\]

\[
s_2^2 = \frac{\sum (X_i - \bar{X}_2)^2}{n_2 - 1} = 13.43
\]


Passo 3: Calcolo dello standard error

\[
SE = \sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}} = \sqrt{\frac{9.11}{10} + \frac{13.43}{10}} = 1.501
\]


Passo 4: Calcolo del test t di Welch

\[
t = \frac{\bar{X}_1 - \bar{X}_2}{SE} = \frac{25.0 - 24.1}{1.501} = 0.599
\]


Passo 5: Calcolo dei gradi di libertà con la formula di Welch-Satterthwaite

\[
df = \frac{\left( \frac{s_1^2}{n_1} + \frac{s_2^2}{n_2} \right)^2}{\frac{\left( \frac{s_1^2}{n_1} \right)^2}{n_1 - 1} + \frac{\left( \frac{s_2^2}{n_2} \right)^2}{n_2 - 1}} = 17.36
\]


Passo 6: Confronto con il valore critico

\[
t_{critico} = 2.106
\]

\[
p = 0.557
\]

Poiché \( |t| = 0.599 < t_{critico} = 2.106 \) e il p-value è maggiore di 0.05, non possiamo rifiutare l'ipotesi nulla.


Conclusione: Non ci sono differenze statisticamente significative tra i due gruppi con un livello di confidenza del 95%.

corso spss

T-test a campioni indipendenti EXCEL

Scheda Dati >>> Analisi dati >>> Test t: due campioni assumendo uguale varianza

T-test a campioni indipendenti EXCEL
T-test a campioni indipendenti

Scheda Dati >>> Analisi dati >>> Test t: due campioni assumendo varianze diverse

T-test a campioni indipendenti SPSS: 

Analizza >>> Confronta medie >>> Test T: campioni indipendenti

Se vuoi approfondire la tua conoscenza su SPSS del t-test a campioni indipendenti e di altri test t, ti lascio questo breve video di presentazione del capitolo 5 del mio corso.

YouTube video
Intro capitolo 5 - T-Test

Riassumendo

  • Il t-test a campioni indipendenti è utilizzato quando vuoi confrontare le medie tra due gruppi non correlati tra loro.
  • Il t-test a campioni indipendenti richiede che siano soddisfatte le ipotesi di normalità e di omogeneità delle varianze.
  • Se l’assunzione di normalità non è soddisfatta si esegue il test non parametrico U di Mann-Whitney
  • Se le varianze sono eterogenee, si può usare si può usare il t-test a campioni indipendenti con la correzione di Welch

Le persone dipendenti hanno bisogno degli altri per ottenere quello che vogliono. Le persone indipendenti possono ottenere quello che vogliono attraverso i loro sforzi individuali. Le persone interdipendenti combinano i loro sforzi individuali con quelli degli altri per conseguire un successo più grande.

(Stephen Covey - Scrittore statunitense)

Iscriviti alla Newsletter

Se hai bisogno d’informazioni che non hai trovato nella sezione servizi o dei video corsi, scrivimi un messaggio o chiamami.
Domande, prezzi, richieste, delucidazioni...tutto quello che ti serve. Cercherò di risponderti entro le 24h.
Newsletter

Consenso al trattamento dei dati
Utilizzerò i tuoi dati (nome ed indirizzo mail) solo per inviarti gratuitamente via mail la newsletter mensile. Niente spam, niente scocciature, ti disiscrivi in un click quando vuoi.

arrow-up-circle
linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram