adriano gilardone Docente di Statistica Matematica Excel Spss sfruttare excel consulenze statistiche lezione videocorsi

T-test a campioni indipendenti: 2 gruppi per una sola statistica

YouTube video
Postato il 14 Febbraio 2022
Tag

Il t-test a campioni indipendenti, chiamato anche t-test dei due campioni, o test t di Student, è un test statistico inferenziale che determina se esiste una differenza significativa tra le medie di due gruppi non correlati. 

Se non sai come capire se due campioni sono dipendenti o indipendenti, ti consiglio di consultare anche il mio altro articolo, che parla invece del t-test per campioni accoppiati, in cui i due gruppi sono dipendenti o correlati.

Ipotesi del t-test a campioni indipendenti

All'interno di un t-test a campioni indipendenti troverai due diverse tipologie di ipotesi: l'ipotesi nulla e l'ipotesi alternativa.

L'ipotesi nulla

L'ipotesi nulla afferma che le medie della popolazione dei due gruppi siano uguali:

H0: µ1 = µ2

o analogamente che la differenza tra le due medie sia nulla:

H0: µ1 - µ2 = 0

L'ipotesi alternativa

Proprio come ti ho mostrato nel caso di un t-test a campioni accoppiati, si distinguono diversi tipi di test a seconda dell’ipotesi alternativa che si vuole sottoporre a verifica. In particolare:

Ipotesi alternativa bilaterale

H1: µ1 - µ2 ≠ 0

cioè la differenza tra le medie è diversa da zero.

Ipotesi alternativa unilaterale destra

H1: µ1 - µ2 > 0

cioè la differenza tra le medie è maggiore di zero.

Ipotesi alternativa unilaterale sinistra

H1: µ1 - µ2 < 0

cioè la differenza tra le medie è minore di zero.

Cosa serve per un t-test a campioni indipendenti

Per eseguire un t-test a campioni indipendenti sono necessarie due variabili:

  • Una variabile qualitativa (nominale o ordinale) indipendente con due modalità.
  • Una variabile quantitativa (discreta o continua) dipendente.

Ad esempio, se si vuole verificare che la differenza di altezza tra un gruppo di maschi e uno di femmine sia diversa da zero, la variabile indipendente sarà il sesso mentre quella dipendente sarà rappresentata dalle diverse altezze delle singole persone.

I gruppi indipendenti

Ma perchè i gruppi sono indipendenti? I gruppi devono essere indipendenti perchè i gruppi non correlati rappresentano le due categorie della variabile indipendente in cui i casi (per esempio le persone) sono differenti.

Spesso potrai avere la necessità di esaminare le differenze presenti tra gli individui, e di conseguenza quando si confrontano due gruppi, un individuo in un gruppo non potrà essere anche membro dell'altro, e viceversa. 

Proviamo a ripensare all'esempio che abbiamo citato precedentemente: per essere parte dell'analisi, un individuo deve essere classificato o nel gruppo dei maschi o in quello delle femmine, ma non potrà essere parte di entrambi.

Come si esegue il t-test a campioni indipendenti

Indicando con n1 e n2 rispettivamente le numerosità campionarie dei due gruppi, la procedura per un t-test a campioni indipendenti può essere riassunta in 6 passaggi. 

Calcola le medie dei due gruppi

Come primo passaggio devi sommare i valori della variabile numerica e dividerli per la numerosità del proprio gruppo. Tali medie le indico con x1 e x2.

Calcola le deviazioni standard dei due gruppi

A questo punto, chiamerò s1 e s2 rispettivamente la deviazione standard del primo e del secondo gruppo. Se non ricordi come si effettua il calcolo della deviazione standard consulta il mio articolo, dove potrai trovare elencati i vari passaggi da seguire.

Calcola i gradi di libertà

Per calcolare i gradi di libertà usa la formula:

g.d.l = n1+n2-2

Calcola la varianza congiunta S2

Questa è una sorta di varianza pesata, al cui denominatore compaiono i gradi di libertà calcolati nel punto precedente:

Varianza campionaria

Calcola l’errore standard della stima SE

A questo punto, fai la radice quadrata della moltiplicazione tra la varianza congiunta e la quantità (1 / n1 + 1 / n2).

Calcola il valore della statistica T

Dividi adesso la differenza delle medie per l’errore standard:

T-test a campioni indipendenti

Trova il valore critico t𝛼/2 sulle tavole

Fissato un livello di significatività α, e n-1  gradi di libertà (calcolati nel punto 3), adesso devi consultare la tavola statistica della distribuzione t di Student per reperire il valore critico (come ti dicevo in apertura, il test t di Student è un altro modo di chiamare il t-test a campioni indipendenti).

Tavola t-student
Tavola t-student

Prendi una decisione

L'ultimi passaggio da seguire per effettuare un t-test a campioni indipendenti è confrontare la statistica test calcolata nel punto 6) con il valore critico ottenuto nel punto 7), per capire se il t-test è significativo. In particolare potrai quindi avere due situazioni:

  • Se |T|> t𝛼/2 allora il test è significativo e puoi rifiutare H0, dicendo che le due medie differiscono significativamente.
  • Se |T|> t𝛼/2 non puoi rifiutare H0, e concludi dicendo che non hai sufficienti prove per affermare che le due medie differiscano significativamente.

Alternativamente, per determinare l’esito del test puoi calcolare il p-value con il tuo software statistico preferito e dire che:

  • Se p-value < α il test è significativo e quindi rifiuti H0.
  • Se p-value > α Il test non è significativo e non puoi rifiutare H0.

In generale valori p più grandi di 0,05 rappresentano test non significativi.

Se non ricordi nel dettaglio cosa sia il p-value, ti lascio questo mio video in cui te lo spiego in modo chiaro e semplice utilizzando una metafora statistica.

YouTube video
Il p-value spiegato semplice con una metafora

Requisiti del t-test a campioni indipendenti

Il t-test a campioni indipendenti richiede che la variabile dipendente sia distribuita approssimativamente normalmente all'interno di ciascun gruppo e che le varianze dei due gruppi siano uguali.

Assunzione di normalità

Nota che, tecnicamente, sono i residui che devono essere distribuiti normalmente, ma per un test t di Student entrambi daranno lo stesso risultato.

Puoi verificare tale assunzione eseguendo una serie di test diversi o plottando un grafico. Tra i più comuni ci sono:

  1. Il test di normalità di Shapiro-Wilks
  2. Il grafico Q-Q plot

Il primo è il test di normalità più potente soprattutto nel caso di piccoli campioni. Si basa sulla verifica dell’ipotesi nulla che la variabile dipendente (da ora in poi la chiamo variabile osservata) provenga da una distribuzione normale. Pertanto, si potrà assumere vera l’ipotesi di normalità se il test non risulta significativo (p-value > 0,05).

Il secondo è la rappresentazione grafica dei quantili di una distribuzione. Questo grafico confronta la distribuzione cumulata della variabile osservata con la distribuzione cumulata della normale. Se la variabile osservata si distribuisce normalmente, i punti di questa distribuzione congiunta si addensano sulla diagonale che va dal basso verso l'alto e da sinistra verso destra. Nel grafico sotto ti mostro un esempio di come viene violata l'assunzione di normalità in quanto i pallini verdi non si distribuiscono sulla bisettrice.

Q-Q plot
Grafico Q-Q plot

Puoi eseguire questi test utilizzando il software statistico SPSS, di cui trovi il comando a fondo pagina. 

Tuttavia, il test t è descritto come un test robusto rispetto all'ipotesi di normalità. Ciò significa che qualche deviazione dalla normalità non ha una grande influenza sui tassi di errore di tipo I. L'eccezione è se il rapporto tra la dimensione del gruppo più piccola e quella più grande è maggiore di 1,5 (il più grande rispetto al più piccolo).

Cosa fare quando si viola l’ipotesi di normalità

Se scopri che uno o entrambi i dati del tuo gruppo non sono distribuiti approssimativamente normalmente e le dimensioni dei gruppi differiscono notevolmente, puoi eseguire il test U di Mann-Whitney, che è un test non parametrico e che non richiede l'assunzione di normalità.

YouTube video
Intro Capitolo 10 - Test non parametrici

Assunzione di omogeneità delle varianze

Il t-test a campioni indipendenti presuppone che le varianze dei due gruppi che stai misurando siano uguali nella popolazione. Se le tue varianze non sono uguali, ciò può influire sul tasso di errore di tipo I. L'ipotesi di omogeneità della varianza può essere verificata utilizzando il test di uguaglianza delle varianze di Levene.

Questo test fornisce una statistica F e un valore di significatività (p-value). A te interessa principalmente il valore di significatività: se è maggiore di 0,05 (cioè, p > 0,05), le varianze di gruppo possono essere trattate come uguali. Tuttavia, se p < 0,05, hai varianze disuguali e quindi hai violato l'ipotesi di omogeneità delle varianze.

Cosa fare quando si viola l’ipotesi di omogeneità delle varianze

Se il test di Levene per l'uguaglianza delle varianze è statisticamente significativo, il che indica che le varianze di gruppo non sono uguali nella popolazione, è possibile correggere questa violazione non utilizzando la stima aggregata per il termine di errore per la statistica t, ma utilizzando invece una adeguamento ai gradi di libertà con il metodo Welch-Satterthwaite.

Se hai ancora qualche dubbio sul t-test a campioni indipendenti, guarda il video iniziale in cui te lo spiego in modo semplice e veloce utilizzando una metafora statistica.

T-test a campioni indipendenti EXCEL

Scheda Dati >>> Analisi dati >>> Test t: due campioni assumendo uguale varianza

T-test a campioni indipendenti EXCEL
T-test a campioni indipendenti

Scheda Dati >>> Analisi dati >>> Test t: due campioni assumendo varianze diverse

T-test a campioni indipendenti SPSS: 

Analizza >>> Confronta medie >>> Test T: campioni indipendenti

Se vuoi approfondire la tua conoscenza su SPSS del t-test a campioni indipendenti e di altri test t, ti lascio questo breve video di presentazione del capitolo 5 del mio corso.

YouTube video
Intro capitolo 5 - T-Test

Riassumendo

  • Il t-test a campioni indipendenti è utilizzato quando vuoi confrontare le medie tra due gruppi non correlati tra loro.
  • Il t-test a campioni indipendenti richiede che siano soddisfatte le ipotesi di normalità e di omogeneità delle varianze.
  • Se l’assunzione di normalità non è soddisfatta si esegue il test non parametrico U di Mann-Whitney
  • Se le varianze sono eterogenee si può usare l’equazione di Welch-Satterthwaite.

Le persone dipendenti hanno bisogno degli altri per ottenere quello che vogliono. Le persone indipendenti possono ottenere quello che vogliono attraverso i loro sforzi individuali. Le persone interdipendenti combinano i loro sforzi individuali con quelli degli altri per conseguire un successo più grande.

(Stephen Covey - Scrittore statunitense)

Ripetizioni private

Ho intrapreso una interessante collaborazione con il sito di TROVAPROF.IT

Questa start-up mette in relazione studenti che cercano lezioni private con professori di qualsiasi materia. Se stai cercano delle ripetizioni per le materie che non tratto io, allora ti consiglio di fare un salto su TROVAPROF.IT, un portale completamente gratuito per dare o ricevere lezioni private.

Iscriviti alla Newsletter

Se hai bisogno d’informazioni che non hai trovato nella sezione servizi o dei video corsi, scrivimi un messaggio o chiamami.
Domande, prezzi, richieste, delucidazioni...tutto quello che ti serve. Cercherò di risponderti entro le 24h.
Newsletter

Consenso al trattamento dei dati
Utilizzerò i tuoi dati (nome ed indirizzo mail) solo per inviarti gratuitamente via mail la newsletter mensile. Niente spam, niente scocciature, ti disiscrivi in un click quando vuoi.

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram