whatsapp
Adriano Gilardone
Adriano Gilardone
adriano gilardone Docente di Statistica Matematica Excel Spss sfruttare excel consulenze statistiche lezione videocorsi
blog

blog

T-test a campioni accoppiati: 2 misurazioni per un'osservazione

Ultima modifica (26 Febbraio 2025)
YouTube video
Postato il 2 Febbraio 2022
Tag

Il t-test a campioni accoppiati, chiamato anche t-test a campioni appaiati o t-test per campioni dipendenti, è uno strumento di analisi dati utilizzato per determinare se esiste una differenza media tra soggetti misurati due volte, a coppie appunto

corso spss

Attenzione a non confondere questo test con il t-test a campioni indipendenti, che confronta le medie di due gruppi, di cui ti ho invece parlato in modo approfondito in un altro articolo, dove mi sono focalizzato, appunto, sui valori medi dei singoli gruppi. 

In un t-test a campioni accoppiati ogni soggetto o entità viene misurato due volte, ottenendo così coppie di osservazioni. Le applicazioni comuni includono studi caso-controllo o progetti di misure ripetute

Supponiamo di valutare l'efficacia di un farmaco somministrato ad un gruppo di persone. Un approccio che potresti prendere in considerazione sarebbe misurare le prestazioni del campione prima e dopo aver somministrato la medicina, e analizzare le differenze utilizzando il test t di Student.

Le ipotesi del t-test a campioni accoppiati

Come molte procedure statistiche, il t-test a campioni accoppiati ha due ipotesi distinte: l'ipotesi nulla e l'ipotesi alternativa.

L'ipotesi nulla presuppone che la vera differenza media tra i campioni accoppiati sia pari a zero. In questo modello, tutte le differenze osservabili sono spiegate da variazioni casuali.

Al contrario, l'ipotesi alternativa presuppone che la vera differenza media tra i campioni appaiati sia diversa da zero, e può assumere diverse forme a seconda del risultato atteso:

Se la direzione della differenza non ha importanza, viene utilizzata un'ipotesi bilaterale, detta a due code.

Se invece la direzione della differenza ha importanza, è possibile utilizzare un'ipotesi unilaterale sinistra o destra per aumentare la potenza del test.

Ipotesi nulla

Premessa:

xi = Valore quantitativo misurato a ogni soggetto al tempo 0

xj= Valore quantitativo misurato a ogni soggetto al tempo 1

di = xi - xj = Differenza per ogni soggetto tra il tempo 1 e il tempo 0

H0: µd = 0

In questo caso, la media delle differenze è pari a zero.

Ipotesi alternativa bilaterale

H1: µd ≠ 0

In questo, invece, la media delle differenze è diversa da zero.

Ipotesi alternativa unilaterale destra

H1: µd > 0

La media delle differenze è maggiore di zero.

Ipotesi alternativa unilaterale sinistra

H1: µd < 0

Infine, la media delle differenze è minore di zero.

È importante ricordare che le ipotesi non riguardano mai i dati, riguardano i processi che producono i dati. Nelle formule che vedi riportate qui sopra, il valore di µd è sconosciuto. L'obiettivo è determinare l'ipotesi (nulla o alternativa) con cui i dati sono più coerenti.

corso spss

Le assunzioni del t-test a campioni accoppiati

Come tutti i test parametrici, anche il t-test a campioni accoppiati richiede che siano soddisfatti certi requisiti affinché i risultati ottenuti siano affidabili.

Le osservazioni sono definite come le differenze tra due insiemi di valori e ciascuna assunzione si riferisce a queste differenze, non ai valori dei dati originali. Queste sono le quattro assunzioni che un t-test a campioni accoppiati deve soddisfare:

  • La variabile dipendente deve essere continua.
  • Le osservazioni indipendenti l'una dall'altra.
  • La variabile dipendente deve essere distribuita approssimativamente normalmente.
  • La variabile dipendente non deve contenere valori anomali.

La scala di misurazione

Il t-test a campioni accoppiati richiede che i dati del campione siano numerici e continui, poiché si basa sulla distribuzione normale.

Una caratteristica dei dati continui è che possono assumere qualsiasi valore all'interno di un intervallo (reddito, altezza, peso, ecc.).

In certi casi si usano i dati qualitativi che possano approssimare una scala continua, come con le scale Likert. L'importante è trasformare le categorie in numeri. Per esempio 1 = Per niente, 2 = Poco, 3 = Abbastanza, 4 = Molto, 5 = Totalemente.

YouTube video

L'indipendenza delle osservazioni

L'indipendenza delle osservazioni di solito non è verificabile, ma può essere ragionevolmente assunta se il processo di raccolta dei dati è stato casuale senza sostituzione.

Se ci ricolleghiamo all'esempio che ti avevo citato all'inizio dell'articolo, cioè la somministrazione di un farmaco ad un campione di persone, è ragionevole presumere che gli individui partecipanti siano indipendenti l'uno dall'altro.

La normalità

Per verificare l'ipotesi di normalità sono disponibili vari metodi, ma il più semplice consiste nell'esaminare i dati visivamente utilizzando uno strumento come un istogramma (cioè il grafico che puoi vedere qui sotto).

I dati del mondo reale non sono quasi mai perfettamente normali, quindi questa ipotesi può essere considerata ragionevolmente soddisfatta se la forma appare approssimativamente simmetrica e a forma di campana.

I dati nella figura di esempio seguente sono distribuiti approssimativamente normalmente.

Istogramma

Se non sai con certezza come leggere un istrogramma o come realizzarlo, ti lascio questo mio breve video in cui te lo espongo in modo chiaro e semplice (lo trovi al minuto 04:16).

YouTube video
Grafici spiegati in modo semplice

Gli outliers

I valori anomali, o outliers, sono valori rari che appaiono lontani dalla maggior parte dei dati. I valori anomali possono falsare i risultati e potenzialmente portare a conclusioni errate, se non sono gestiti correttamente.

Un metodo per gestire gli outliers è semplicemente rimuoverli. Tuttavia, la rimozione di osservazioni dal dataset può introdurre altri tipi di distorsione nei risultati e potenzialmente comportare la perdita di informazioni critiche. Semplicemente valuta con attenzione questa possibilità.

Se i valori anomali sembrano avere molta influenza sui risultati, invece, potrebbe essere appropriato utilizzare un test non parametrico come il test di Wilcoxon dei segni.

Ovviamente, nel tuo dataset possono essere presenti dei valori anomali, ma non è obbligatorio. Per capire se ci sono, ti consiglio di utilizzare il boxplot, uno specifico grafico in cui puoi identificare visivamente gli outliers con molta facilità.

Nell'articolo ti mostro come crearlo e interpretarlo, mentre in questo video ti spiego in modo semplice e veloce quali dati puoi ricavare dal boxplot e quando devi utilizzarlo.

YouTube video
Il boxplot spiegato semplice con una metafora

Come calcolare il t-test a campioni accoppiati

La procedura per un t-test a campioni accoppiati può essere riassunta in 6 passaggi

Calcola le differenze per ogni coppia di osservazione

Fai la differenza tra il secondo e il primo valore per ogni coppia di osservazione.

di = xj - xi 

Calcola la differenza media campionaria

Somma tutte le differenze e dividile per il totale.

xd = ∑ di / n

corso spss

Calcola la deviazione standard delle differenze

t-test a campioni accoppiati

Calcola lo standard error

Fai il rapporto tra la deviazione standard e la radice quadrata di n, cioè la numerosità del campione.

SE = Sd / √n

Calcola la statistica test

Esegui la divisione tra la differenza media e lo standard error. Quest’ultimo è dato dal rapporto tra la deviazione standard e la radice quadrata del campione:

t-test a campioni appaiati

Trova il valore critico t𝛼/2 sulle tavole

Fissato un livello di significatività α, e n-1 gradi di libertà (gdl = n-1), consulta la tavola statistica t di Student per reperire il valore critico.

t-student
Tavola t-student

Prendi una decisione

A questo punto, per rilevare se il t-test a campioni accoppiati è significativo, si confronta la statistica test con il valore critico:

Se | T | > t𝛼/2 allora il test è significativo e puoi rifiutare H0, dicendo che la media delle differenze non è uguale a zero

Se | T | > t𝛼/2 allora il test non è significativo e non puoi rifiutare H0, e concludi dicendo che non hai sufficienti prove per affermare che la media delle differenze sia diversa da zero

Alternativamente, per determinare l’esito del test puoi utilizzare la funzione del tuo software statistico che ti ritorna il p-value e dire che:

Se p-value < α il test è significativo e quindi rifiuti H0.

Se p-value > α Il test non è significativo e non puoi rifiutare H0.

In generale valori p più grandi di 0,05 rappresentano test non significativi.

Se hai ancora dei dubbi sul t-test a campioni appaiati, guardati il mio video iniziale dove te lo spiego in modo chiaro e semplice attraverso una metafora statistica.

Esempio t-test a campioni accoppiati

Un nutrizionista vuole verificare l’efficacia di una nuova dieta ipocalorica. Ha selezionato un campione di 10 persone e ha misurato il loro peso prima e dopo un mese di dieta. L’obiettivo è determinare se vi sia una riduzione significativa del peso corporeo utilizzando un t-test a campioni accoppiati.


Tabella dei dati

\[
\begin{array}{|c|c|c|c|}
\hline
\textbf{Persona} & \textbf{Peso Prima (kg)} & \textbf{Peso Dopo (kg)} & \textbf{Diff.} \\
\hline
1 & 85 & 80 & -5 \\
2 & 92 & 88 & -4 \\
3 & 76 & 72 & -4 \\
4 & 81 & 77 & -4 \\
5 & 89 & 84 & -5 \\
6 & 95 & 91 & -4 \\
7 & 78 & 75 & -3 \\
8 & 83 & 79 & -4 \\
9 & 87 & 83 & -4 \\
10 & 90 & 85 & -5 \\
\hline
\end{array}
\]


Passo 1: Calcolo della media della differenza dei pesi

\[
\bar{d} = \frac{\sum d_i}{n}
\]

\[
\bar{d} = \frac{(-5) + (-4) + (-4) + (-4) + (-5) + (-4) + (-3) + (-4) + (-4) + (-5)}{10}
\]

\[
\bar{d} = \frac{-42}{10} = -4.2
\]


Passo 2: Calcolo della deviazione standard della differenza

\[
s_d = \sqrt{\frac{\sum (d_i - \bar{d})^2}{n-1}}
\]

Calcoliamo gli scarti quadratici:

\[
(-5 + 4.2)^2 = (-0.8)^2 = 0.64
\]

\[
(-4 + 4.2)^2 = (0.2)^2 = 0.04
\]

\[
(-4 + 4.2)^2 = (0.2)^2 = 0.04
\]

\[
(-4 + 4.2)^2 = (0.2)^2 = 0.04
\]

\[
(-5 + 4.2)^2 = (-0.8)^2 = 0.64
\]

\[
(-4 + 4.2)^2 = (0.2)^2 = 0.04
\]

\[
(-3 + 4.2)^2 = (1.2)^2 = 1.44
\]

\[
(-4 + 4.2)^2 = (0.2)^2 = 0.04
\]

\[
(-4 + 4.2)^2 = (0.2)^2 = 0.04
\]

\[
(-5 + 4.2)^2 = (-0.8)^2 = 0.64
\]

Sommando i valori:

\[
0.64 + 0.04 + 0.04 + 0.04 + 0.64 + 0.04 + 1.44 + 0.04 + 0.04 + 0.64 = 3.6
\]

\[
s_d = \sqrt{\frac{3.6}{9}} = \sqrt{0.4} \approx 0.63
\]

Passo 2.1: Calcolo degli scarti quadratici medi

Gli scarti quadratici medi (\(SQM\)) si calcolano come:

\[
SQM = \frac{\sum (d_i - \bar{d})^2}{n}
\]

\[
SQM = \frac{3.6}{10} = 0.36
\]


Passo 3: Calcolo della statistica t

\[
t = \frac{\bar{d}}{s_d / \sqrt{n}}
\]

\[
t = \frac{-4.2}{0.63 / \sqrt{10}}
\]

\[
t = \frac{-4.2}{0.199} \approx -21.1
\]


Passo 4: Confronto con il valore critico

Per un test a due code con \(\alpha = 0.05\) e 9 gradi di libertà, il valore critico della distribuzione t è circa 2.262.

\[
|t| = 21.1 > 2.262
\]

Essendo il valore assoluto di t maggiore del valore critico, rifiutiamo l’ipotesi nulla.


Conclusione

Il valore di t ottenuto è significativamente diverso da zero, suggerendo che la dieta ha effettivamente ridotto il peso in modo significativo (\( p < 0.05 \)).

analisi dati tesi

T-test a campioni accoppiati per medie EXCEL

Scheda Dati >>> Analisi dati >>> Test T: due campioni accoppiati per media

T-test a campioni accoppiati SPSS

Analizza >>> Confronta medie >>> Test T per campioni accoppiati

Se vuoi approfondire la tua conoscenza su SPSS del t-test a campioni accoppiati e di altri test t, ti lascio questo breve video di presentazione del mio corso!

YouTube video
Presentazione videocorso SPSS

Riassumendo

  • Il t-test a campioni accoppiati si utilizza quando si vogliono analizzare situazioni di pre e post-trattamento, ma non solo.
  • La variabile in esame deve essere numerica continua
  • I requisiti per condurre il t-test a campioni accoppiati sono la normalità della variabile numerica, l’indipendenza delle osservazioni rilevate e l’assenza di outlier.

I calzini ci insegnano che non sempre stare insieme significa essere accoppiati

(Autore sconosciuto)

Iscriviti alla Newsletter

Se hai bisogno d’informazioni che non hai trovato nella sezione servizi o dei video corsi, scrivimi un messaggio o chiamami.
Domande, prezzi, richieste, delucidazioni...tutto quello che ti serve. Cercherò di risponderti entro le 24h.
Newsletter

Consenso al trattamento dei dati
Utilizzerò i tuoi dati (nome ed indirizzo mail) solo per inviarti gratuitamente via mail la newsletter mensile. Niente spam, niente scocciature, ti disiscrivi in un click quando vuoi.

arrow-up-circle
linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram