adriano gilardone Docente di Statistica Matematica Excel Spss sfruttare excel consulenze statistiche lezione videocorsi

T-test a campioni accoppiati: 2 misurazioni per un'osservazione

YouTube video
Postato il 2 Febbraio 2022
Tag

Il t-test a campioni accoppiati, chiamato anche t-test a campioni appaiati o t-test per campioni dipendenti, è uno strumento di analisi dati utilizzato per determinare se la differenza media tra due serie di osservazioni è zero.

Attenzione a non confondere questo test con il t-test a campioni indipendenti, che confronta le medie di due gruppi, di cui ti ho invece parlato in modo approfondito in un altro articolo, dove mi sono focalizzato, appunto, sui valori medi dei singoli gruppi. 

In un t-test a campioni accoppiati ogni soggetto o entità viene misurato due volte, ottenendo così coppie di osservazioni. Le applicazioni comuni includono studi caso-controllo o progetti di misure ripetute. 

In questo articolo, per spiegarti meglio l'argomento utilizzerò come esempio che tu sia interessato a valutare l'efficacia di un farmaco somministrato ad un gruppo di persone. Un approccio che potresti prendere in considerazione sarebbe misurare le prestazioni del campione in questione prima e dopo aver somministrato la medicina, e analizzare le differenze utilizzando il test t di Student. In questo caso eseguirai poi un t-test a campioni accoppiati.

Le ipotesi del t-test a campioni accoppiati

Come molte procedure statistiche, il t-test a campioni accoppiati ha due ipotesi concorrenti: l'ipotesi nulla e l'ipotesi alternativa.

L'ipotesi nulla presuppone che la vera differenza media tra i campioni accoppiati sia pari a zero. In questo modello, tutte le differenze osservabili sono spiegate da variazioni casuali.

Al contrario, l'ipotesi alternativa presuppone che la vera differenza media tra i campioni appaiati sia diversa da zero, e può assumere diverse forme a seconda del risultato atteso:

  • Se la direzione della differenza non ha importanza, viene utilizzata un'ipotesi bilaterale, detta a due code.
  • Se invece la direzione della differenza ha importanza, è possibile utilizzare un'ipotesi unilaterale di una coda superiore o di una coda inferiore per aumentare la potenza del test.

Adesso che abbiamo delineato queste due diverse forme, vediamo tutti i tipi di test che puoi effettuare, e come si effettuano. Considera che l'ipotesi nulla rimane la stessa per ogni tipo di ipotesi alternativa. 

Definisco sempre con xi e xj rispettivamente il valore osservato al tempo 0, cioè la prima rilevazione, e quello al tempo 1, cioè la seconda rilevazione.

La loro differenza, invece, la identifico con di ossia:

di = xi - xj 

Pertanto, tenendo fisse queste formule che ti ho riportato, vediamo i risultati dei vari test.

Ipotesi nulla

H0: µd = 0

In questo caso, la media delle differenze è pari a zero.

Ipotesi alternativa bilaterale

H1: µd ≠ 0

In questo, invece, la media delle differenze è diversa da zero.

Ipotesi alternativa unilaterale destra

H1: µd > 0

La media delle differenze è maggiore di zero.

Ipotesi alternativa unilaterale sinistra

H1: µd < 0

Infine, la media delle differenze è minore di zero.

È importante ricordare che le ipotesi non riguardano mai i dati, riguardano i processi che producono i dati. Nelle formule che vedi riportate qui sopra, il valore di µd è sconosciuto. L'obiettivo è determinare l'ipotesi (nulla o alternativa) con cui i dati sono più coerenti.

Le assunzioni del t-test a campioni accoppiati

Come tutti i test parametrici, anche il t-test a campioni accoppiati richiede che siano soddisfatti certi requisiti affinché i risultati ottenuti siano affidabili. In esso, le osservazioni sono definite come le differenze tra due insiemi di valori e ciascuna assunzione si riferisce a queste differenze, non ai valori dei dati originali. Queste sono le quattro assunzioni che un t-test a campioni accoppiati deve soddisfare:

  • La variabile dipendente deve essere continua.
  • Le osservazioni sono indipendenti l'una dall'altra.
  • La variabile dipendente dovrebbe essere distribuita approssimativamente normalmente.
  • La variabile dipendente non deve contenere valori anomali.

Vediamoli ora in dettaglio uno per uno.

La scala di misurazione

Il t-test a campioni accoppiati richiede che i dati del campione siano numerici e continui, poiché si basa sulla distribuzione normale. Una caratteristica dei dati continui è che possono assumere qualsiasi valore all'interno di un intervallo (reddito, altezza, peso, ecc.). L'opposto dei dati continui, invece, sono i dati discreti, che possono assumere solo pochi valori (Basso, Medio, Alto, ecc.). Occasionalmente, i dati discreti possono essere utilizzati per approssimare una scala continua, come con le scale di tipo Likert.

L'indipendenza delle osservazioni

L'indipendenza delle osservazioni di solito non è verificabile, ma può essere ragionevolmente assunta se il processo di raccolta dei dati è stato casuale senza sostituzione. Se ci ricolleghiamo all'esempio che ti avevo citato all'inizio dell'articolo, cioè la somministrazione di un farmaco ad un campione di persone, è ragionevole presumere che gli individui partecipanti siano indipendenti l'uno dall'altro.

La normalità

Per verificare l'ipotesi di normalità sono disponibili vari metodi, ma il più semplice consiste nell'esaminare i dati visivamente utilizzando uno strumento come un istogramma (cioè il grafico che puoi vedere qui sotto). I dati del mondo reale non sono quasi mai perfettamente normali, quindi questa ipotesi può essere considerata ragionevolmente soddisfatta se la forma appare approssimativamente simmetrica e a forma di campana. I dati nella figura di esempio seguente sono distribuiti approssimativamente normalmente.

Distribuzione normale
Esempio di istogramma

Se non sai con certezza come leggere un istrogramma o come realizzarlo, ti lascio questo mio breve video in cui te lo espongo in modo chiaro e semplice (lo trovi al minuto 04:16).

YouTube video
Quando si utilizza un istogramma

Gli outliers

I valori anomali, o outliers, sono valori rari che appaiono lontani dalla maggior parte dei dati. I valori anomali possono falsare i risultati e potenzialmente portare a conclusioni errate, se non sono gestiti correttamente. Per questo puoi decidere come approcciarli seguendo due differenti metodi, che potrai scegliere a tua discrezione.

Un metodo per gestir i valori anomali è semplicemente rimuoverli. Tuttavia, la rimozione di osservazioni dal set di dati può introdurre altri tipi di distorsione nei risultati e potenzialmente comportare la perdita di informazioni critiche. Quindi se scegli questa strada devi seguirla facendo molta attenzione a questa possibilità.

Se i valori anomali sembrano avere molta influenza sui risultati, invece, potrebbe essere appropriato utilizzare un test non parametrico come il test dei Ranghi di Wilcoxon.

Ovviamente, nel tuo dataset possono essere presenti dei valori anomali, ma non è obbligatorio. Per capire se ci sono, ti consiglio di utilizzare il boxplot, uno specifico grafico in cui puoi identificare visivamente gli outliers con molta facilità. Nell'articolo ti mostro come crearlo e interpretarlo, mentre in questo video ti spiego in modo semplice e veloce quali dati puoi ricavare dal boxplot e quando devi utilizzarlo.

YouTube video
Il boxplot spiegato con una metafora

Come si calcola il t-test a campioni accoppiati

La procedura per un t-test a campioni accoppiati può essere riassunta in 6 passaggi

Calcola le differenze per ogni coppia di osservazione

Fai la differenza tra il primo e il secondo valore per ogni coppia di osservazione.

di = xi - xj 

Calcola la differenza media campionaria

Somma tutte le differenze e dividile per il totale.

xd = ∑ di / n

Calcola la deviazione standard delle differenze

Deviazione standard

Nella formula che vedi, xi1 e xi2 sono la prima e la seconda rilevazione di ogni coppia di osservazioni e n è la numerosità campionaria di entrambi i gruppi.

Calcola lo standard error

Fai il rapporto tra la deviazione standard e la radice quadrata di n, cioè la numerosità del campione.

SE = Sd / √n

Calcola la statistica test

Esegui la divisione tra la differenza media e lo standard error. Quest’ultimo è dato dal rapporto tra la deviazione standard e la radice quadrata del campione:

t-test a campioni accoppiati

Trova il valore critico t𝛼/2 sulle tavole

Fissato un livello di significatività α, e n-1 gradi di libertà (gdl = n-1), consulta la tavola statistica t di Student per reperire il valore critico.

tavola t-student
Tavola t-student

Prendi una decisione

A questo punto, per rilevare se il t-test a campioni accoppiati è significativo, si confronta la statistica test calcolata nel punto 5) con il valore critico ottenuto nel punto 6) e in particolare:

  • Se |T|> t𝛼/2 allora il test è significativo e puoi rifiutare H0, dicendo che la media delle differenze non è uguale a zero
  • Se |T|> t𝛼/2 non puoi rifiutare H0, e concludi dicendo che non hai sufficienti prove per affermare che la media delle differenze sia diversa da zero

Alternativamente, per determinare l’esito del test puoi utilizzare la funzione del tuo software statistico che ti ritorna il p-value e dire che:

  • Se p-value < α il test è significativo e quindi rifiuti H0.
  • Se p-value > α Il test non è significativo e non puoi rifiutare H0.

In generale valori p più grandi di 0,05 rappresentano test non significativi.

Se hai ancora dei dubbi sul t-test a campioni appaiati, guardati il mio video iniziale dove te lo spiego in modo chiaro e semplice attraverso una metafora statistica.

T-test a campioni accoppiati per medie EXCEL

Scheda Dati >>> Analisi dati >>> Test T: due campioni accoppiati per media

T-test a campioni accoppiati SPSS

Analizza >>> Confronta medie >>> Test T per campioni accoppiati

Se vuoi approfondire la tua conoscenza su SPSS del t-test a campioni accoppiati e di altri test t, ti lascio questo breve video di presentazione del mio corso!

YouTube video
Presentazione videocorso SPSS

Riassumendo

  • Il t-test a campioni accoppiati si utilizza quando si vogliono analizzare situazioni di pre e post-trattamento, ma non solo.
  • La variabile in esame deve essere numerica continua
  • I requisiti per condurre il t-test a campioni accoppiati sono la normalità della variabile numerica, l’indipendenza delle osservazioni rilevate e l’assenza di outlier.

I calzini ci insegnano che non sempre stare insieme significa essere accoppiati

(Autore sconosciuto)

Ripetizioni private

Ho intrapreso una interessante collaborazione con il sito di TROVAPROF.IT

Questa start-up mette in relazione studenti che cercano lezioni private con professori di qualsiasi materia. Se stai cercano delle ripetizioni per le materie che non tratto io, allora ti consiglio di fare un salto su TROVAPROF.IT, un portale completamente gratuito per dare o ricevere lezioni private.

Iscriviti alla Newsletter

Se hai bisogno d’informazioni che non hai trovato nella sezione servizi o dei video corsi, scrivimi un messaggio o chiamami.
Domande, prezzi, richieste, delucidazioni...tutto quello che ti serve. Cercherò di risponderti entro le 24h.
Newsletter

Consenso al trattamento dei dati
Utilizzerò i tuoi dati (nome ed indirizzo mail) solo per inviarti gratuitamente via mail la newsletter mensile. Niente spam, niente scocciature, ti disiscrivi in un click quando vuoi.

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram