fbpx

T-test a campioni accoppiati. 2 misurazioni per 1 osservazione

Postato il 2 Febbraio 2022
Tag

Il t-test a campioni accoppiati, chiamato anche t-test a campioni appaiati o t-test per campioni dipendenti, è uno strumento di analisi dati utilizzato per determinare se la differenza media tra due serie di osservazioni è zero.

Attenzione a non confondere questo test con il t-test a campioni indipendenti che confronta le medie di due gruppi, ma di questo te ne parlerò in un altro articolo dove il focus sarà appunto sui valori medi dei singoli gruppi. 

In un t-test a campioni accoppiati, ogni soggetto o entità viene misurato due volte, ottenendo così coppie di osservazioni. Le applicazioni comuni includono studi caso-controllo o progetti di misure ripetute. 

Supponiamo che tu sia interessato a valutare l'efficacia di un farmaco somministrato ad un gruppo di persone. Un approccio che potresti prendere in considerazione sarebbe misurare le prestazioni del campione in questione prima e dopo aver somministrato la medicina e analizzare le differenze utilizzando il test t di Student.

Le ipotesi del t-test a campioni accoppiati

Come molte procedure statistiche, t-test a campioni accoppiati ha due ipotesi concorrenti, l'ipotesi nulla e l'ipotesi alternativa. L'ipotesi nulla presuppone che la vera differenza media tra i campioni accoppiati sia pari a zero. 

In questo modello, tutte le differenze osservabili sono spiegate da variazioni casuali. Al contrario, l'ipotesi alternativa presuppone che la vera differenza media tra i campioni appaiati sia diversa da zero. L'ipotesi alternativa può assumere diverse forme a seconda del risultato atteso. Se la direzione della differenza non ha importanza, viene utilizzata un'ipotesi bilaterale, detta a due code. In caso contrario, è possibile utilizzare un'ipotesi unilaterale di una coda superiore o di una coda inferiore per aumentare la potenza del test. Qui di seguito ti elenco tutti i tipi di test che puoi effettuare. Considera che l'ipotesi nulla rimane la stessa per ogni tipo di ipotesi alternativa. 

Definisco con xi e xj rispettivamente il valore osservato al tempo 0, cioè la prima rilevazione, e quello al tempo 1, cioè la seconda rilevazione.

La loro differenza la identifico con di ossia:

di = xi - xj 

pertanto:

1)Ipotesi nulla

H0: µd = 0

cioè la media delle differenze è pari a zero

2)Ipotesi alternativa bilaterale

H1: µd ≠ 0

cioè la media delle differenze è diversa da zero

3)Ipotesi alternativa unilaterale destra

H1: µd > 0

cioè la media delle differenze è maggiore di zero

4)Ipotesi alternativa unilaterale sinistra

H1: µd < 0

cioè la media delle differenze è minore di zero

È importante ricordare che le ipotesi non riguardano mai i dati, riguardano i processi che producono i dati. Nelle formule sopra, il valore di µd è sconosciuto. L'obiettivo è determinare l'ipotesi (nulla o alternativa) con cui i dati sono più coerenti.

Assunzioni del t-test a campioni accoppiati

Come tutti i test parametrici, anche t-test a campioni accoppiati richiede che siano soddisfatti certi requisiti affinché i risultati ottenuti siano affidabili. In esso, le osservazioni sono definite come le differenze tra due insiemi di valori e ciascuna assunzione si riferisce a queste differenze, non ai valori dei dati originali. Queste sono le quattro assunzioni che un t-test a campioni accoppiati deve soddisfare:

• La variabile dipendente deve essere continua.

• Le osservazioni sono indipendenti l'una dall'altra.

• La variabile dipendente dovrebbe essere distribuita approssimativamente normalmente.

• La variabile dipendente non deve contenere valori anomali.

Di seguito te li spiego in dettaglio.

1)Scala di misurazione

Il t-test a campioni accoppiati, richiede che i dati del campione siano numerici e continui poiché si basa sulla distribuzione normale. I dati continui possono assumere qualsiasi valore all'interno di un intervallo (reddito, altezza, peso, ecc.). L'opposto dei dati continui sono i dati discreti, che possono assumere solo pochi valori (Basso, Medio, Alto, ecc.). Occasionalmente, i dati discreti possono essere utilizzati per approssimare una scala continua come con le scale di tipo Likert.

2)Indipendenza

L'indipendenza delle osservazioni di solito non è verificabile, ma può essere ragionevolmente assunta se il processo di raccolta dei dati è stato casuale senza sostituzione. Nel nostro esempio, è ragionevole presumere che gli individui partecipanti siano indipendenti l'uno dall'altro.

3)Normalità

Per verificare l'ipotesi di normalità, sono disponibili vari metodi, ma il più semplice consiste nell'esaminare i dati visivamente utilizzando uno strumento come un istogramma (vedi immagine in basso). I dati del mondo reale non sono quasi mai perfettamente normali, quindi questa ipotesi può essere considerata ragionevolmente soddisfatta se la forma appare approssimativamente simmetrica e a forma di campana. I dati nella figura di esempio seguente sono distribuiti approssimativamente normalmente.

4)Outliers

I valori anomali o outliers sono valori rari che appaiono lontani dalla maggior parte dei dati. I valori anomali possono falsare i risultati e potenzialmente portare a conclusioni errate se non gestiti correttamente. Un metodo per gestire i valori anomali è semplicemente rimuoverli. Tuttavia, la rimozione di osservazioni dal set di dati può introdurre altri tipi di distorsione nei risultati e potenzialmente comportare la perdita di informazioni critiche. Se i valori anomali sembrano avere molta influenza sui risultati, potrebbe essere appropriato utilizzare un test non parametrico come il test dei Ranghi di Wilcoxon. I valori anomali possono essere identificati visivamente utilizzando un boxplot.

Come si calcola il t-test a campioni accoppiati

La procedura per un t-test a campioni accoppiati può essere riassunta in 6 passaggi. 

1)Calcola le differenze per ogni coppia di osservazione

Fai la differenza tra il primo e il secondo valore per ogni coppia di osservazione

di = xi - xj 

2)Calcola la differenza media campionaria

Somma tutte le differenze e dividile per il totale

xd = ∑ di / n

3)Calcola la deviazione standard delle differenze

dove xi1 e xi2 sono la prima e la seconda rilevazione di ogni coppia di osservazioni e n è la numerosità campionaria di entrambi i gruppi.

4)Calcola lo standard error

Fai il rapporto tra la deviazione standard e la radice quadrata di n, cioè la numerosità del campione.

SE = Sd / √n

5)Calcola la statistica test

Esegui la divisione tra la differenza media e lo . Quest’ultimo è dato dal rapporto tra la deviazione standard e la radice quadrata del campione:

t-test a campioni accoppiati

6)Trova il valore critico t𝛼/2 sulle tavole

Fissato un livello di significatività α, e n-1  gradi di libertà (gdl = n-1), consulta la tavola statistica t di Student per reperire il valore critico.

tavola t-student

7)Prendi una decisione

Si confronta la statistica test calcolata nel punto 5) con il valore critico ottenuto nel punto 6) e in particolare:

  • Se |T|> t𝛼/2 allora il test è significativo e puoi rifiutare H0 dicendo che la media delle differenze non è uguale a zero
  • Se |T|> t𝛼/2 non puoi rifiutare H0 e concludi dicendo che non hai sufficienti prove per affermare che la media delle differenze sia diversa da zero

Alternativamente, per determinare l’esito del test puoi utilizzare la funzione del tuo software statistico che ti ritorna il p-value e dire che:

  • Se p-value < α il test è significativo e quindi rifiuti H0.
  • Se p-value > α Il test non è significativo e non puoi rifiutare H0.

In generale valori p più grandi di 0,05 rappresentano test non significativi.

COMANDI SOFTWARE:

  • Test t due campioni accoppiati per medie EXCEL: Scheda Dati >>> Analisi dati >>> Test T: due campioni accoppiati per media
  • Test t due campioni accoppiati SPSS: Analizza >>> Confronta medie >>> Test T per campioni accoppiati

Riassumendo

  • Il t-test a campioni accoppiati si utilizza quando si vogliono analizzare situazioni di pre e post-trattamento, ma non solo.
  • La variabile in esame deve essere numerica continua
  • I requisiti per condurre questo test sono la normalità della variabile numerica, l’indipendenza delle osservazioni rilevate e l’assenza di outlier.

I calzini ci insegnano che non sempre stare insieme significa essere accoppiati

(Autore sconosciuto)

Iscriviti alla Newsletter

Se hai bisogno d’informazioni che non hai trovato nella sezione servizi o dei video corsi, scrivimi un messaggio o chiamami.
Domande, prezzi, richieste, delucidazioni...tutto quello che ti serve. Cercherò di risponderti entro le 24h.

Consenso al trattamento dei dati
Utilizzerò i tuoi dati (nome ed indirizzo mail) solo per inviarti gratuitamente via mail la newsletter mensile. Niente spam, niente scocciature, ti disiscrivi in un click quando vuoi.

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram