fbpx

Test del Chi-quadrato di indipendenza

Postato il 25 Ottobre 2021
Tag

Il sistema di ipotesi

Il test del Chi-quadrato di indipendenza è un test non parametrico che si effettua con lo scopo di verificare se esiste associazione, o dipendenza, tra due variabili categoriche. Il sistema d’ipotesi del test è il seguente:

  • H0 (ipotesi nulla): La Variabile 1 è indipendente dalla Variabile 2
  • H1 (ipotesi alternativa): La Variabile 1 non è indipendente dalla Variabile 2

Per condurre il test devi disporre le due variabili qualitative su una tabella di contingenza chiamata anche cross-tabulation, crosstab oppure two-way table, in cui nelle righe metti le modalità della Variabile 1, mentre nelle colonne quelle della Variabile 2. 

In tal modo ogni cella della tabella riporta il numero di osservazioni (frequenze osservate congiunte) per una specifica coppia di modalità. Un esempio di tabella di contingenza con i risultati del test è mostrato qui sotto:

Test chi-quadrato

Come interpretare il test del Chi-Quadrato

Calcolo del test del Chi-quadrato

Il procedimento del calcolo del chi-quadrato te l’ho spiegato in questo articolo. Se non conosci la procedura di calcolo ti invito a leggerlo perché quel valore si riferisce al test che devi valutare ed è il punto di partenza.

Tale statistica è una variabile con distribuzione chi-quadro con (r-1) * (c-1) gradi di libertà, dove r e c sono rispettivamente il numero di righe e di colonne della tabella di contingenza, ossia, il numero di modalità della prima variabile e il numero di modalità della seconda variabile.

Ricorda che la statistica-test non assume mai valori negativi e per capire se accettare o rifiutare l’ipotesi nulla di partenza dovrai confrontare questo valore con il valore teorico che trovi sulle tavole della distribuzione chi-quadrato.

Lettura della tavola del Chi-quadrato

tavola chi-quadrato
  • Scegli un valore prefissato alfa che nella tavola si trova sulle colonne. (esempio: alfa = 0,05)
  • Calcola i gradi di libertà facendo (r-1) * (c-1) che nella tavola si trovano sulle righe (gdl = 1 * 1 = 1)
  • Incrocia i due valori e all’interno della tavola troverai il valore teorico da confrontare con la statistica-test. (Chi-quadro teorico = 3,84)

Esito del test con la tavola del Chi-quadrato

  • Se il test è maggiore del valore teorico, allora rifiuti H0 affermando che le due variabili possono essere considerate dipendenti a livello = 0.05
  • Se il test è minore del valore teorico, allora non rifiuti H0 e asserisci che non è possibile concludere che le due variabili siano dipendenti.

Esito del test con il p-value

Alternativamente al confronto tra test e valore critico, puoi procedere al confronto tra  il p-value e il livello di significatività alfa.

Il p-value, o valore p è la probabilità di ottenere uno specifico insieme di osservazioni nel caso in cui l’ipotesi nulla fosse vera. Questo numero viene calcolato a partire da un test statistico basato appunto sui risultati osservati.

Per un maggior approfondimento ti rimando al mio articolo qui.

  • Se il p-value è minore del livello di significatività prefissato, allora rifiuti H0 affermando che le due variabili possono essere considerate dipendenti a livello = 0.05
  • Se il p-value è maggiore del livello di significatività prefissato, allora non rifiuti H0 e asserisci che non è possibile concludere che le due variabili siano dipendenti.

Problemi con il test del Chi-quadrato

Poche frequenze

I risultati del test del Chi-quadrato d'indipendenza non sono attendibili quando nella tabella di contingenza delle frequenze attese (o teoriche) compaiono celle con frequenza minore o uguale a 5. Se si presenta tale situazione puoi rimediare in due modi:

  1. Ingrandendo il campione delle osservazioni.
  2. Accorpare due o più categorie in una nuova categoria in modo da ottenere una frequenza assoluta maggiore.

Troppe frequenze

Un altro limite del test si ha quando le frequenze osservate sono molto grandi. Per capire meglio la questione ti riporto qui di seguito un esempio.

Riprendendo la tabella iniziale, i risultati erano i seguenti:

test chi-quadro

Se per assurdo dovessi dividere tutte le celle presenti per 100, ti ritroveresti ad avere le stesse proporzioni solo con un campione che è un decimo del precedente. A questo punto ricalcola il test del Chi-Quadrato con il relativo p-value. Cosa notii?

test del chi-quadrato

Noti che il valore del chi-quadro è uguale a quello di prima diviso 100, ma il p-value (0,136) non è significativo dato che supera la soglia alfa del 0,05.

La situazione analizzata nei due casi è la stessa, infatti, avendo diviso per 100 tutti i valori, ciascuna cella mantiene la stessa distribuzione parziale rispetto al proprio totale di riga o di colonna

Quindi il secondo test non può essere considerato significativo nonostante le distribuzioni condizionate siano identiche. 

BONUS VIDEO: Se vuoi vedere un esempio caratteristiche di una tabella a doppia entrata puoi guardarti questo mio video tratto dal mio videocorso di statistica bivariata.

COMANDI SOFTWARE:

  • Test d’indipendenza Chi quadrato EXCEL: TEST.CHI.QUAD(Int_effettivo;Int_previsto) N.B. viene restituito il p-value calcolato sul valore del chi-quadro che però non viene mostrato
  • Test d’indipendenza Chi quadrato SPSS: Analizza_Statistiche descrittive_Tabelle di contingenza

Riassumendo

  • Il test del Chi quadro è un test non parametrico utilizzato per verificare se c’è indipendenza tra due caratteri qualitativi (fenomeni nominali o ordinali)
  • Le frequenze attese di ogni cella devono essere maggiori o uguali a 5
  • La numerosità totale della tabella non deve essere eccessivamente grande
  • La statistica-test assume sempre valori maggiori o uguali a 0. Più è grande e più ci sarà associazione tra le due variabili. Più si avvicina a 0 e più si va verso la situazione di indipendenza stocastica

Se il denaro è la tua speranza per l'indipendenza, non ne avrai mai. La sola vera sicurezza che un uomo può avere a questo mondo è una scorta di conoscenza, esperienza e capacità.

(Henry Ford)

Iscriviti alla Newsletter

Se hai bisogno d’informazioni che non hai trovato nella sezione servizi o dei video corsi, scrivimi un messaggio o chiamami.
Domande, prezzi, richieste, delucidazioni...tutto quello che ti serve. Cercherò di risponderti entro le 24h.

Consenso al trattamento dei dati
Utilizzerò i tuoi dati (nome ed indirizzo mail) solo per inviarti gratuitamente via mail la newsletter mensile. Niente spam, niente scocciature, ti disiscrivi in un click quando vuoi.

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram