adriano gilardone Docente di Statistica Matematica Excel Spss sfruttare excel consulenze statistiche lezione videocorsi

Test del Chi-quadrato

YouTube video
Postato il 25 Ottobre 2021
Tag

Il sistema di ipotesi

Il test del Chi-quadrato di indipendenza è un test non parametrico che si effettua con lo scopo di verificare se esiste associazione, o dipendenza, tra due variabili categoriche.

Il sistema d’ipotesi del test è il seguente:

  • H0 (ipotesi nulla): La Variabile 1 è indipendente dalla Variabile 2
  • H1 (ipotesi alternativa): La Variabile 1 non è indipendente dalla Variabile 2

Caratteri dipendenti e indipendenti in distribuzione

Partiamo però facendo una precisazione, e vedendo qual è la differenza tra caratteri dipendenti e indipendenti in distribuzione.
Molto semplicemente, indipendenti in distribuzione significa che, al cambiare della categoria di un primo fenomeno, indipendentemente dalla modalità selezionata, il secondo fenomeno avrà comunque la stessa distribuzione percentuale.
Facciamo un esempio pratico, osservando due gruppi, uno formato da 10 persone che abitano in città e uno da 10 persone che abitano in campagna. Se alla domanda "Usi la macchina tutti i giorni della settimana?" sia il gruppo 1 (i cittadini) che il gruppo 2 (i campagnoli) hanno risposto al 60% con "sì" e al 40% con "no", allora si diranno totalmente indipendenti in distribuzione.

Vediamo ora il contrario, cioè due caratteri totalmente dipendenti in distribuzione.
Prendendo ancora lo stesso esempio, immaginiamo che, questa volta, quelli che abitano in città abbiano risposto al 100% con "no" e allo 0% con "sì", e viceversa quelli che abitano in campagna, 0% "no" e 100% "sì". Diremo quindi che i due fenomeni saranno in totale dipendenza in distribuzione.

Per comprendere meglio i caratteri dipendenti e indipendenti in distribuzione, ma anche il significato dell'indice Chi Quadrato, ti metto a disposizione un'altra lezione gratuita nel quale ti spiego le distribuzioni condizionate per riga (o per colonna) che concettualmente servono per l'interpretazione del risultato.

YouTube video
Dipendenza in distribuzione

I dati e la tabella di contingenza

Per condurre il test devi disporre le due variabili qualitative su una tabella di contingenza chiamata anche cross-tabulation, crosstab oppure two-way table, in cui nelle righe metti le modalità della Variabile 1, mentre nelle colonne quelle della Variabile 2. 

In tal modo ogni cella della tabella riporta il numero di osservazioni (frequenze osservate congiunte) per una specifica coppia di modalità. Un esempio di tabella di contingenza con i risultati del test è mostrato qui sotto:

Test chi-quadrato
Tabella di contingenza

Come interpretare il test del Chi-Quadrato

Calcolo del test del Chi-quadrato

Ho precedentemente spiegato il procedimento del calcolo del Chi-quadrato in questo articolo: se non conosci la procedura di calcolo ti invito a leggerlo perché quel valore si riferisce al test che devi valutare, ed è quindi il punto di partenza che devi avere ben presente.

Tale statistica è una variabile con distribuzione Chi-quadro con (r-1) * (c-1) gradi di libertà, dove r e c sono rispettivamente il numero di righe e di colonne della tabella di contingenza, ossia, il numero di modalità della prima variabile e il numero di modalità della seconda variabile.

Ricorda che la statistica-test non assume mai valori negativi, e per capire se accettare o rifiutare l’ipotesi nulla di partenza dovrai confrontare questo valore con il valore teorico che trovi sulle tavole della distribuzione chi-quadrato.

Lettura della tavola del Chi-quadrato

tavola chi-quadrato
Tavola chi-quadrato
  • Scegli un valore prefissato alfa che nella tavola si trova sulle colonne. (esempio: alfa = 0,05)
  • Calcola i gradi di libertà facendo (r-1) * (c-1) che nella tavola si trovano sulle righe (gdl = 1 * 1 = 1)
  • Incrocia i due valori e all’interno della tavola troverai il valore teorico da confrontare con la statistica-test. (Chi-quadro teorico = 3,84)

Esito del test del Chi-quadrato con la tavola

  • Se il test è maggiore del valore teorico, allora rifiuti H0 affermando che le due variabili possono essere considerate dipendenti a livello = 0.05
  • Se il test è minore del valore teorico, allora non rifiuti H0 e asserisci che non è possibile concludere che le due variabili siano dipendenti.à

Esito del test del Chi-quadrato con il p-value

Alternativamente al confronto tra test e valore critico, puoi procedere al confronto tra  il p-value e il livello di significatività alfa.

Il p-value, o valore p, è la probabilità di ottenere uno specifico insieme di osservazioni nel caso in cui l’ipotesi nulla fosse vera. Questo numero viene calcolato a partire da un test statistico basato appunto sui risultati osservati.

  • Se il p-value è minore del livello di significatività prefissato, allora rifiuti H0 affermando che le due variabili possono essere considerate dipendenti a livello = 0.05
  • Se il p-value è maggiore del livello di significatività prefissato, allora non rifiuti H0 e asserisci che non è possibile concludere che le due variabili siano dipendenti.
YouTube video
P-value spiegato semplice con una metafora

Problemi con il test del Chi-quadrato

Vediamo ora quali problemi potresti incontrare quando effettui il test del Chi-quadrato.

Poche frequenze

I risultati del test del Chi-quadrato d'indipendenza non sono attendibili quando nella tabella di contingenza delle frequenze attese (o teoriche) compaiono celle con frequenza minore o uguale a 5. Se si presenta tale situazione puoi rimediare in due modi:

  1. Ingrandendo il campione delle osservazioni.
  2. Accorpare due o più categorie in una nuova categoria in modo da ottenere una frequenza assoluta maggiore.

Troppe frequenze

Un altro limite del test si ha quando le frequenze osservate sono molto grandi. Per capire meglio la questione ti riporto qui di seguito un esempio.

Riprendendo la tabella iniziale, i risultati erano i seguenti:

test chi-quadro

Se per assurdo dovessi dividere tutte le celle presenti per 100, ti ritroveresti ad avere le stesse proporzioni, solo con un campione che è un decimo del precedente. A questo punto ricalcola il test del Chi-Quadrato con il relativo p-value. Cosa noti?

test del chi-quadrato

Noti che il valore del chi-quadro è uguale a quello di prima diviso 100, ma il p-value (0,136) non è significativo dato che supera la soglia alfa del 0,05.

La situazione analizzata nei due casi è la stessa, infatti, avendo diviso per 100 tutti i valori, ciascuna cella mantiene la stessa distribuzione parziale rispetto al proprio totale di riga o di colonna.

Quindi il secondo test non può essere considerato significativo nonostante le distribuzioni condizionate siano identiche. 

La V di Cramer

Questo argomento si lega a doppio filo con un altro, cioè quello dell'indice V di Cramer.

La V di Cramer è uno degli indici utilizzati per mostrare l'intensità del grado di connessione tra due caratteri qualitativi, ed è proprio questa sua caratteristica che la collega al test del Chi-quadrato.

Il test, infatti, come abbiamo sottolineato all'inizio dell'articolo si limita a verificare se esiste associazione, o dipendenza, tra due variabili, ma non calcola quanto è intensa questa connessione, che è proprio lo scopo, invece, di questo indice.

La V di Cramer avrà un valore che si trova tra 0, che indica l'indipendenza statistica (non esiste connessione) a 1, che viene definita totale dipendenza in distribuzione.

Altri indici di connessione

In statistica ci sono numerosi indici di connessione, alcuni dei quali non si basano sull'indice del Chi-quadrato, come per esempio l'indice di Mortara (M). Qui di seguito ti elenco altri indici nella cui formula è presente il Chi-quadro:

  • Indice di contingenza quadratica media2)
  • Indice Phi, media quadratica delle contingenze (Φ)
  • Indice di Tschuprow (T)
  • Indice Chi quadrato di Pearson normalizzato2N)

Infine, se ancora non sei certo di avere capito questo argomento in modo esaustivo, nel video iniziale puoi trovare il test del Chi-quadro spiegato semplice attraverso una metafora!

Inoltre, se vuoi vedere un esempio caratteristico di una tabella a doppia entrata, guarda questo mio video tratto dal mio videocorso di statistica bivariata.

Test del Chi-quadrato EXCEL

TEST.CHI.QUAD (Int_effettivo;Int_previsto)
N.B. viene restituito il p-value calcolato sul valore del chi-quadro che però non viene mostrato

Test del Chi-quadrato SPSS

Analizza >>> Statistiche descrittive >>> Tabelle di contingenza

YouTube video
Intro test del chi-quadrato corso SPSS

Riassumendo

  • Il test del Chi-quadrato è un test non parametrico utilizzato per verificare se c’è indipendenza tra due caratteri qualitativi (fenomeni nominali o ordinali)
  • Le frequenze attese di ogni cella devono essere maggiori o uguali a 5
  • La numerosità totale della tabella non deve essere eccessivamente grande
  • La statistica-test assume sempre valori maggiori o uguali a 0. Più è grande e più ci sarà associazione tra le due variabili. Più si avvicina a 0 e più si va verso la situazione di indipendenza stocastica

Se il denaro è la tua speranza per l'indipendenza, non ne avrai mai. La sola vera sicurezza che un uomo può avere a questo mondo è una scorta di conoscenza, esperienza e capacità.

(Henry Ford)

Ripetizioni private

Ho intrapreso una interessante collaborazione con il sito di TROVAPROF.IT

Questa start-up mette in relazione studenti che cercano lezioni private con professori di qualsiasi materia. Se stai cercano delle ripetizioni per le materie che non tratto io, allora ti consiglio di fare un salto su TROVAPROF.IT, un portale completamente gratuito per dare o ricevere lezioni private.

Iscriviti alla Newsletter

Se hai bisogno d’informazioni che non hai trovato nella sezione servizi o dei video corsi, scrivimi un messaggio o chiamami.
Domande, prezzi, richieste, delucidazioni...tutto quello che ti serve. Cercherò di risponderti entro le 24h.
Newsletter

Consenso al trattamento dei dati
Utilizzerò i tuoi dati (nome ed indirizzo mail) solo per inviarti gratuitamente via mail la newsletter mensile. Niente spam, niente scocciature, ti disiscrivi in un click quando vuoi.

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram