L’obiettivo principale della statistica è quello di fare una verifica di ipotesi. Ad esempio potresti condurre un esperimento per testare se un certo medicinale sia efficace contro il mal di testa. Tuttavia, è fondamentale che tale esperimento si possa ripetere ottenendo gli stessi risultati: se così non fosse, il test di ipotesi non avrebbe validità e nessuno lo prenderebbe in considerazione.
Un'ipotesi è una supposizione plausibile che riguarda un fenomeno che osservi nella realtà, e che intendi investigare. Esempi di ipotesi possono essere:
Insomma, qualsiasi cosa che sia testabile tramite esperimento o tramite rilevazione di osservazioni.
Quando congetturi un’ipotesi segui il seguente schema:
“Se…(faccio questo ad una variabile indipendente)... allora (accadrà questo alla variabile dipendente)”
Per esempio:
La tesi che si vuole verificare prende il nome di ipotesi nulla, e viene indicata con la notazione H0. Considerato un certo parametro 𝜗, l’ipotesi che tale parametro assuma il valore 𝜗0, cioè un numero, consiste sostanzialmente in questo test di ipotesi:
H0: 𝜗=𝜗0
Ti faccio un esempio concreto.
Supponi che vuoi collaudare se una moneta sia bilanciata, ossia se il numero di teste sia uguale al numero di croci ottenute effettuando un certo numero di lanci. Se indichi con p la probabilità che esca la faccia testa, l’ipotesi che la moneta sia bilanciata è
H0: p=0,5
Tale ipotesi si ritiene verosimile se il numero di teste e di croci ottenute nei diversi lanci non differisce troppo.
Per rifiutare o meno l'ipotesi nulla di partenza, in statistica devi quindi effettuare un test di ipotesi.
Per prima cosa devi calcolare lo stimatore Z del parametro 𝜗, che varia a seconda del parametro stesso. Nella tabella che segue, accanto ad ogni parametro, è indicato lo stimatore da considerare per il test di ipotesi.
Se vuoi approfondire questo argomento, guarda questa mia lezione gratuita in cui ti spiego le diverse proprietà degli stimatori.
Di seguito ti elenco i parametri che più frequentemente vengono sottoposti a verifica tramite test di ipotesi:
A seguire ti riassumo invece la procedura che devi implementare per condurre un test di ipotesi.
Vediamo ora i vari passaggi da seguire per effettuare un test di ipotesi.
Il primo passo è formulare l’ipotesi che vuoi verificare sul parametro della popolazione.
Prendendo a riferimento la tabella sopra, in base al parametro su cui stai verificando H0, il secondo passaggio è quello di calcolare la statistica test corrispondente.
Per effettuare questo calcolo devi:
Osserva che, per il calcolo di quest’ultimo, devi prima trovare la deviazione standard (s = deviazione standard del campione, oppure σ = deviazione standard della popolazione). Se non sai come calcolarla, fai riferimento all'articolo che ti ho linkato sopra.
Attenzione: scegli sempre un valore di 𝛼 che non superi mai lo 0,05. I più comuni sono 0,05 - 0,01 - 0,001.
Per trovare il valore critico dovrai fare riferimento alle tavole, ma dovrai scegliere la tavola da utilizzare analizzando la tua varianza della popolazione.
Se la varianza della popolazione è nota, puoi trovare il valore critico consultando le tavole della distribuzione normale in base al livello di significatività 𝛼 scelto.
Guardando la tavola qui in basso, il valore critico lo trovi incrociando riga e colonna corrispondente alla cella con valore (1-𝛼)/2.
Ad esempio, con 𝛼 = 0,05 dovrai trovare una probabilità di (1-𝛼)/2, corrispondente a 0,975, che si trova incrociando la riga 1,9 con la colonna 0,06 quindi Z = 1,96.
Ti riassumo i valori più comuni della tavola Z:
Se hai ancora dubbi su questo argomento, ti condivido gratuitamente questo video esplicativo su come leggere la tavola della distribuzione normale standardizzata, preso dal mio video corso di statistica realizzato per gli studenti universitari.
Se invece la varianza della popolazione è incognita e il campione è piccolo (n≤30) allora si ricorre ad un test t di Student.
In questa tavola, puoi trovare il valore critico incrociando la colonna contenente il valore di 𝛼 scelto e la riga indicante il numero dei gradi di libertà (gdl = n-k, dove k è il numero dei parametri da stimare).
Ad esempio, con 𝛼 = 0,05 e n = 21 dovrai trovare una probabilità di 𝛼/2 corrispondente a 0,025 che si trova incrociando la riga 20 (n-1) con la colonna 0,025 quindi T = 2,086.
Ti riassumo i valori più comuni della tavola T, ma attento: sono solo per N = 21 e quindi GDL = 20:
Hai notato qualcosa di particolare?
Nonostante abbia preso gli stessi valori di 𝛼 i valori della T sono sempre più grandi della Z, questo perché, avendo a che fare con piccoli campioni, la distribuzione T di Student è più variabile della normale standardizzata.
L'ultimo passaggio che devi seguire per condurre il test di ipotesi è prendere una decisione, cioè devi decidere se rifiutare o no H0.
Per i test parametrici si può seguire la seguente regola:
Nota che, nel caso in cui la relazione qui sopra non sia soddisfatta, non puoi concludere dicendo di accettare H0! Questo perché, essendo il test non significativo, non hai sufficienti prove per affermarlo.
Ma quindi, in quali situazioni puoi decidere di rifiutare l'ipotesi nulla?
Qualsiasi criterio di decisione circa l’accettazione o il rifiuto dell’ipotesi nulla comporta sempre il rischio di commettere uno dei due diversi tipi di errore:
Il rifiuto dell’ipotesi nulla avviene quando sussiste una differenza significativa tra i dati del campione e quelli della popolazione.
Ciò varia a seconda della tipologia di test che si conduce:
Rifiuto l'ipotesi nulla se: Ztest < -Zcritico oppure Ztest > Zcritico
Non rifiuto l'ipotesi nulla se: -Zcritico < Ztest < Zcritico
Rifiuto l'ipotesi nulla se: Ztest < -Zcritico
Non rifiuto l'ipotesi nulla se: Ztest > -Zcritico
Rifiuto l'ipotesi nulla se: Ztest > Zcritico
Non rifiuto l'ipotesi nulla se: Ztest < Zcritico
Qui di seguito ti lascio uno schema in cui puoi trovare, riassunte, le quattro situazioni che si possono presentare quando si effettua un test di ipotesi.
Se guardi con attenzione i grafici che ti ho mostrato precedentemente, vedrai che le zone colorate di grigio rappresentano le probabilità 𝛼. Quando effettui un test di ipotesi puoi andare a calcolare la probabilità in corrispondenza della statistica-test che si chiama appunto p-value.
Se questo valore di significatività lo confronti con il suo corrispettivo livello di significatività alfa, puoi stabilire se rifiutare l'ipotesi nulla o meno.
I risultati si interpretano tutti in questo modo, indipendentemente se il test di ipotesi è unilaterale destro, unilaterale sinistro o bilaterale.
Rifiuto l'ipotesi nulla se: p-value < 𝛼
Non rifiuto l'ipotesi nulla se: p-value > 𝛼
Se vuoi ripassare velocemente che cos'è il p-value, ti lascio questo mio video, in cui ti spiego questo concetto in modo chiaro e semplice utilizzando una metafora statistica.
Infine, un altro concetto fondamentale legato al test d'ipotesi è quello della potenza statistica, quindi la forza con la quale prendere una decisione. Significa dire quanto è più probabile che, quando l'ipotesi alternativa è vera, il test generi un risultato statisticamente significativo.
Il valore della potenza statistica si posiziona tra i due estremi 0 e 1, e più si avvicina ad 1 più il test sarà potente.
La potenza di un test dipende da alcuni specifici fattori, che devi tenere bene in considerazione:
Poichè la potenza di un test è legata anche alla sua capacità di mostrare le differenze, se queste esistono, un'altra sua caratteristica è che aumenta all'aumentare della numerosità del campione.
Alla potenza statistica è legato anche il concetto della power analysis, che viene effettuata all'inizio di ogni progetto per delineare qual è la numerosità campionaria adatta. Questo perchè, a seconda di ciò che il progetto andrà ad analizzare, può necessitare di un campione più ampio o più piccolo. Tutto è legato, infatti, all'effetto che sta prendendo in considerazione: se di base l'effetto è già "grande", allora sarà ben visibile su un campione anche ristretto, ma se l'effetto è "piccolo", invece, avrà bisogno di un campione più ampio per poter dimostrare in modo chiaro la sua potenza.
Un altro concetto fondamentale della power analysis è la differenza tra l'ipotesi di partenza e il risultato del campione, che ti spiegherò in questo esempio usando un test sulla media.
Proviamo a confrontare tra loro due aziende che producono pneumatici. La prima afferma che la durata media delle sue gomme è di 20.000 km, mentre la seconda che la durata media è di 22.000 km.
Per portare avanti questo test d'ipotesi dovremo confrontare la durata media in km delle gomme della prima azienda con quelle della seconda azienda, e vedere se, in effetti, quelle della seconda azienda durano 2.000 km in più.
Poichè, però, la differenza è ridotta e stiamo parlando di media, ci saranno pneumatici che durano più di 22.000 km ma anche che durano meno, per riuscire veramente a capire se le gomme della seconda azienda hanno una durata superiore a 20.000 (e quindi se l'ipotesi alternativa è vera) più ampio sarà il campione a cui avremo accesso per il nostro test di ipotesi più la nostra power analysis sarà veritiera, perchè potrà andare a misurare con precisione l'effetto.
Ma quindi è sempre preferibile avere un campione numeroso, indipendentemente dalla grandezza dell'effetto? Non proprio, perchè bisogna ricordare che, ovviamente, nella pratica un campione numeroso significa anche che sarà più lungo e costoso recuperare i dati che ti servono per le osservazioni.
Quindi un buon test è sempre un equilibrio tra efficacia e fattibilità.
TESTZ (Matrice;X;Sigma)
TESTT (Matrice1;Matrice2;Coda;Tipo)
TESTF (Matrice1;Matrice2)
Non esiste un comando specifico, ma ovviamente ogni statistica calcolata ha il suo test di riferimento
Il futuro è un'ipotesi, una congettura, una supposizione, cioè una non-realtà. Tutt'al più, una speranza alla quale tentiamo di dar corpo coi sogni e le fantasie.
(ORIANA FALLACI - Scrittrice italiana)