adriano gilardone Docente di Statistica Matematica Excel Spss sfruttare excel consulenze statistiche lezione videocorsi

blog

blog

Test di ipotesi: 2 modi per procedere

YouTube video
Postato il 3 Dicembre 2021
Tag

L’obiettivo principale della statistica è quello di fare una verifica di ipotesi. Ad esempio potresti condurre un esperimento per testare se un certo medicinale sia efficace contro il mal di testa. Tuttavia, è fondamentale che tale esperimento si possa ripetere ottenendo gli stessi risultati: se così non fosse, il test di ipotesi non avrebbe validità e nessuno lo prenderebbe in considerazione.

corso statistica

Cos’è un’ipotesi

Un'ipotesi è una supposizione plausibile che riguarda un fenomeno che osservi nella realtà, e che intendi investigare. Esempi di ipotesi possono essere:

  • una nuova medicina che pensi sia più efficace per la cura di una malattia
  • un modo di insegnare che credi sia migliore
  • un possibile habitat per una nuova specie animale o vegetale
  • Il cambiamento del colore della luce che abbia un effetto sulle piante

Insomma, qualsiasi cosa che sia testabile tramite esperimento o tramite rilevazione di osservazioni.

Quando congetturi un’ipotesi segui il seguente schema:

“Se…(faccio questo ad una variabile indipendente)... allora (accadrà questo alla variabile dipendente)”

Per esempio:

  • Se aumento la quantità di acqua alle piante allora le piante cresceranno di dimensioni
  • Se oltre la medicazione offro consulenza ai pazienti allora la loro depressione diminuirà
  • Se faccio l’esame a mezzogiorno piuttosto che alle sette allora il voto sarà più alto

L'ipotesi nulla

La tesi che si vuole verificare prende il nome di ipotesi nulla, e viene indicata con la notazione H0. Considerato un certo parametro 𝜗, l’ipotesi che tale parametro assuma il valore 𝜗0, cioè un numero, consiste sostanzialmente in questo test di ipotesi:

H0: 𝜗=𝜗0 

Ti faccio un esempio concreto.

Supponi che vuoi collaudare se una moneta sia bilanciata, ossia se il numero di teste sia uguale al numero di croci ottenute effettuando un certo numero di lanci. Se indichi con p la probabilità che esca la faccia testa, l’ipotesi che la moneta sia bilanciata è

H0: p=0,5 

Tale ipotesi si ritiene verosimile se il numero di teste e di croci ottenute nei diversi lanci non differisce troppo.

Lo stimatore Z

Per rifiutare o meno l'ipotesi nulla di partenza, in statistica devi quindi effettuare un test di ipotesi.

Per prima cosa devi calcolare lo stimatore Z del parametro 𝜗, che varia a seconda del parametro stesso. Nella tabella che segue, accanto ad ogni parametro, è indicato lo stimatore da considerare per il test di ipotesi.

Test di ipotesi
Stimatore Z e Stimatore T

Se vuoi approfondire questo argomento, guarda questa mia lezione gratuita in cui ti spiego le diverse proprietà degli stimatori.

YouTube video
Le proprietà degli stimatori

I test di ipotesi più comuni

Di seguito ti elenco i parametri che più frequentemente vengono sottoposti a verifica tramite test di ipotesi:

  • media del campione singolo
  • differenza tra due medie di campioni indipendenti
  • differenza tra due medie di campioni dipendenti (o accoppiati o appaiati)
  • proporzione
  • differenza tra proporzioni di due gruppi di dati

A seguire ti riassumo invece la procedura che devi implementare per condurre un test di ipotesi.

corso statistica

Come condurre un test di ipotesi

Vediamo ora i vari passaggi da seguire per effettuare un test di ipotesi.

Formula l’ipotesi nulla

Il primo passo è formulare l’ipotesi che vuoi verificare sul parametro della popolazione.

Calcola la statistica test (Z, T,...)

Prendendo a riferimento la tabella sopra, in base al parametro su cui stai verificando H0, il secondo passaggio è quello di calcolare la statistica test corrispondente.

Per effettuare questo calcolo devi:

  • Calcolare la stima campionaria
  • Sottrarre il valore del parametro della popolazione
  • Dividere tutto per l’errore standard

Osserva che, per il calcolo di quest’ultimo, devi prima trovare la deviazione standard (s = deviazione standard del campione, oppure σ = deviazione standard della popolazione). Se non sai come calcolarla, fai riferimento all'articolo che ti ho linkato sopra.

Scegli il livello di significatività alfa

Attenzione: scegli sempre un valore di 𝛼 che non superi mai lo 0,05. I più comuni sono 0,05 - 0,01 - 0,001.

Trova il valore critico sulle tavole

Per trovare il valore critico dovrai fare riferimento alle tavole, ma dovrai scegliere la tavola da utilizzare analizzando la tua varianza della popolazione.

Se la varianza della popolazione è nota, puoi trovare il valore critico consultando le tavole della distribuzione normale in base al livello di significatività 𝛼 scelto.

Guardando la tavola qui in basso, il valore critico lo trovi incrociando riga e colonna corrispondente alla cella con valore (1-𝛼)/2.

Ad esempio, con 𝛼 = 0,05 dovrai trovare una probabilità di (1-𝛼)/2, corrispondente a 0,975, che si trova incrociando la riga 1,9 con la colonna 0,06 quindi Z = 1,96.

Ti riassumo i valori più comuni della tavola Z:

  • 𝛼 = 0,05: probabilità da cercare = 0,975, valore Z sulla tavola = 1,96
  • 𝛼 = 0,01: probabilità da cercare = 0,995, valore Z sulla tavola = 2,58
  • 𝛼 = 0,001: probabilità da cercare = 0,9995, valore Z sulla tavola = 3,29
tavola normale standardizzata
Tavola della distribuzione normale standardizzata

Se hai ancora dubbi su questo argomento, ti condivido gratuitamente questo video esplicativo su come leggere la tavola della distribuzione normale standardizzata, preso dal mio video corso di statistica realizzato per gli studenti universitari.

YouTube video
Come leggere la tavola Z della normale standardizzata

Se invece la varianza della popolazione è incognita e il campione è piccolo (n≤30)  allora si ricorre ad un test t di Student.

In questa tavola, puoi trovare il valore critico incrociando la colonna contenente il valore di 𝛼 scelto e la riga indicante il numero dei gradi di libertà (gdl = n-k, dove k è il numero dei parametri da stimare).

Ad esempio, con 𝛼 = 0,05 e n = 21 dovrai trovare una probabilità di 𝛼/2 corrispondente a 0,025 che si trova incrociando la riga 20 (n-1) con la colonna 0,025 quindi T = 2,086.

Ti riassumo i valori più comuni della tavola T, ma attento: sono solo per N = 21 e quindi GDL = 20:

  • 𝛼 = 0,05 - probabilità da cercare = 0,025, valore T sulla tavola = 2,0860
  • 𝛼 = 0,01 - probabilità da cercare = 0,005, valore T sulla tavola = 2,8453
  • 𝛼 = 0,001 - probabilità da cercare = 0,0005, valore T sulla tavola = 3,8495

Hai notato qualcosa di particolare?

Nonostante abbia preso gli stessi valori di 𝛼 i valori della T sono sempre più grandi della Z, questo perché, avendo a che fare con piccoli campioni, la distribuzione T di Student è più variabile della normale standardizzata.

Tavola t-student
Tavola della T di Student

Prendi una decisione

L'ultimo passaggio che devi seguire per condurre il test di ipotesi è prendere una decisione, cioè devi decidere se rifiutare o no H0.

Per i test parametrici si può seguire la seguente regola:

  • Rifiuta l’ipotesi nulla H0 se il valore assoluto dalla statistica test è maggiore del valore critico |Z| > z(1-𝛼)/2 o |T| > t𝛼/2

Nota che, nel caso in cui la relazione qui sopra non sia soddisfatta, non puoi concludere dicendo di accettare H0! Questo perché, essendo il test non significativo, non hai sufficienti prove per affermarlo.

analisi dati tesi

Quando rifiutare l’ipotesi nulla

Ma quindi, in quali situazioni puoi decidere di rifiutare l'ipotesi nulla?

Metodo 1: Statistica-test vs Valore critico

Qualsiasi criterio di decisione circa l’accettazione o il rifiuto dell’ipotesi nulla comporta sempre il rischio di commettere uno dei due diversi tipi di errore:

  • Rifiutare l’ipotesi nulla quando è vera (𝛼 = Errore di primo tipo)
  • Accettare l'ipotesi nulla quando è falsa (β = Errore di secondo tipo)

Il rifiuto dell’ipotesi nulla avviene quando sussiste una differenza significativa tra i dati del campione e quelli della popolazione.

Ciò varia a seconda della tipologia di test che si conduce:

Test di ipotesi bilaterale

Rifiuto l'ipotesi nulla se: Ztest < -Zcritico oppure Ztest > Zcritico

Non rifiuto l'ipotesi nulla se: -Zcritico < Ztest < Zcritico

Test di ipotesi bilaterale

Test di ipotesi unilaterale sinistro

Rifiuto l'ipotesi nulla se: Ztest < -Zcritico

Non rifiuto l'ipotesi nulla se: Ztest > -Zcritico

Test unilaterale sinistro

Test di ipotesi unilaterale destro

Rifiuto l'ipotesi nulla se: Ztest > Zcritico

Non rifiuto l'ipotesi nulla se: Ztest < Zcritico

Test unilaterale destro

Qui di seguito ti lascio uno schema in cui puoi trovare, riassunte, le quattro situazioni che si possono presentare quando si effettua un test di ipotesi.

Le quattro situazioni possibili del test di ipotesi

Metodo 2: P-value vs Valore alfa

Se guardi con attenzione i grafici che ti ho mostrato precedentemente, vedrai che le zone colorate di grigio rappresentano le probabilità 𝛼. Quando effettui un test di ipotesi puoi andare a calcolare la probabilità in corrispondenza della statistica-test che si chiama appunto p-value.

Se questo valore di significatività lo confronti con il suo corrispettivo livello di significatività alfa, puoi stabilire se rifiutare l'ipotesi nulla o meno.

I risultati si interpretano tutti in questo modo, indipendentemente se il test di ipotesi è unilaterale destro, unilaterale sinistro o bilaterale.

Rifiuto l'ipotesi nulla se: p-value < 𝛼

Non rifiuto l'ipotesi nulla se: p-value > 𝛼

Se vuoi ripassare velocemente che cos'è il p-value, ti lascio questo mio video, in cui ti spiego questo concetto in modo chiaro e semplice utilizzando una metafora statistica.

YouTube video
Il p-value spiegato semplice con una metafora

La potenza statistica

Infine, un altro concetto fondamentale legato al test d'ipotesi è quello della potenza statistica, quindi la forza con la quale prendere una decisione. Significa dire quanto è più probabile che, quando l'ipotesi alternativa è vera, il test generi un risultato statisticamente significativo.

Il valore della potenza statistica si posiziona tra i due estremi 0 e 1, e più si avvicina ad 1 più il test sarà potente.

La potenza di un test dipende da alcuni specifici fattori, che devi tenere bene in considerazione:

  1. la numerosità del campione
  2. la variabilità del fenomeno
  3. la differenza minima che si vuole mettere in evidenza
  4. il livello di significatività adottato

Poichè la potenza di un test è legata anche alla sua capacità di mostrare le differenze, se queste esistono, un'altra sua caratteristica è che aumenta all'aumentare della numerosità del campione.

Alla potenza statistica è legato anche il concetto della power analysis, che viene effettuata all'inizio di ogni progetto per delineare qual è la numerosità campionaria adatta. Questo perchè, a seconda di ciò che il progetto andrà ad analizzare, può necessitare di un campione più ampio o più piccolo. Tutto è legato, infatti, all'effetto che sta prendendo in considerazione: se di base l'effetto è già "grande", allora sarà ben visibile su un campione anche ristretto, ma se l'effetto è "piccolo", invece, avrà bisogno di un campione più ampio per poter dimostrare in modo chiaro la sua potenza.

Un altro concetto fondamentale della power analysis è la differenza tra l'ipotesi di partenza e il risultato del campione, che ti spiegherò in questo esempio usando un test sulla media.

Proviamo a confrontare tra loro due aziende che producono pneumatici. La prima afferma che la durata media delle sue gomme è di 20.000 km, mentre la seconda che la durata media è di 22.000 km.

  • Ipotesi nulla --> H0 : μ = 20.000 km
  • Ipotesi alternativa --> H1 : μ > 20.000 km

Per portare avanti questo test d'ipotesi dovremo confrontare la durata media in km delle gomme della prima azienda con quelle della seconda azienda, e vedere se, in effetti, quelle della seconda azienda durano 2.000 km in più.

corso statistica

Poichè, però, la differenza è ridotta e stiamo parlando di media, ci saranno pneumatici che durano più di 22.000 km ma anche che durano meno, per riuscire veramente a capire se le gomme della seconda azienda hanno una durata superiore a 20.000 (e quindi se l'ipotesi alternativa è vera) più ampio sarà il campione a cui avremo accesso per il nostro test di ipotesi più la nostra power analysis sarà veritiera, perchè potrà andare a misurare con precisione l'effetto.

Ma quindi è sempre preferibile avere un campione numeroso, indipendentemente dalla grandezza dell'effetto? Non proprio, perchè bisogna ricordare che, ovviamente, nella pratica un campione numeroso significa anche che sarà più lungo e costoso recuperare i dati che ti servono per le osservazioni.
Quindi un buon test è sempre un equilibrio tra efficacia e fattibilità.

Test di ipotesi EXCEL

TESTZ (Matrice;X;Sigma)

TESTT (Matrice1;Matrice2;Coda;Tipo)

TESTF (Matrice1;Matrice2)

Test di ipotesi SPSS

Non esiste un comando specifico, ma ovviamente ogni statistica calcolata ha il suo test di riferimento

Riassumendo

  • Il test di ipotesi serve per verificare un parametro della popolazione attraverso una stima campionaria
  • L’ipotesi nulla di partenza, detta H0 , è la tesi che vuoi sottoporre a verifica e contiene il parametro della popolazione inclusa nell’indagine
  • L’esito del test di ipotesi, ossia il rifiuto o meno dell’ipotesi nulla, viene deciso confrontando il valore della statistica test con quello del valore critico oppure il p-value con il valore 𝛼
  • Non rifiutare l’ipotesi nulla non significa accettarla!

Il futuro è un'ipotesi, una congettura, una supposizione, cioè una non-realtà. Tutt'al più, una speranza alla quale tentiamo di dar corpo coi sogni e le fantasie.

(ORIANA FALLACI - Scrittrice italiana)

Ripetizioni private

Ho intrapreso una interessante collaborazione con il sito di TROVAPROF.IT

Questa start-up mette in relazione studenti che cercano lezioni private con professori di qualsiasi materia. Se stai cercano delle ripetizioni per le materie che non tratto io, allora ti consiglio di fare un salto su TROVAPROF.IT, un portale completamente gratuito per dare o ricevere lezioni private.

Iscriviti alla Newsletter

Se hai bisogno d’informazioni che non hai trovato nella sezione servizi o dei video corsi, scrivimi un messaggio o chiamami.
Domande, prezzi, richieste, delucidazioni...tutto quello che ti serve. Cercherò di risponderti entro le 24h.
Newsletter

Consenso al trattamento dei dati
Utilizzerò i tuoi dati (nome ed indirizzo mail) solo per inviarti gratuitamente via mail la newsletter mensile. Niente spam, niente scocciature, ti disiscrivi in un click quando vuoi.

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram