La curtosi è uno strumento statistico che serve per misurare l'altezza di una distribuzione unimodale rispetto alla distribuzione normale.
Ma questo il tuo professore dovrebbe avertelo già piegato, vero?
In questo articolo, ti spiego in modo pratico la curtosi in statistica, spiegando come si calcola e cosa indica, per aiutarti a padroneggiare questo argomento e affrontare con sicurezza domande d'esame ed esercizi.
Prima però, se vuoi studiare statistica con me e superare finalmente il tuo esame, ho un regalo per te.
La curtosi ti dice quanto è “alta” la curva che rappresenta una distribuzione unimodale.
Misura quanto i valori di un dataset si concentrano attorno alla media e quanto spesso si verificano valori estremamente alti o bassi.
Se è alta, significa che i dati sono concentrati attorno alla media, ma che ci sono valori estremi (code pesanti).
Se è bassa, significa che i dati sono più dispersi intorno alla media, ma che i valori estremi sono rari (code leggere).
Curtosi e asimmetria sono complementari e forniscono una visione completa della forma di una distribuzione, ma non sono la stessa cosa. Vediamo le differenze.
Come ho spiegato in questo articolo, l'asimmetria descrive la direzione della distribuzione. Se i dati sono "skewed" a destra o a sinistra, l'asimmetria indica quale parte della distribuzione ha la coda più lunga.
Ad esempio, in una distribuzione di redditi, spesso si osserva una asimmetria positiva perché la maggior parte delle persone guadagna meno della media, con pochi individui che guadagnano molto di più.
Descrive la concentrazione dei valori attorno alla media e la frequenza dei valori estremi.
Tornando all’esempio precedente sulla distribuzione di redditi, una curtosi elevata potrebbe indicare che ci sono molti valori estremamente alti o bassi (più outlier), mentre se bassa potrebbe indicare una distribuzione più uniforme, con meno outlier.
Somma tutti i valori e dividila per il numero totale di osservazioni (N).
Prendi ogni valore della distribuzione e sottrai la media.
Prendi ogni differenza calcolata ed elevala al quadrato.
Prendi ogni differenza calcolata ed elevala alla quarta.
Prendi il valore appena calcolato e dividilo per N:
Prendi la somma degli scarti dalla media elevati al quadrato, dividila per N, e prendi la radice quadrata del risultato.
Eleva la deviazione standard alla quarta potenza.
Ora che sai come calcolare la curtosi, è bene che tu impari anche come va interpretata.
Può avere un valore maggiore, uguale o minore di zero. È questo valore a indicarci il tipo di curtosi con cui abbiamo a che fare.
Indica una distribuzione con un picco alto e code pesanti.
Questo significa che i dati sono altamente concentrati attorno alla media e che c'è una maggiore frequenza di valori estremi. In pratica, una distribuzione leptocurtica è più "appuntita" e ha più probabilità di produrre outlier.
Un esempio potrebbe essere i rendimenti di un portafoglio ad alto rischio, dove ci sono frequenti picchi di guadagni e perdite.
Tipica di una distribuzione normale, dove la curtosi è appunto zero.
Questo significa che la distribuzione ha una forma intermedia tra leptocurtosi e platicurtosi, con una frequenza di valori estremi simile a quella di una distribuzione normale.
Un esempio potrebbe essere i punteggi di un test standardizzato, dove i dati sono distribuiti normalmente attorno alla media.
Rappresenta una distribuzione con un picco piatto e code leggere.
Questo indica che i dati sono meno concentrati attorno alla media e che ci sono meno valori estremi.
In altre parole, i dati sono più uniformemente distribuiti.
Un esempio potrebbe essere le misurazioni di una caratteristica fisica, come l'altezza delle persone in una popolazione, dove le variazioni estreme sono rare.
Dare forma graficamente alla curtosi aiuta a visualizzare la "puntezza" e la frequenza dei valori estremi di una distribuzione.
Quali grafici utilizzare?
Un grafico a campana, o curva di densità, fornisce una rappresentazione visiva della distribuzione dei dati, simile all'istogramma ma con una linea continua.
Sono i grafici che ti ho mostrato prima che mostrano chiaramente quanto la distribuzione sia più o meno appuntita e la frequenza dei valori estremi. È utile per confrontare diverse distribuzioni.
Un istogramma è un ottimo punto di partenza per visualizzare la distribuzione dei dati. Puoi osservare la forma della distribuzione, identificare la concentrazione dei valori attorno alla media e individuare eventuali valori estremi.
Si usa quanto i dati sono numeri naturali ma nella pratica anche con numeri reali continui
Questo grafico sovrappone più distribuzioni per fare un confronto diretto.
Ad esempio, puoi tracciare una distribuzione normale accanto a una distribuzione leptocurtica o una platicurtica per vedere le differenze.
CURTOSI (Num1, Num2,...)
Analizza >>> Statistiche descrittive >>> Frequenze
Analizza >>> Statistiche descrittive >>> Esplora