blog
Per comprendere bene le caratteristiche iniziali di un fenomeno è importante sapere quali sono i suoi indici di posizione. Per saperlo, in statistica si utilizzano i quartili, e oggi vedremo non solo cosa sono, ma anche come calcolarli.
Questo argomento è strettamente collegato al significato della mediana, come ho già accennato in questo articolo, spiegandoti che è il valore che divide in due una distribuzione. I quartili invece, come puoi immaginare dal nome, dividono in quattro parti uguali tutta la disitribuzione.
La condizione di partenza per poterli calcolare è che la variabile sia quantitativa o qualitativa ordinale. Se non conosci le scale di modalità ti lascio una spiegazione semplice tratta dal mio video corso sulla statistica descrittiva.
Adesso che abbiamo definito non solo cosa sono i quartili ma anche qual è il loro scopo e la loro relazione con la mediana, vediamo come procedere con il loro calcolo.
Il primo passo, molto facile, è ordinare tutti i valori che ti vengono dati in modo crescente.
Ricorda di ordinare le modalità, e non le frequenze!
Questo calcolo è uguale a quello visto per la mediana, infatti devi fare k = np, dove k è la posizione, n è il numero totale delle osservazioni e p è un numero tra 0 e 1 legato al quartile di riferimento.
Primo quartile (Q1), p=0,25
Secondo quartile (Q2), p=0,50, coincide con la mediana
Terzo quartile (Q3), p=0,75
In questo passaggio potrai trovarti davanti a due differenti situazioni:
Ti ritrovi in questa situazione quando n è un multiplo di 4.
Ti ritrovi in questa situazione quando n non è un multiplo di 4.
Il quartile è la modalità associata alla posizione trovata al punto 3.
Sappi che con la calcolatrice Sharp puoi calcolare mediana e quartili facilmente. Guarda il video!
Voglio farti un esempio banalissimo, ma che ti è utile per capire il funzionamento del calcolo appena spiegato. Pensa a un gruppo di 8 studenti che abbia appena superato l'esame di statistica e da questa distribuzione vuoi calcolare il primo e il terzo quartile.
Tabella dei dati:
\[
\begin{array}{|c|}
\hline
\scriptsize{Valori} \\
\hline
\scriptsize{30} \\
\scriptsize{24} \\
\scriptsize{27} \\
\scriptsize{18} \\
\scriptsize{22} \\
\scriptsize{23} \\
\scriptsize{23} \\
\scriptsize{25} \\
\hline
\end{array}
\]
Il numero di osservazioni è \( n = 8 \), che è un multiplo di 4. Quindi, per il calcolo dei quartili, la posizione \( k \) risulta intera.
Passo 1: Ordinamento dei dati
\[
\scriptsize{
\{18,\; 22,\; 23,\; 23,\; 24,\; 25,\; 27,\; 30\}
}
\]
Passo 2: Calcolo delle posizioni dei quartili
Per il primo quartile (\( Q_1 \)):
\[
\scriptsize{
k_{Q1} = \frac{n}{4} = \frac{8}{4} = 2
}
\]
Quindi, \( Q_1 \) è il secondo valore dell'insieme ordinato.
Per il terzo quartile (\( Q_3 \)):
\[
\scriptsize{
k_{Q3} = \frac{3n}{4} = \frac{3 \cdot 8}{4} = 6
}
\]
Quindi, \( Q_3 \) è il sesto valore dell'insieme ordinato.
Passo 3: Identificazione dei quartili
Dall'insieme ordinato, il secondo valore è \(22\) e il sesto valore è \(25\).
\[
\scriptsize{
Q_1 = 22 \quad \text{e} \quad Q_3 = 25
}
\]
Adesso in questo caso supponiamo che gli studenti siano 7.
Tabella dei dati:
\[
\begin{array}{|c|}
\hline
\scriptsize{Valori} \\
\hline
\scriptsize{30} \\
\scriptsize{24} \\
\scriptsize{27} \\
\scriptsize{18} \\
\scriptsize{22} \\
\scriptsize{23} \\
\scriptsize{23} \\
\hline
\end{array}
\]
Il numero di osservazioni è \( n = 7 \), che non è un multiplo di 4. Quindi, per il calcolo dei quartili, la posizione \( k \) non risulta intera.
Passo 1: Ordinamento dei dati
\[
\scriptsize{
\{18,\; 22,\; 23,\; 23,\; 24,\; 27,\; 30\}
}
\]
Passo 2: Calcolo delle posizioni dei quartili
Per il primo quartile (\( Q_1 \)):
\[
\scriptsize{
k_{Q1} = \frac{n}{4} = \frac{7}{4} = 1.75 \quad \Rightarrow \quad \lceil 1.75 \rceil = 2
}
\]
Quindi, \( Q_1 \) è il secondo valore dell'insieme ordinato.
Per il terzo quartile (\( Q_3 \)):
\[
\scriptsize{
k_{Q3} = \frac{3n}{4} = \frac{3 \cdot 7}{4} = 5.25 \quad \Rightarrow \quad \lceil 5.25 \rceil = 6
}
\]
Quindi, \( Q_3 \) è il sesto valore dell'insieme ordinato.
Passo 3: Identificazione dei quartili
Dall'insieme ordinato, il secondo valore è \(22\) e il sesto valore è \(27\).
\[
\scriptsize{
Q_1 = 22 \quad \text{e} \quad Q_3 = 27
}
\]
Abbiamo visto all'inizio che i quartili dividono l’insieme di dati in quattro parti uguali, ciò significa che ogni parte rappresenta il 25%. Questo è anche il motivo per cui p è uguale a 0,25 o 0,75.
Il primo quartile mostra il primo 25% della distribuzione, cioè fin dove arrivano i numeri nel primo quarto delle osservazioni. La restante porzione, il 75%, avrà numeri uguali o superiori al Q1.
Il terzo quartile mostra il primo 75% della distribuzione, cioè fin dove arrivano i numeri nei primi 3/4 delle osservazioni. La restante porzione, il 25%, avrà numeri uguali o superiori al Q3.
Il modo migliore per capire a fondo il significato di quartili e mediana è quella di rappresentarli in un grafico a scatole, detto boxplot.
Poichè l'argomento è abbastanza vasto e complicato, ho preferito parlare approfonditamente del suo utilizzo e della sua interpretazione in un altro articolo, dedicato esclusivamente al boxplot.
Qui, invece, voglio solo accennarti al fatto che, come spesso accade in statistica, i numeri vanno considerati nel loro contesto, ed è buona cosa confrontarli con altri.
L’esempio mostrato sopra è facilitato al fine della comprensione del calcolo, ma nella realtà ti ritrovi spesso a dover lavorare con molti più numeri. La rappresentazione grafica, quindi, aiuta non solo a capire come è distribuito il fenomeno, ma anche a confrontare più fenomeni tra di loro.
Se vuoi capire ancora meglio il significato dei quartili guardati il video iniziale, nel quale te li spiego in modo semplice con una metafora.
ESC.QUARTILE (matrice;quarto)
INC.QUARTILE (matrice;quarto)
Analizza >>> Statistiche descrittive >>> Esplora
Lo statistico è uno che fa un calcolo giusto partendo da premesse dubbie per arrivare a un risultato sbagliato.
(JEAN DELACOUR - Ornitologo francese)
Iscriviti alla Newsletter