Sai cosa ho capito dopo 20 anni di esperienza come docente di statistica? Questa materia e tutto ciò che ne deriva, come la deviazione standard sono argomenti difficili da digerire.
Ma, ho una buona notizia: per aiutarti a superare l'esame di statistica ho creato una guida ad hoc, con un formulario facile da leggere, come puoi vedere qui:
In questo articolo trovi le domande frequenti che ricevo riguardo la deviazione standard, anche detta scarto quadratico medio. Sì, vogliono dire esattamente la stessa cosa. Primo dubbio risolto, vero?
Passiamo ai successivi.
La deviazione standard è una misura che indica quanto i dati di un insieme si disperdano rispetto alla loro media.
È calcolata come la radice quadrata della varianza, che a sua volta rappresenta la media degli scarti quadratici dalla media.
Quindi no, la deviazione standard e la varianza non sono la stessa cosa. A differenza di quest'ultima, lo scarto quadratico medio è un indice che viene espresso con la stessa unità di misura dei valori osservati.
Come detto, la deviazione standard è particolarmente utile per capire "quanto lontano" tendono a trovarsi i valori rispetto alla media.
Immagina di avere una serie di numeri, che rappresentano, per esempio, i voti di una classe in un test.
La deviazione standard è uno strumento che ci aiuta a capire quanto i voti di tutti gli studenti differiscono dalla media della classe.
Se tutti gli studenti hanno preso più o meno lo stesso voto, la deviazione standard sarà bassa perché i voti sono tutti vicini alla media. Se invece i voti sono molto diversi tra loro, la deviazione standard sarà alta, indicando che c'è molta variabilità nei voti.
Per calcolare la deviazione standard, partiamo dalla varianza, che è la media delle differenze al quadrato tra ogni voto e la media dei voti.
Pensala come un modo per misurare quanto ogni voto si discosta dalla media, tenendo conto anche della direzione di questa differenza.
Dopo aver trovato la varianza, prendiamo la radice quadrata di questo numero per ottenere lo scarto quadratico medio. Questo passaggio finale ci permette di riportare la misura nella stessa unità dei voti originali, rendendola più facile da comprendere.
Se vuoi approfondire l’argomento, ti consiglio di leggere l’articolo sulla deviazione standard che trovi sul mio blog.
Pensiamo di nuovo ai voti di una classe: la deviazione standard e la varianza sono due modi di misurare quanto questi voti differiscono tra loro, ma lo fanno in maniera leggermente diversa.
Lo scarto quadratico medio ti dà un'idea diretta della differenza media dei voti rispetto alla media della classe, usando la stessa unità di misura dei voti (come punti o voti su 30). È come chiedere: "Quanto dista in media ciascun voto dalla media dei voti?"
La varianza, invece, prende queste differenze, le eleva al quadrato, e poi fa la media di questi quadrati. Questo processo tende a dare più peso alle differenze più grandi (perché quando elevi un numero al quadrato, i numeri grandi diventano molto più grandi).
Tuttavia, siccome le differenze vengono elevate al quadrato, l'unità di misura della varianza diventa il quadrato di quella originale. Quindi, se stiamo misurando altezze in centimetri, la varianza ci darà un risultato in centimetri quadrati, il che è difficile da interpretare direttamente.
In breve, la deviazione standard è più intuitiva e diretta da usare perché rimane nella stessa scala dei dati originari, mentre la varianza dà più importanza alle differenze più grandi ma risulta essere meno immediata da comprendere a causa dell'unità di misura trasformata.
Il simbolo utilizzato per la deviazione standard di una popolazione è σ (sigma), mentre per un campione è s.
Questa distinzione è importante perché riflette differenti approcci nel calcolo, a seconda che si stia analizzando una popolazione intera o un campione rappresentativo.
La deviazione standard è usata per descrivere la dispersione di tutti i dati in un insieme, mentre l'errore standard è usato principalmente per stimare quanto la media di un campione possa differire dalla media reale della popolazione.
In definitiva, usa:
Per calcolare la deviazione standard su Excel, puoi utilizzare queste funzioni:
(Num1;Num2;...) per popolazioni
(Num1;Num2;...) per campioni
(Num1;Num2;...)
(Num1;Num2;...)
Perché sono utili? Ti permettono di inserire un range di dati e ottenere immediatamente lo scarto quadratico medio.
La deviazione standard di un portafoglio di investimenti misura la volatilità o il rischio del portafoglio.
Puoi calcolarla determinando prima i rendimenti attesi del portafoglio, poi utilizzando la formula della deviazione standard per questi rendimenti.
Questo ti darà un'idea di quanto il rendimento del tuo portafoglio possa variare nel tempo.
In ambito finanziario, la deviazione standard misura il rischio di un investimento.
Indica quanto i rendimenti di un titolo o di un portafoglio si discostino dalla media, offrendo così una misura della sua volatilità.
Va da sé che investimenti con uno scarto quadratico medio elevata sono considerati più rischiosi, poiché i loro rendimenti possono variare ampiamente.
Una deviazione standard alta è un indicatore che i dati analizzati presentano una grande variabilità rispetto alla loro media.
In altre parole, i valori osservati si discostano molto l'uno dall'altro, indicando una distribuzione dei dati eterogenea, ampia e dispersa.
Ti sarà capitato di andare a cena con un gruppo di amici e decidere di dividere il conto in modo equo, "alla romana".
Al termine della serata, se calcolassimo la deviazione standard della cifra che ciascun amico ha effettivamente consumato, una deviazione standard alta ci indicherebbe che alcuni amici hanno speso molto più di altri rispetto a quanto hanno effettivamente consumato.
Per esempio, se la media del consumo per persona è di 30 euro, una deviazione standard alta potrebbe rivelare che mentre alcuni hanno ordinato cibi del valore di 10 euro, altri ne hanno ordinati del valore di 50 euro.
Non proprio un grande affare per chi ha preso una semplice pizza margherita, che ne dici?
Questo è lo stesso esempio che faccio in uno dei miei video, proprio per spiegare cosa è lo scarto quadratico medio.
Eccolo:
Lo scarto quadratico medio non ha un limite specifico che la rende un indicatore di rischio per se stessa; tuttavia, in finanza, una deviazione standard più alta indica generalmente un investimento più rischioso.
Questo perché grandi variazioni nei rendimenti possono comportare maggiori incertezze e potenziali perdite, ma anche incredibili guadagni.
La deviazione standard può variare da 0 a valori molto elevati.
Un valore di 0 indica che non c'è dispersione tra i dati; in altre parole, tutti i numeri del dataset sono uguali.
Al contrario, valori molto elevati indicano una grande dispersione tra i dati, mostrando che i numeri si discostano significativamente l'uno dall'altro e dalla media.
Un indice elevato di scarto quadratico medio, ossia la deviazione standard, è un’informazione fondamentale per comprendere la natura dei dati che stai analizzando. In campi come la finanza o la ricerca scientifica, la variabilità può avere implicazioni significative per le decisioni e le analisi.
Due deviazioni standard dalla media coprono circa il 95% dei dati in una distribuzione normale.
Questo è un principio statistico noto come regola empirica, che aiuta a comprendere la distribuzione dei dati senza calcoli complicati.
Inoltre, secondo il teorema di Chebyshev - anche conosciuto come disuguaglianza di Chebyshev - almeno il 75% dei dati si trova entro due deviazioni standard dalla media, indipendentemente dalla forma della distribuzione dei dati.
Questo principio offre una visione più ampia della dispersione dei dati, utile in contesti dove la distribuzione non segue necessariamente quella normale.
Ricollegandoci all'esempio precedente del pagamento alla romana tra amici, supponiamo che la spesa media per persona sia di 30 euro con una deviazione standard di 5 euro.
Due deviazioni standard (10 euro) da quella media coprirebbero da 20 euro a 40 euro.
Questo significa che circa il 95% degli amici spende una cifra compresa in questo intervallo quando si paga alla romana.
Coloro che spendono meno di 20 euro o più di 40 euro sono molto meno comuni, rappresentando solo il 5% del gruppo.
Lo scarto è un componente essenziale della statistica descrittiva che fornisce la base per calcoli più avanzati utilizzati per analizzare e interpretare i dati. Descrive la differenza tra un valore osservato in un set di dati e la media aritmetica di quel set.
Questa differenza serve per calcolare misure di dispersione come la varianza e lo scarto quadratico medio, che ci dicono quanto i dati sono distribuiti o sparsi attorno alla media.
Questi calcoli possono aiutare a prendere decisioni informate in ambiti come l'educazione, la ricerca scientifica, l'economia e oltre.