whatsapp

adriano gilardone Docente di Statistica Matematica Excel Spss sfruttare excel consulenze statistiche lezione videocorsi

blog

blog

Che cos'è la deviazione standard?

Ultima modifica (26 Febbraio 2025)

YouTube video

Postato il 25 Maggio 2020

Tag

Contenuti nascondi

1 Come calcolare la deviazione standard

1.1 METODO DIRETTO

1.1.1 Calcola la media aritmetica

1.1.2 Calcola gli scarti dalla media

1.1.3 Eleva al quadrato gli scarti dalla media

1.1.4 Dividi per N

1.1.5 Fai la radice quadrata

1.1.6 Esempio deviazione standard metodo diretto

1.2 METODO INDIRETTO

1.2.1 Calcola la media aritmetica

1.2.2 Eleva al quadrato le xi

1.2.3 Dividi per N

1.2.4 Calcola la varianza

1.2.5 Fai la radice quadrata

1.2.6 Esempio deviazione standard metodo indiretto

2 Simbolo della deviazione standard e simbolo della varianza

3 Definizioni: la devianza, la varianza e la deviazione standard

3.1 Definizione di DEVIANZA

3.2 Definizione di VARIANZA

3.3 Definizione di DEVIAZIONE STANDARD

4 Interpretazione

4.1 Deviazione standard NULLA

4.2 Deviazione standard BASSA

4.3 Deviazione standard DISCRETA

4.4 Deviazione standard ALTA

4.5 Deviazione standard MASSIMA

5 Esempio nella vita reale

6 Cosa significa due deviazioni standard?

6.1 Un esempio di due deviazione standard

7 Deviazione standard campionaria

7.1 Formula varianza campionaria

7.2 Formula deviazione standard campionaria

8 Differenza tra deviazione standard e errore standard

9 Deviazione standard EXCEL

10 Deviazione standard SPSS

In statistica la deviazione standard o scarto quadratico medio è un indice di quanto i numeri si distanzino dalla media aritmetica. In pratica misura "mediamente" quanto i valori di una distribuzione si discostino dalla media stessa.

Prima di iniziare dunque, ti consiglio di leggere l'articolo sulla media aritmetica, così comprendi anche come sia uno degli indicatori di sintesi più utilizzato e dunque uno dei più importanti.

corso statistica

Tale indice però ha senso solo se accompagnato da un numero che misuri la variabilità dei valori attorno alla media, quindi un indice di dispersione. E' facile intuire che se tutti i numeri sono uguali, la media è uguale agli stessi e la variabilità sarà nulla.

Ma cosa succede se i numeri sono diversi? Come faccio a stabilire se la diversità è poca o è tanta? In definitiva, quando la deviazione standard è alta o bassa?

Prima di rispondere a queste domande devi sapere come calcolare la deviazione standard dimodoché tu possa capirne il significato. Ci sono due modi per farlo e sono entrambi utili.

Come calcolare la deviazione standard

Per trovare la formula per il calcolo della deviazione standard ci sono due diversi due modi: quello diretto e quello indiretto. Vediamo entrambi nel dettaglio.

METODO DIRETTO

Calcola la media aritmetica

YouTube video — Esercizio svolto media aritmetica

Somma ogni valore e dividi per il conteggio degli stessi.

Calcola gli scarti dalla media

Prendi ogni valore xi e toglili la media appena trovata.

Eleva al quadrato gli scarti dalla media

Prendi gli scarti del punto 2 ed elevali al quadrato. Moltiplica tali scarti al quadrato per le ni, se sei in presenza di una distribuzione di frequenze assolute. Alla fine somma i valori.

Dividi per N

Prendi la somma del punto 3 (chiamata DEVIANZA) e dividila per il totale delle osservazioni (N). Il risultato è la varianza.

Fai la radice quadrata

La deviazione standard è la radice quadrata della varianza. In molti software troverai scritto sqrt che sta per square root ovvero radice quadrata in inglese.

NOTA: Per sua natura può essere calcolata solo su variabili quantitative.

Esempio deviazione standard metodo diretto

Supponiamo di avere i punteggi ottenuti da un gruppo di persone in un esame.
La tabella seguente mostra i diversi punteggi (\( x_i \)) e il numero di persone (\( n_i \)) che hanno ottenuto quel test:

\[
\begin{array}{|c|c|}
\hline
x_i & n_i \\
\hline
6 & 10 \\
7 & 20 \\
15 & 30 \\
22 & 25 \\
30 & 15 \\
\hline
\textbf{Totale} & 100 \\
\hline
\end{array}
\]

Calcolo della media:

\[
\bar{x} = \frac{\sum n_i x_i}{\sum n_i}
\]

\[
\bar{x} = \frac{(6 \times 10) + (7 \times 20) + (15 \times 30) + (22 \times 25) + (30 \times 15)}{100}
\]

\[
\bar{x} = \frac{60 + 140 + 450 + 550 + 450}{100} = \frac{1650}{100} = 16.5
\]

Calcolo della varianza con il metodo diretto:

\[
\sigma^2 = \frac{\sum n_i (x_i - \bar{x})^2}{\sum n_i}
\]

\[
\sum n_i (x_i - \bar{x})^2 =
(10 \times (6 - 16.5)^2) + (20 \times (7 - 16.5)^2) + (30 \times (15 - 16.5)^2) +
(25 \times (22 - 16.5)^2) + (15 \times (30 - 16.5)^2)
\]

\[
= (10 \times 110.25) + (20 \times 90.25) + (30 \times 2.25) + (25 \times 30.25) + (15 \times 182.25)
\]

\[
= 1102.5 + 1805 + 67.5 + 756.25 + 2733.75
\]

\[
= 6465
\]

\[
\sigma^2 = \frac{6465}{100} = 64.65
\]

Calcolo della deviazione standard:

\[
\sigma = \sqrt{64.65} \approx 8.04
\]

METODO INDIRETTO

Calcola la media aritmetica

Somma ogni valore e dividi per il conteggio degli stessi.

Eleva al quadrato le xi

Eleva al quadrato ogni valore xi e moltiplicalo per la ni, se sei in presenza di una distribuzione di frequenze assolute. Alla fine somma i valori.

Dividi per N

Prendi la somma del punto 2 e dividila per il totale delle osservazioni (N). Il risultato che trovi si chiama MOMENTO SECONDO ed è la prima parte della varianza.

Calcola la varianza

La varianza è uguale al momento secondo meno la media al quadrato.

Fai la radice quadrata

La deviazione standard è sempre la radice quadrata della varianza.

Come puoi vedere, quindi, in entrambi i modi per calcolare della deviazione standard avrai bisogno di partire dalla media aritmetica, perchè è l'unico modo per trovarne la formula.

Esempio deviazione standard metodo indiretto

\[
\begin{array}{|c|c|}
\hline
x_i & n_i \\
\hline
6 & 10 \\
7 & 20 \\
15 & 30 \\
22 & 25 \\
30 & 15 \\
\hline
\textbf{Totale} & 100 \\
\hline
\end{array}
\]

Calcolo della media:

\[
\bar{x} = \frac{\sum n_i x_i}{N}
\]

\[
\bar{x} = \frac{(6 \times 10) + (7 \times 20) + (15 \times 30) + (22 \times 25) + (30 \times 15)}{100}
\]

\[
\bar{x} = \frac{60 + 140 + 450 + 550 + 450}{100} = \frac{1650}{100} = 16.5
\]

Calcolo della varianza con il metodo indiretto:

La varianza si calcola come:

\[
\sigma^2 = M_2 - \bar{x}^2
\]

Dove \( M_2 \) è il momento secondo, definito come:

\[
M_2 = \frac{\sum n_i x_i^2}{N}
\]

Calcoliamo il momento secondo:

\[
M_2 = \frac{(6^2 \times 10) + (7^2 \times 20) + (15^2 \times 30) + (22^2 \times 25) + (30^2 \times 15)}{100}
\]

\[
= \frac{(36 \times 10) + (49 \times 20) + (225 \times 30) + (484 \times 25) + (900 \times 15)}{100}
\]

\[
= \frac{360 + 980 + 6750 + 12100 + 13500}{100}
\]

\[
M_2 = \frac{33690}{100} = 336.9
\]

Ora calcoliamo la varianza:

\[
\sigma^2 = 336.9 - (16.5)^2
\]

\[
\sigma^2 = 336.9 - 272.25
\]

\[
\sigma^2 = 64.65
\]

Calcolo della deviazione standard:

\[
\sigma = \sqrt{64.65} \approx 8.04
\]

Deviazione standard — Formule della varianza e della deviazione standard

Simbolo della deviazione standard e simbolo della varianza

La maggior parte degli indicatori in statistica viene simboleggiata con le lettere greche. Il simbolo della deviazione standard è σ (sigma), mentre quello della varianza è σ² (sigma quadro) essendo quest'ultima il quadrato della precedente.

In alcune circostanze però potrai trovare questi due indici simboleggiati con le lettere latine s e s² , questo avviene quando la distribuzione si riferisce a un campione, mentre quando si riferisce alla popolazione si usano le lettere greche.

Definizioni: la devianza, la varianza e la deviazione standard

Definizione di DEVIANZA

Ti ho già spiegato nel dettagli la definizione di DEVIANZA nell'articolo sulla VARIANZA. Mi limito solo a dirti che rappresenta la somma dei quadrati degli scarti dalla media.

Definizione di VARIANZA

Anche qui ti consiglio di rifarti all'articolo sopra citato, ma in sintesi la varianza statistica (indicata col simbolo σ²) non è altro che il rapporto tra la DEVIANZA e il totale delle osservazioni che, come sai, viene indicato con N.

Come si calcola la varianza? La formula è molto semplice.

VARIANZA = DEVIANZA / N

Di conseguenza la varianza è una media degli scarti quadratici.

Nel video sotto trovi come calcolare la varianza e la deviazione standard con la calcolatrice scientifica SHARP. Purtroppo non tutti gli studenti usano la calcolatrice in modo professionale perchè non conoscono il fatto che si possano inserire i dati di un esercizio e far lavorare SOLO la calcolatrice.

YouTube video — Esercizio svolto varianza, deviazione standard e coefficiente di variazione con la calcolatrice scientifica

Definizione di DEVIAZIONE STANDARD

Supponi per esempio di misurare il peso di alcuni animali che avranno media 50 e varianza 100. La media di 50 si riferirà ai Kg mentre la varianza di 100 ai Kg al quadrato. Ha senso un'unità di misura espressa in Kg al quadrato?

Ed eccoci finalmente arrivati alla tanto agognata definizione di deviazione standard!

Il problema principale è quello di avere un indicatore di variabilità che abbia la stessa unità di misura del fenomeno che stai studiando e di conseguenza della sua media aritmetica.

Come detto la varianza ti restituisce un indicatore con un'unità di misura al quadrato rispetto alla media, e allora cosa si fa? Beh, basta fare la sua radice quadrata!

DEVIAZIONE STANDARD = RADICE DELLA VARIANZA

Tornando all'esempio di prima, se la media è di 50 Kg e la deviazione standard è di 10 Kg (√100 = 10) , vorrà dire che tutti i numeri "mediamente" di discosteranno di 10 Kg dalla media.

Arrivato a questo punto dovresti farti la domanda più importante. Come faccio a capire se la deviazione standard è alta o bassa?

corso statistica

Interpretazione

Premessa: per valutare se la deviazione standard è elevata bisogna confrontarla con il suo valore massimo che è dato dalla moltiplicazione della media per la radice quadrata delle osservazioni meno 1.

DEVIAZIONE STANDARD MASSIMA = ( μ * √ n-1 )

il rapporto tra la deviazione standard e il suo valore massimo genera un indice normalizzato che sta tra 0 e 1 dove 0 rappresenta variabilità nulla e 1 variabilità massima

INDICE DI VARIABILITA' = DEV STD / DEV STD MAX

Osserva questo schema:

esempio deviazione standard

Questi dati, totalmente inventati da me, rappresentano diversi gruppi di animali (A-B-C-D-E) a cui è stato misurato il peso. Ogni gruppo è formato da 5 animali e il peso medio di ogni gruppo è di 58 Kg.

Ho appositamente scelto gruppi con lo stesso peso per farti vedere come cambiamo i numeri all'interno e di conseguenza la variabilità dei dati.

Deviazione standard NULLA

GRUPPO A: tutti i numeri sono uguali

Questo genera una deviazione standard nulla ed è il più piccolo valore che tale indice può assumere. Ovviamente questo è un caso limite che non si avvera mai anche perché un fenomeno che non varia non ha senso studiarlo dal punto di vista statistico.

Deviazione standard BASSA

GRUPPO B: i numeri si distribuiscono bene attorno alla media di 58

In questo caso i numeri variano ma di poco, infatti l'indice di variabilità è basso (0,09). Questo vuol dire che la media ben rappresenta la distribuzione.

Deviazione standard DISCRETA

GRUPPO C: i numeri si distribuiscono poco attorno alla media di 58

Qui i numeri iniziano a variano e non di poco visto che il minimo è 15 e il massimo è 110 ben lontani dalla media di 58. L'indice di variabilità è 0,34, non un numero così piccolo. Questo vuol dire che la media poco rappresenta la distribuzione. E' anche vero che l'esempio fatto da me solo considera solo 5 numeri e serve per puro scopo didattico.

Se la numerosità fosse maggiore bisogna valutare nel suo complesso la variabilità dei dati e magari si potrebbe anche accettare un'indice attorno allo 0,30.

Deviazione standard ALTA

GRUPPO D: i numeri non si distribuiscono per niente attorno alla media di 58

Questa è la situazione in cui i numeri sono troppo distanti dalla media. Quando le osservazioni sono molto di più delle 5 presenti, l'indicatore di sintesi più adeguato in questi casi è la mediana. L'indice di variabilità di 0,67 conferma la variabilità molto alta sintomo che la media non rappresenta la distribuzione.

Deviazione standard MASSIMA

GRUPPO E: tutti i numeri sono nulli tranne uno

Questo è l'altro caso limite in cui tutta l'intensità di un fenomeno si concentra in una sola modalità. E' chiaro che non ha senso una distribuzione di questo tipo, ma quello che ti interessa è osservare l'indice di variabilità che assume il suo valore massimo di 1

Esempio nella vita reale

Per farti capire il significato dello scarto quadratico medio ti spiego un esempio di vita reale che ti può essere capitato semmai avessi valutato un investimento di denaro.

Se vuoi affidarti ad una banca per i tuoi investimenti, gli operatori finanziari ti propongono diversi scenari riconducibili quasi sempre a 3 livelli di rischio. Basso, Medio, Alto.

Intuitivamente sai che un rischio basso è collegato ad un rendimento basso in quanto probabilmente i valori del titolo che acquisti varieranno di poco.

Viceversa se acquisti titoli azionari ad alto rischio ti aspetti che le fluttuazioni siano maggiori passando da incrementi percentuali notevoli ad altrettanti decrementi.

Queste differenze sono determinate dalla deviazione standard che ti informa sul grado di variabilità del titolo acquistato.

Pertanto analizzando il flusso di dati del passato, si può stabilire attraverso la deviazione standard se il tuo investimento è a basso o alto rischio.

corso statistica

Cosa significa due deviazioni standard?

Due deviazioni standard dalla media coprono circa il 95% dei dati in una distribuzione normale.

Questo è un principio statistico noto come regola empirica, che aiuta a comprendere la distribuzione dei dati senza calcoli complicati.

Inoltre, secondo il teorema di Chebyshev - anche conosciuto come disuguaglianza di Chebyshev - almeno il 75% dei dati si trova entro due deviazioni standard dalla media, indipendentemente dalla forma della distribuzione dei dati.

Questo principio offre una visione più ampia della dispersione dei dati, utile in contesti dove la distribuzione non segue necessariamente quella normale.

Un esempio di due deviazione standard

Ricollegandoci all'esempio precedente del pagamento alla romana tra amici, supponiamo che la spesa media per persona sia di 30 euro con una deviazione standard di 5 euro.

Due deviazioni standard (10 euro) da quella media coprirebbero da 20 euro a 40 euro.

Questo significa che circa il 95% degli amici spende una cifra compresa in questo intervallo quando si paga alla romana.

Coloro che spendono meno di 20 euro o più di 40 euro sono molto meno comuni, rappresentando solo il 5% del gruppo.

Deviazione standard campionaria

La deviazione standard è strettamente collegata alla varianza e dunque avrà i suoi stessi utilizzi come, tra gli altri, nelle variabili casuali, negli intervalli di confidenza e nelle verifiche di ipotesi.

Le formule descritte sopra fanno riferimento alla popolazione ma nella maggior parte dei casi si lavora con un campione.

La differenza di calcolo è minima. Quando nel metodo diretto calcoli la varianza della popolazione devi prendere la devianza e dividirla per N. Per calcolare quella del campione di basterà dividere la devianza per N-1

Questo avviene perchè si usa il correttore di Bessel per evitare una sottostima della varianza della popolazione. Questo rende la stima non distorta.

Formula varianza campionaria

varianza campionaria

Formula deviazione standard campionaria

deviazione standard campionaria

simbolo deviazione standard

Differenza tra deviazione standard e errore standard

La deviazione standard è usata per descrivere la dispersione di tutti i dati in un insieme, mentre l'errore standard è usato principalmente per stimare quanto la media di un campione possa differire dalla media reale della popolazione.

In definitiva, usa:

lo scarto quadratico medio se stai cercando di comprendere la variabilità generale dei dati,
l'errore standard se vuoi sapere quanto affidabile è la tua stima della media.

Deviazione standard EXCEL

DEV.ST.P (Num1;Num2;...)

DEV.ST.C (Num1;Num2;...)

DEV.ST.POP.VALORI (Num1;Num2;...)

DEV.ST.VALORI (Num1;Num2;...)

Deviazione standard SPSS

Analizza >>> Statistiche descrittive >>> Descrittive

Analizza >>> Statistiche descrittive >>> Frequenze

Analizza >>> Statistiche descrittive >>> Esplora

Riassumendo

La deviazione standard è un indicatore di variabilità pari alla media quadratica degli scarti quadratici dalla media aritmetica.
Il suo valore è facilmente commentabile perché ha la stessa unità di misura della variabile oggetto di studio.
Il suo utilizzo è molto ampio in diversi campi della statistica tra cui variabili aleatorie, intervalli di confidenza e verifiche di ipotesi.

È appurato oltre ogni dubbio che il fumo è una delle principali cause delle statistiche

(FLETCHET KNEBEL - autore americano)

Iscriviti alla Newsletter

Se hai bisogno d’informazioni che non hai trovato nella sezione servizi o dei video corsi, scrivimi un messaggio o chiamami.
Domande, prezzi, richieste, delucidazioni...tutto quello che ti serve. Cercherò di risponderti entro le 24h.