La differenza media semplice o la differenza media con ripetizione, sono indici di mutua variabilità che si ottiengono facendo la media aritmetica tra tutte le possibili differenze, in valore assoluto, fra le modalità di xi e di xj di un carattere quantitativo.
Tale indice è una misura della variabilità media interna alla distribuzione, cioè fra i singoli valori. E’ utile sapere che raggiunge il suo valore massimo quando è uguale a due volte la media aritmetica.
Rapportando la differenza semplice media con il suo massimo valore di due volte la media, si avrà l’indice di concentrazione di Gini.
Questa importante proprietà serve per comprendere meglio il significato del rapporto di concentrazione di Gini che ti consiglio di leggere nell’articolo linkato sopra.
La prima cosa da fare è calcolare le differenze tra i numeri di xi e xj e prenderle in valore assoluto.
Prendi ogni differenza e moltiplicala per le rispettive frequenze assolute di xi e di xj.
Somma tutte le differenze e moltiplica per 2. Questa operazione la fai perchè le differenze vanno eseguite sia facendo |xi - xj| sia |xj - xi|.
Di conseguenza anziché ripetere un’operazione che ti porterebbe allo stesso risultato, falla una sola volta e poi moltiplichi la somma per due.
Prendi la somma trovata al punto 3 e dividila per N(N-1) che sono le possibili combinazioni se si considerano tutte le differenze tra ciascun termine e tutti i restanti termini della distribuzione.
Calcola le differenze tra i numeri di xi e xj e prendile in valore assoluto.
Prendi ogni differenza e moltiplicala per le rispettive frequenze assolute di xi e di xj.
Somma tutte le differenze e moltiplica per 2. Questa operazione la fai perchè le differenze vanno eseguite sia facendo |xi - xj| sia |xj - xi|.
Di conseguenza anziché ripetere un’operazione che ti porterebbe allo stesso risultato, falla una sola volta e poi moltiplichi la somma per due.
Prendi la somma trovata al punto 3 e dividila per il quadrato di N che sono le possibili combinazioni di prima più tutte le differenze tra i numeri e sé stessi, che sono ovviamente zero.
In un altro articolo ho spiegato che la deviazione standard è una media quadratica degli scarti ed è l’indice di variabilità più usato, ma in alcune circostanze specifiche bisogna ricorrere ad altro per misurare la mutua variabilità.
La mutua variabilità è studio della diversità tra le singole unità statistiche, quindi le differenze vengono eseguite tra i singoli numeri e non tra i numeri e la media aritmetica.
Problemi come la disuguaglianza dei redditi, le diversità economiche e finanziarie tra individui, gruppi e nazioni richiedono di misurare la diversità tra le unità statistiche.
Lo studio della mutua variabilità ha senso solo per caratteri trasferibili, come appunto il reddito, in quanto solo per questi ultimi è possibile la determinazione della variabilità minima e massima in una distribuzione.
L'uomo può credere all'impossibile, ma non crederà mai all'improbabile.
(Oscar Wilde - scrittore irlandese)