fbpx

Indice di eterogeneità di Gini

Postato il 27 Luglio 2020
Tag

L’indice di eterogeneità di Gini misura quanto una distribuzione statistica sia appunto eterogenea ossia quanto le frequenze differiscano tra di loro (etero = diverso, gen = generale).

La varianza e la deviazione standard sono due indici di variabilità che necessitano di fenomeni quantitativi perché c’è bisogno di calcolare un valor medio.

Quando lavori con variabili qualitative, nominali o ordinali, non puoi eseguire alcuna operazione sulle modalità anche se è necessario avere un indice che misuri se i dati sono distribuiti in modo omogeneo o eterogeneo.

Un’interessante proprietà che puoi studiare nel caso di variabili (mutabili) qualitative è la mutabilità, cioè l’attitudine del carattere a manifestarsi con modalità diverse tra le unità statistiche. Ecco dunque che ti viene in aiuto l'indice di eterogeneità di Gini.

Attento a non confondere questo indicatore con il più famoso rapporto di concentrazione di Gini che serve per misurare la diseguaglianza nella distribuzione di un fenomeno quasi sempre il reddito delle persone.

Il famoso statistico veneto Corrado Gini fu il fondatore del più importante istituto italiano di statistica (ISTAT) e questo la dice lunga su quanto sia stato importante, anche a livello internazionale, con i suoi studi.

Come calcolare l’indice di eterogeneità di Gini

1) Calcola le frequenze relative

Prendi ogni frequenza assoluta ni e dividila per il totale (N) ottenendo le frequenze relative.

2) Eleva al quadrato le frequenze relative

Dopo aver elevato al quadrato le frequenze relative del punto 1, fai una somma.

3) Calcola l’indice di eterogeneità di Gini

Fai 1 meno la somma del punto 2. Questo è l’indice di eterogeneità di Gini, ma c’è bisogno di normalizzarlo per poterlo commentare.

4) Normalizza l’indice

Moltiplica per N/(N-1) il valore del punto 3.

Normalizzare un indice significa farlo diventare tra 0 e 1.

Quando è uguale a 1 si raggiunge la massima eterogeneità, mentre se è pari a 0 si ha la massima omogeneità. Essendo normalizzato prende il nome di indice relativo di eterogeneità di Gini.

Caratteristiche di un indice di variabilità

1) Uguale a 0

se tutti i valori osservati sono uguali, ovvero quando la variabilità della distribuzione è nulla.

2) Diverso da 0

se i valori osservati sono diversi tra loro, ovvero quando la variabilità della distribuzione è non nulla.

3) Crescente

al crescere del grado di diversità tra i valori osservati, ovvero quando la variabilità della distribuzione cresce. 

Utilizzo nella statistica

Gli indici di eterogeneità sono alla base della costruzione di una tecnica statistica di classificazione chiamata alberi di decisione.

Indice di eterogeneità di Gini

Un albero di decisione assegna degli oggetti a delle classi, dove un oggetto è un'osservazione di valori per degli attributi prefissati.

Il modo per distinguere le classi si basa sull’indice di Gini. Ci deve essere omogeneità interna, cioè nelle classi, ed eterogeneità esterna, cioè tra le classi.

In generale è usato come indice di variabilità per fenomeni qualitativi ma può anche essere impiegato per quelli quantitativi.

COMANDI SOFTWARE:

  • Indice di eterogenità di Gini EXCEL: Non esiste
  • Indice di eterogenità di Gini SPSS: Non esiste

Riassumendo

  • L’indice relativo di eterogeneità di Gini misura quanto sono diverse le frequenze di una distribuzione statistica.
  • Solitamente è utilizzato per caratteri qualitativi.
  • E’ usato nella statistica univariata.
  • Trova un discreto impiego nella tecnica degli alberi decisionali.

Mentre il singolo individuo è un enigma irrisolvibile, quando è insieme agli altri diviene una certezza matematica. È impossibile, per esempio, predire il modo in cui agirà un uomo, mentre è invece possibile dire con precisione cosa faranno un certo numero di uomini messi insieme. L'individuo varia, ma le percentuali rimangono costanti. Così dicono le statistiche.

(WILLIAM WINWOOD READE - storico britannico citato da Sherlock Holmes di Arthur Conan Doyle)

Iscriviti alla Newsletter

Se hai bisogno d’informazioni che non hai trovato nella sezione servizi o dei video corsi, scrivimi un messaggio o chiamami.
Domande, prezzi, richieste, delucidazioni...tutto quello che ti serve. Cercherò di risponderti entro le 24h.

Consenso al trattamento dei dati
Utilizzerò i tuoi dati (nome ed indirizzo mail) solo per inviarti gratuitamente via mail la newsletter mensile. Niente spam, niente scocciature, ti disiscrivi in un click quando vuoi.

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram