whatsapp
Adriano Gilardone
Adriano Gilardone
adriano gilardone Docente di Statistica Matematica Excel Spss sfruttare excel consulenze statistiche lezione videocorsi
blog

blog

Distribuzione di Pareto

Ultima modifica (27 Febbraio 2025)
YouTube video
Postato il 2 Maggio 2023
Tag

La distribuzione di Pareto è una variabile casuale continua che di solito rappresenta un modello di distribuzione dei redditi e di altre quantità che seguono il principio di Pareto, secondo cui, il 20% delle cause è responsabile dell'80% degli effetti.

corso statistica

Quando si usa la distribuzione di Pareto

La variabile aleatoria di Pareto è utile in generale quando si affrontano situazioni in cui una piccola percentuale di fattori è responsabile della maggior parte degli effetti o delle conseguenze e viene spesso utilizzata in questi settori:

Economia: per l'analisi della distribuzione del reddito e della ricchezza.

Gestione aziendale e marketing: tramite l'applicazione della regola 80/20, per identificare clienti e prodotti chiave. Se per ottenere l’80% delle vendite basta molto meno dell’20% dei clienti si è a rischio concentrazione.

Ingegneria: per la creazione di diagrammi di Pareto per identificare e risolvere problemi critici.

Analisi delle reti: per la descrizione delle proprietà di scale-free nelle reti complesse.

Scienza delle informazioni e delle comunicazioni: per la modellazione della popolarità di contenuti online come siti web, video e articoli.

Analisi del rischio e delle assicurazioni: per la valutazione del rischio e determinazione delle tariffe per eventi rari e ad alto impatto come catastrofi naturali o gravi incidenti.

Caratteristiche della distribuzione di Pareto

Prima di tutto devi definire i valori dei parametri della variabile casuale di Pareto, che sono:

X = variabile casuale di interesse, rappresentata da valore positivo (x ≥ a)

a = parametro di scala. E' il valore minimo da dove inizia la distribuzione (a > 0)

Ɵ = parametro di forma, che mostra la "pesantezza" della coda della distribuzione (Ɵ > 0)

Probabilità della distribuzione di Pareto

Come detto all'inizio, la distribuzione di Pareto è una variabile casuale continua, per cui non ha tanto senso conoscere la probabilità in un punto specifico.

Risulta più tangibile se ti faccio un esempio con la tua altezza. Calcolare la probabilità che tu sia alto/a 180 cm non è utile in quanto se tu fossi alto/a 180,1 cm già sarebbe un altro valore.

Per le variabili continue ha più senso calcolare la funzione di ripartizione. Detto questo dobbiamo comunque passare per la funzione di densità di probabilità che ti ricordo nelle variabili casuali discrete chiamiamo funzione di massa di probabilità.

Funzione di densità di probabilità

La funzione di densità di probabilità (PDF) deve essere positiva e integrabile su tutto il dominio della variabile aleatoria.

distribuzione di pareto

Ricorda che questa formula è valida solo per x ≥ a. Se x < a, la PDF è uguale a 0. Solitamente quando si studiano i redditi, si fissa un reddito minimo che qui simboleggiamo con la lettera a.

In un esame universitario probabilmente dovrai ricavare il parametro Ɵ o il valore di a secondo le istruzioni del testo per poi poter calcolare le probabilità della funzione di ripartizione.

corso statistica

Funzione di ripartizione

La funzione di ripartizione della distribuzione di Pareto rappresenta la probabilità che la variabile casuale sia minore o uguale a un determinato valore.

\(\displaystyle P(X \leq x) = 1 - \left(\frac{a}{x}\right)^\theta \)

Come detto prima dovrai identificare e sostituire i valori Ɵ e a nella formula, per poi calcolare la probabilità fino al punto x.

Anche qui ricorda che questa formula è valida solo per x ≥ a. Se x < a, la PDF è uguale a 0.

Media, varianza e mediana

La media, la varianza e la mediana sono importanti misure statistiche che caratterizzano tutte le variabili casuali e di conseguenza anche quella di Pareto. Tutti e tre gli indicatori dipendono sia dal parametro Ɵ sia dal parametro di scala (a).

Media

La media è definita solo per Ɵ > 1 e si calcola come segue:

\(\displaystyle E(X) = \frac{a \theta}{\theta - 1} \)

Varianza

La varianza è definita solo per Ɵ > 2 e si calcola come segue:

\(\displaystyle \text{Var}(X) = \frac{E(X)^2}{\theta(\theta - 2)} \)

dove E ( X ) è la media calcolata nel passo precedente.

Mediana

La mediana è definita per qualsiasi valore di Ɵ > 0 e si calcola come segue:

\(\displaystyle \text{Med}(X) = a \, 2^{\frac{1}{\theta}} \)

Se hai dubbi sulla mediana guarda questo mio video in cui te la spiego in modo semplice e chiaro utilizzando una metafora statistica.

YouTube video
Mediana spiegata semplice con una metafora statistica

Esempio distribuzione di Pareto

Si consideri una distribuzione di Pareto con valore minimo \( a = 12.000 \) e media pari a \( 16.000 \). Si richiede di:

  • Determinare il parametro \( \theta \).
  • Calcolare la probabilità che il reddito sia compreso tra \( 16.500 \) e \( 19.500 \).
  • Determinare la varianza e la mediana della distribuzione.

Tabella dei Dati:

\[
\begin{array}{|c|c|}
\hline
\textbf{Parametro} & \textbf{Valore} \\
\hline
a & 12.000 \\
E(X) & 16.000 \\
\hline
\end{array}
\]


Passo 1: Determinazione del parametro \( \theta \)

La media della distribuzione di Pareto è data dalla formula:

\[
E(X) = \frac{a \theta}{\theta - 1}
\]

Isoliamo \( \theta \):

\[
\theta - 1 = \frac{a \theta}{E(X)}
\]

\[
\theta = \frac{E(X)}{E(X) - a}
\]

Sostituiamo i valori numerici:

\[
\theta = \frac{16.000}{16.000 - 12.000} = \frac{16.000}{4.000} = 4
\]


Passo 2: Calcolo della probabilità \( P(16.500 \leq X \leq 19.500) \)

La funzione di ripartizione della distribuzione di Pareto è:

\[
P(X \leq x) = 1 - \left( \frac{a}{x} \right)^\theta
\]

Calcoliamo \( P(X \leq 19.500) \):

\[
P(X \leq 19.500) = 1 - \left( \frac{12.000}{19.500} \right)^4
\]

\[
= 1 - \left( 0,6154 \right)^4
\]

\[
= 1 - 0,1434 = 0,8566
\]

Calcoliamo \( P(X \leq 16.500) \):

\[
P(X \leq 16.500) = 1 - \left( \frac{12.000}{16.500} \right)^4
\]

\[
= 1 - \left( 0,7273 \right)^4
\]

\[
= 1 - 0,2798 = 0,7202
\]

Ora otteniamo la probabilità richiesta:

\[
P(16.500 \leq X \leq 19.500) = P(X \leq 19.500) - P(X \leq 16.500)
\]

\[
= 0,8566 - 0,7202 = 0,1364
\]


Passo 3: Calcolo della varianza

La varianza della distribuzione di Pareto è data dalla formula:

\[
Var(X) = \frac{a^2 \theta}{(\theta - 1)^2 (\theta - 2)}
\]

Sostituendo i valori:

\[
Var(X) = \frac{12.000^2 \times 4}{(4 - 1)^2 (4 - 2)}
\]

\[
= \frac{144.000.000 \times 4}{9 \times 2}
\]

\[
= \frac{576.000.000}{18} = 32.000.000
\]

La deviazione standard è quindi:

\[
\sigma_X = \sqrt{Var(X)} = \sqrt{32.000.000} \approx 5.656,85
\]


Passo 4: Calcolo della mediana

La mediana della distribuzione di Pareto si calcola con la formula:

\[
Mediana = a \times 2^{\frac{1}{\theta}}
\]

Sostituendo i valori:

\[
Mediana = 12.000 \times 2^{\frac{1}{4}}
\]

\[
= 12.000 \times 1,1892
\]

\[
\approx 14.270,49
\]

Proprietà della distribuzione di Pareto

Stabilità sotto scala

La variabile aleatoria di Pareto ha la proprietà di stabilità sotto scala, il che significa che se si moltiplica la variabile casuale di Pareto per una costante k, la distribuzione risultante sarà ancora una distribuzione con lo stesso parametro Ɵ e un parametro di scala moltiplicato per k (k * a).

Legge di potenza

La variabile casuale di Pareto segue una legge di potenza, che viene espressa come una funzione lineare su una scala log-log.

Questa proprietà implica che la coda della distribuzione decresce lentamente e che gli eventi rari e di grande impatto sono più probabili rispetto ad altre distribuzioni, ad esempio la distribuzione esponenziale.

La legge di potenza è alla base di molte distribuzioni di fenomeni naturali e sociali, come la popolarità di siti web, la frequenza delle parole e la distribuzione delle dimensioni delle città.

corso statistica

Relazione con la distribuzione esponenziale

La distribuzione esponenziale è vista come un caso limite della distribuzione di Pareto quando il parametro Ɵ tende all'infinito.

Relazione con la distribuzione Weibull

La distribuzione di Weibull viene considerata una generalizzazione della variabile causale di Pareto, in quanto include sia la distribuzione esponenziale sia la distribuzione di Pareto come casi particolari.

In questo articolo trovi un ripasso di tutte le variabili casuali e per capirne a pieno il significato di lascio un mio video nelle quali te le spiego con una metafora.

YouTube video
Variabili casuali spiegate semplice con una metafora statistica

Approssimazione della distribuzione di Pareto

Approssimazione della Pareto all'esponenziale

L'approssimazione della variabile aleatoria di Pareto alla distribuzione esponenziale viene fatta in situazioni specifiche.

Quando il parametro Ɵ è grande, la coda della distribuzione diventa meno pesante e inizia ad assomigliare a quella della distribuzione esponenziale.

Per approssimarla alla distribuzione esponenziale, segui questo processo:

  1. Trova il parametro Ɵ.
  2. Calcola il parametro di scala a (che è uguale al valore minimo possibile della variabile casuale di Pareto).
  3. Se Ɵ è grande (ad esempio, Ɵ > 10), può essere approssimata alla distribuzione esponenziale.
  4. Calcola il parametro λ (lambda) della distribuzione esponenziale approssimata come λ = Ɵ / a.
  5. Utilizza il parametro λ per calcolare la PDF e la funzione di ripartizione della distribuzione esponenziale approssimata.

È importante notare che l'approssimazione alla distribuzione esponenziale è valida solo quando il parametro Ɵ è grande. In altre situazioni, potrebbe non essere adeguata e sarebbero necessarie altre distribuzioni per una migliore approssimazione.

Se hai qualche dubbio sulla distribuzione esponenziale non ti preoccupare perché ho realizzato un video, con l'aiuto della calcolatrice scientifica SHARP, che ti permetterà di svolgere un'esercizio in modo semplice e veloce.

YouTube video
Esercizio svolto sulla distribuzione esponenziale con la calcolatrice scientifica SHARP

Approssimazione della Pareto alla Weibull

La distribuzione di Pareto può anche essere approssimata alla distribuzione di Weibull.

Questa approssimazione è utile quando si desidera modellare un fenomeno che mostra sia caratteristiche di legge di potenza sia caratteristiche di altre distribuzioni.

corsi di statistica

Distribuzione di Pareto Excel

Non esiste un comando specifico

Distribuzione di Pareto SPSS

Non esiste un comando specifico

Riassumendo

  • La distribuzione di Pareto descrive fenomeni in cui una piccola parte della popolazione detiene la maggior parte della ricchezza.
  • Il principio di Pareto, o regola 80/20, è un esempio di applicazione di questa distribuzione.
  • Vilfredo Pareto, l'economista italiano, fu il primo a descrivere la distribuzione e a dimostrare la sua applicabilità alla distribuzione del reddito e delle risorse.
  • La distribuzione ha proprietà matematiche interessanti, come la stabilità sotto scala e la legge di potenza, che la rendono utile nello studio di vari fenomeni.
  • La distribuzione di Pareto ha relazioni con altre distribuzioni, come la distribuzione esponenziale e la distribuzione di Weibull, che possono essere utili per approssimazioni e generalizzazioni.
  • La comprensione della distribuzione di Pareto è fondamentale per prendere decisioni informate nella gestione delle risorse e nell'analisi dei problemi legati alla distribuzione diseguale delle risorse e dei risultati.

"I dati e le statistiche servono a visualizzare meglio l’incomprensibile."
Fabrizio Caramagna

Iscriviti alla Newsletter

Se hai bisogno d’informazioni che non hai trovato nella sezione servizi o dei video corsi, scrivimi un messaggio o chiamami.
Domande, prezzi, richieste, delucidazioni...tutto quello che ti serve. Cercherò di risponderti entro le 24h.
Newsletter

Consenso al trattamento dei dati
Utilizzerò i tuoi dati (nome ed indirizzo mail) solo per inviarti gratuitamente via mail la newsletter mensile. Niente spam, niente scocciature, ti disiscrivi in un click quando vuoi.

arrow-up-circle
linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram