blog
La distribuzione di Pareto è una variabile casuale continua che di solito rappresenta un modello di distribuzione dei redditi e di altre quantità che seguono il principio di Pareto, secondo cui, il 20% delle cause è responsabile dell'80% degli effetti.
La variabile aleatoria di Pareto è utile in generale quando si affrontano situazioni in cui una piccola percentuale di fattori è responsabile della maggior parte degli effetti o delle conseguenze e viene spesso utilizzata in questi settori:
Economia: per l'analisi della distribuzione del reddito e della ricchezza.
Gestione aziendale e marketing: tramite l'applicazione della regola 80/20, per identificare clienti e prodotti chiave. Se per ottenere l’80% delle vendite basta molto meno dell’20% dei clienti si è a rischio concentrazione.
Ingegneria: per la creazione di diagrammi di Pareto per identificare e risolvere problemi critici.
Analisi delle reti: per la descrizione delle proprietà di scale-free nelle reti complesse.
Scienza delle informazioni e delle comunicazioni: per la modellazione della popolarità di contenuti online come siti web, video e articoli.
Analisi del rischio e delle assicurazioni: per la valutazione del rischio e determinazione delle tariffe per eventi rari e ad alto impatto come catastrofi naturali o gravi incidenti.
Prima di tutto devi definire i valori dei parametri della variabile casuale di Pareto, che sono:
X = variabile casuale di interesse, rappresentata da valore positivo (x ≥ a)
a = parametro di scala. E' il valore minimo da dove inizia la distribuzione (a > 0)
Ɵ = parametro di forma, che mostra la "pesantezza" della coda della distribuzione (Ɵ > 0)
Come detto all'inizio, la distribuzione di Pareto è una variabile casuale continua, per cui non ha tanto senso conoscere la probabilità in un punto specifico.
Risulta più tangibile se ti faccio un esempio con la tua altezza. Calcolare la probabilità che tu sia alto/a 180 cm non è utile in quanto se tu fossi alto/a 180,1 cm già sarebbe un altro valore.
Per le variabili continue ha più senso calcolare la funzione di ripartizione. Detto questo dobbiamo comunque passare per la funzione di densità di probabilità che ti ricordo nelle variabili casuali discrete chiamiamo funzione di massa di probabilità.
La funzione di densità di probabilità (PDF) deve essere positiva e integrabile su tutto il dominio della variabile aleatoria.
Ricorda che questa formula è valida solo per x ≥ a. Se x < a, la PDF è uguale a 0. Solitamente quando si studiano i redditi, si fissa un reddito minimo che qui simboleggiamo con la lettera a.
In un esame universitario probabilmente dovrai ricavare il parametro Ɵ o il valore di a secondo le istruzioni del testo per poi poter calcolare le probabilità della funzione di ripartizione.
La funzione di ripartizione della distribuzione di Pareto rappresenta la probabilità che la variabile casuale sia minore o uguale a un determinato valore.
\(\displaystyle P(X \leq x) = 1 - \left(\frac{a}{x}\right)^\theta \)
Come detto prima dovrai identificare e sostituire i valori Ɵ e a nella formula, per poi calcolare la probabilità fino al punto x.
Anche qui ricorda che questa formula è valida solo per x ≥ a. Se x < a, la PDF è uguale a 0.
La media, la varianza e la mediana sono importanti misure statistiche che caratterizzano tutte le variabili casuali e di conseguenza anche quella di Pareto. Tutti e tre gli indicatori dipendono sia dal parametro Ɵ sia dal parametro di scala (a).
La media è definita solo per Ɵ > 1 e si calcola come segue:
\(\displaystyle E(X) = \frac{a \theta}{\theta - 1} \)
La varianza è definita solo per Ɵ > 2 e si calcola come segue:
\(\displaystyle \text{Var}(X) = \frac{E(X)^2}{\theta(\theta - 2)} \)
dove E ( X ) è la media calcolata nel passo precedente.
La mediana è definita per qualsiasi valore di Ɵ > 0 e si calcola come segue:
\(\displaystyle \text{Med}(X) = a \, 2^{\frac{1}{\theta}} \)
Se hai dubbi sulla mediana guarda questo mio video in cui te la spiego in modo semplice e chiaro utilizzando una metafora statistica.
Si consideri una distribuzione di Pareto con valore minimo \( a = 12.000 \) e media pari a \( 16.000 \). Si richiede di:
Tabella dei Dati:
\[
\begin{array}{|c|c|}
\hline
\textbf{Parametro} & \textbf{Valore} \\
\hline
a & 12.000 \\
E(X) & 16.000 \\
\hline
\end{array}
\]
Passo 1: Determinazione del parametro \( \theta \)
La media della distribuzione di Pareto è data dalla formula:
\[
E(X) = \frac{a \theta}{\theta - 1}
\]
Isoliamo \( \theta \):
\[
\theta - 1 = \frac{a \theta}{E(X)}
\]
\[
\theta = \frac{E(X)}{E(X) - a}
\]
Sostituiamo i valori numerici:
\[
\theta = \frac{16.000}{16.000 - 12.000} = \frac{16.000}{4.000} = 4
\]
Passo 2: Calcolo della probabilità \( P(16.500 \leq X \leq 19.500) \)
La funzione di ripartizione della distribuzione di Pareto è:
\[
P(X \leq x) = 1 - \left( \frac{a}{x} \right)^\theta
\]
Calcoliamo \( P(X \leq 19.500) \):
\[
P(X \leq 19.500) = 1 - \left( \frac{12.000}{19.500} \right)^4
\]
\[
= 1 - \left( 0,6154 \right)^4
\]
\[
= 1 - 0,1434 = 0,8566
\]
Calcoliamo \( P(X \leq 16.500) \):
\[
P(X \leq 16.500) = 1 - \left( \frac{12.000}{16.500} \right)^4
\]
\[
= 1 - \left( 0,7273 \right)^4
\]
\[
= 1 - 0,2798 = 0,7202
\]
Ora otteniamo la probabilità richiesta:
\[
P(16.500 \leq X \leq 19.500) = P(X \leq 19.500) - P(X \leq 16.500)
\]
\[
= 0,8566 - 0,7202 = 0,1364
\]
Passo 3: Calcolo della varianza
La varianza della distribuzione di Pareto è data dalla formula:
\[
Var(X) = \frac{a^2 \theta}{(\theta - 1)^2 (\theta - 2)}
\]
Sostituendo i valori:
\[
Var(X) = \frac{12.000^2 \times 4}{(4 - 1)^2 (4 - 2)}
\]
\[
= \frac{144.000.000 \times 4}{9 \times 2}
\]
\[
= \frac{576.000.000}{18} = 32.000.000
\]
La deviazione standard è quindi:
\[
\sigma_X = \sqrt{Var(X)} = \sqrt{32.000.000} \approx 5.656,85
\]
Passo 4: Calcolo della mediana
La mediana della distribuzione di Pareto si calcola con la formula:
\[
Mediana = a \times 2^{\frac{1}{\theta}}
\]
Sostituendo i valori:
\[
Mediana = 12.000 \times 2^{\frac{1}{4}}
\]
\[
= 12.000 \times 1,1892
\]
\[
\approx 14.270,49
\]
La variabile aleatoria di Pareto ha la proprietà di stabilità sotto scala, il che significa che se si moltiplica la variabile casuale di Pareto per una costante k, la distribuzione risultante sarà ancora una distribuzione con lo stesso parametro Ɵ e un parametro di scala moltiplicato per k (k * a).
La variabile casuale di Pareto segue una legge di potenza, che viene espressa come una funzione lineare su una scala log-log.
Questa proprietà implica che la coda della distribuzione decresce lentamente e che gli eventi rari e di grande impatto sono più probabili rispetto ad altre distribuzioni, ad esempio la distribuzione esponenziale.
La legge di potenza è alla base di molte distribuzioni di fenomeni naturali e sociali, come la popolarità di siti web, la frequenza delle parole e la distribuzione delle dimensioni delle città.
La distribuzione esponenziale è vista come un caso limite della distribuzione di Pareto quando il parametro Ɵ tende all'infinito.
La distribuzione di Weibull viene considerata una generalizzazione della variabile causale di Pareto, in quanto include sia la distribuzione esponenziale sia la distribuzione di Pareto come casi particolari.
In questo articolo trovi un ripasso di tutte le variabili casuali e per capirne a pieno il significato di lascio un mio video nelle quali te le spiego con una metafora.
L'approssimazione della variabile aleatoria di Pareto alla distribuzione esponenziale viene fatta in situazioni specifiche.
Quando il parametro Ɵ è grande, la coda della distribuzione diventa meno pesante e inizia ad assomigliare a quella della distribuzione esponenziale.
Per approssimarla alla distribuzione esponenziale, segui questo processo:
È importante notare che l'approssimazione alla distribuzione esponenziale è valida solo quando il parametro Ɵ è grande. In altre situazioni, potrebbe non essere adeguata e sarebbero necessarie altre distribuzioni per una migliore approssimazione.
Se hai qualche dubbio sulla distribuzione esponenziale non ti preoccupare perché ho realizzato un video, con l'aiuto della calcolatrice scientifica SHARP, che ti permetterà di svolgere un'esercizio in modo semplice e veloce.
La distribuzione di Pareto può anche essere approssimata alla distribuzione di Weibull.
Questa approssimazione è utile quando si desidera modellare un fenomeno che mostra sia caratteristiche di legge di potenza sia caratteristiche di altre distribuzioni.
Non esiste un comando specifico
Non esiste un comando specifico
"I dati e le statistiche servono a visualizzare meglio l’incomprensibile."
Fabrizio Caramagna
Iscriviti alla Newsletter