whatsapp

adriano gilardone Docente di Statistica Matematica Excel Spss sfruttare excel consulenze statistiche lezione videocorsi

blog

blog

Gli Stimatori e le 3 proprietà fondamentali

Ultima modifica (5 Marzo 2025)

YouTube video

Postato il 23 Maggio 2023

Tag

Contenuti nascondi

1 Quando si usano gli stimatori

2 Metodi di stima

2.1 Metodo dei minimi quadrati

2.2 Metodo di massima verosimiglianza

2.3 Metodo dei momenti

3 Proprietà degli stimatori

3.1 Correttezza o non distorsione

3.2 Consistenza

4 Stimatore della media

4.1 Calcolo della media campionaria

4.2 Correttezza della media campionaria

4.3 Consistenza della media campionaria

4.4 Efficenza della media campionaria

5 Stimatore della varianza

5.1 Calcolo della varianza campionaria corretta

5.2 Correttezza della varianza campionaria corretta

5.2.1 Esempio estrazione CON reinserimento

5.2.2 Esempio estrazione SENZA reinserimento

6 Considerazioni sul parametro da stimare

6.1 Possibili valori del parametro

6.2 Confronto tra diversi stimatori

7 Stimatori Excel

8 Stimatori SPSS

Uno stimatore è una funzione che utilizza i dati di un campione per stimare un parametro della popolazione. L'obiettivo è fornire una stima il più possibile accurata di parametri come la media, la varianza o una proporzione.

Gli stimatori sono fondamentali nell'inferenza statistica, poiché consentono di ottenere informazioni sulla popolazione senza doverla analizzare interamente.

La scelta dello stimatore più adeguato dipende dal contesto dell'analisi e dalle proprietà desiderate (come correttezza, consistenza ed efficienza). Un buono stimatore deve essere affidabile, preciso e facilmente calcolabile.

Esempi comuni di stimatori sono:

Media campionaria: utilizzata per stimare la media della popolazione.

Varianza campionaria corretta: impiegata per stimare la varianza della popolazione.

Proporzione campionaria: utile per stimare la percentuale di una certa caratteristica in una popolazione.

corso statistica

Quando si usano gli stimatori

Gli stimatori vengono utilizzati in diverse tecniche statistiche, tra cui possiamo elencare:

Regressione lineare: per stimare i parametri di un modello lineare, come regressori e intercetta, che descrivono la relazione tra una variabile dipendente e una o più variabili indipendenti.

YouTube video

Serie storiche: per analizzare e prevedere l'evoluzione di fenomeni nel tempo utilizzando modelli che dipendono dai parametri stimati.

Grafico a linee

Analisi demografiche: per stimare i tassi di rischio.

YouTube video

Valutazione del rischio: per quantificare l'incertezza associata a decisioni basate su dati limitati o variabili casuali.

YouTube video

Metodi di stima

Esistono diversi metodi per stimare un parametro della popolazione. Di seguito ti riporto i tre principali che puoi trovare in un esame universitario.

Metodo dei minimi quadrati

Lo stimatore dei minimi quadrati è quello che minimizza la somma degli errori quadratici tra i valori osservati e i valori stimati.

Gli errori quadratici sono la differenza tra il valore osservato e il valore teorico il tutto elevato al quadrato dimodoché conti il numero e non il segno. Sommando poi tutti questi errori si ottiene un valore che è il più piccolo possibile rispetto ad altre stime.

L'esempio tipico di questo metodo si ha nella regressione lineare quando si stimano i coefficienti della funzione lineare che descrive la relazione tra la variabile dipendente e le variabili indipendenti.

Metodo di massima verosimiglianza

Lo stimatore di massima verosimiglianza è quello che massimizza la funzione di verosimiglianza, ovvero la probabilità di osservare i dati del campione dati i valori del parametro.

Metodo dei momenti

Il metodo dei momenti è un approccio per stimare i parametri di una distribuzione confrontando i momenti campionari con i momenti teorici della distribuzione.

Sicuramente conosci già il momento primo perché è la media aritmetica e il momento secondo che è utilizzato nel metodo indiretto per il calcolo della varianza.

Proprietà degli stimatori

Correttezza o non distorsione

Uno stimatore è non distorto se il suo valore atteso è uguale al parametro da stimare. In altre parole, uno stimatore non distorto non presenta errori sistematici.

\(\displaystyle \mathbf{E} (T) = \theta \)

T è il simbolo di un generico stimatore che verrà cambiato a seconda dei casi. Per esempio se ci fosse la media campionaria scriveresti E (X_m), mentre per la varianza campionaria E (S²).

Ɵ invece è un numero.

Consistenza

Uno stimatore è consistente se la sua varianza tende a zero quando la dimensione del campione aumenta. In altre parole, uno stimatore consistente diventa sempre più preciso con l'aumentare delle osservazioni.

\(\displaystyle \lim_{n \to \infty} P( |T_n - \theta| > \varepsilon ) = 0 \)

per ogni ε > 0, dove:

\(\displaystyle P( |T_n - \theta| > \varepsilon ) \)

rappresenta la probabilità che la differenza assoluta tra lo stimatore Tn e il vero valore del parametro θ abbia un certo valore.

Ti ricordo che ε è il simbolo che in matematica si usa per dire "un numero molto piccolo".

Efficienza

L'efficienza di uno stimatore è una misura della sua precisione rispetto ad altri stimatori. Uno stimatore è efficiente se ha la minima varianza tra tutti gli stimatori corretti.

Comunque per capire nel concreto come si calcolano e cosa vogliono dire queste proprietà degli stimatori, ti rimando al mio videocorso sulla statistica inferenziale.

analisi dati tesi

Stimatore della media

Vediamo ora i due più importanti stimatori partendo da quello della media.

Come prima cosa definiamo:

x_i = modalità i-esima del campione

n_i = frequenza i-esima del campione

n = numerosità del campione

Calcolo della media campionaria

Si tratta di calcolare una semplice media aritmetica attraverso la classica formula

∑ ( xi * ni ) / n

Se hai dubbi guardati la lezione presa dal mio videocorso sulla statistica descrittiva

YouTube video — Esercizio svolto sulla media aritmetica

Lo stimatore della media è la media campionaria, che viene utilizzata per stimare la media della popolazione.

Correttezza della media campionaria

Tale stimatore è corretto perché se prendo tutti i possibili campioni di una popolazione e calcolo la loro media, ottengo una distribuzione tale per cui il suo valor medio è uguale alla media della popolazione iniziale, che è proprio il parametro che stai stimando.

Esempio

Supponi che hai una popolazione di soli tre individui che hanno rispettivamente 10, 20 e 30 anni.

La media della loro età è: µ = ( 10 + 20 + 30 ) / 3 = 20 anni.

Adesso prendi tutti i possibili campioni di due persone e calcolaci la media:

Campione 1 ( 10 ; 20) : Media 1 = ( 10 + 20 ) / 2 = 15

Campione 2 ( 10 ; 30) : Media 2 = ( 10 + 30 ) / 2 = 20

Campione 3 ( 20 ; 30) : Media 3 = ( 10 + 30 ) / 2 = 25

La proprietà di correttezza si ottiene perché il valor medio dello stimatore, quindi di questa nuova distribuzione, è uguale alla media della popolazione trovata in precedenza.

E (Xm) = ( 15 + 20 + 25 ) / 3 = 20 anni.

µ = ( 10 + 20 + 30 ) / 3 = 20 anni.

E (Xm) = µ

Questa dimostrazione si può fare perchè ho preso numeri piccoli, ma ovviamente vale anche se avessi una popolazione e un campione molto più grandi.

Consistenza della media campionaria

Per valutare la consistenza devi vedere se la varianza dello stimatore tende a zero quando la numerosità (n) del campione tende all'infinito, quindi concettualmente tende alla numerosità della popolazione.

La varianza della media campionaria è uguale a σ² / n

Quindi se al posto di n metti un numero grandissimo ottieni che la varianza diventa piccolissima e quindi tende a zero. Ecco dunque verificata la consistenza della media campionaria.

Efficenza della media campionaria

Per capire l'efficienza dovresti prendere altri stimatori simili, come la mediana o una media ponderata diversamente, e confrontare le rispettive varianze.

Puoi facilmente trovare che la varianza della media campionaria sarà sempre la più piccola dimostrando quindi la proprietà dell'efficienza.

Stimatore della varianza

Lo stimatore della varianza è la varianza campionaria corretta, che viene utilizzata per stimare la varianza della popolazione.

Se prendessi la varianza campionaria non corretta questa sarebbe, come dice il nome stesso, uno stimatore distorto.

Calcolo della varianza campionaria corretta

Si tratta di calcolare una semplice varianza con la differenza che alla fine del calcolo devi moltiplicarla per un fattore di correzione.

Ti lascio un video con il quale puoi facilmente apprendere, attraverso l'uso della calcolatrice SHARP, il calcolo di entrambe le varianze.

YouTube video — Esercizio svolto sulla varianza con la calcolatrice SHARP

Correttezza della varianza campionaria corretta

Per farti comprendere il perché questo stimatore sia non distorno riprendiamo l'esempio precedente quello in cui ci sono tre individui di 10, 20 e 30 anni e calcoliamo la varianza della popolazione sapendo che la media è 20 anni.

Esempio estrazione CON reinserimento

generalmente si presuppone che il campione estratto sia con reinserimento quindi tutti i casi possibili diventano 9 perché è come se estraessi un individuo a caso al primo tentativo e poi potessi ripescarlo al secondo.

Il fattore di correzione per cui devi moltiplicare la varianza è: n / (n-1)

La varianza della popolazione è: σ² = ( 10² + 20² + 30² ) / 3 - 20² = 66,67

Ora prendi tutti i possibili campioni e calcolaci la varianza per ciascuno:

Campione 1 ( 10 ; 10) : Varianza 1 = ( 10² + 10² ) / 2 - 10² = 0

Campione 2 ( 10 ; 20) : Varianza 2 = ( 10² + 20² ) / 2 - 15² = 25

Campione 3 ( 10 ; 30) : Varianza 3 = ( 10² + 30² ) / 2 - 20² = 100

Campione 4 ( 20 ; 10) : Varianza 4 = ( 20² + 10² ) / 2 - 15² = 25

Campione 5 ( 20 ; 20) : Varianza 5 = ( 20² + 20² ) / 2 - 20² = 0

Campione 6 ( 20 ; 30) : Varianza 6 = ( 20² + 30² ) / 2 - 25² = 25

Campione 7 ( 30 ; 10) : Varianza 7 = ( 30² + 10² ) / 2 - 20² = 100

Campione 8 ( 30 ; 20) : Varianza 8 = ( 30² + 20² ) / 2 - 25² = 25

Campione 9 ( 30 ; 30) : Varianza 9 = ( 30² + 30² ) / 2 - 30² = 0

E (S²) = ( 0 + 25 + 100 + 25 + 0 + 25 + 100 + 25 + 0 ) / 9 = 33,33

σ² = ( 10² + 20² + 30² ) / 3 - 20² = 66,67

E (S²) ≠ σ² come vedi la varianza campionaria risulta distorta, ma se la moltiplichi per il fattore di correzione ti risulterà uguale alla varianza della popolazione

E (S²_corr) = E (S²) * n / (n-1) = 33,33 * 2/1 = 66,67

Esempio estrazione SENZA reinserimento

Ti propongo anche il caso in cui le estrazioni siano fatte senza reinserimento:

Il fattore di correzione per cui devi moltiplicare la varianza è: n * (N-1) / N.

Dove n = numerosità del campione (in questo esempio 2), mentre N = numerosità della popolazione (in questo esempio 3)

La varianza della popolazione è: σ² = ( 10² + 20² + 30² ) / 3 - 20² = 66,67

Ora prendi tutti i possibili campioni e calcolaci la varianza per ciascuno:

Campione 1 ( 10 ; 20) : Varianza 1 = ( 10² + 20² ) / 2 - 15² = 25

Campione 2 ( 10 ; 30) : Varianza 2 = ( 10² + 30² ) / 2 - 20² = 100

Campione 3 ( 20 ; 30) : Varianza 3 = ( 20² + 30² ) / 2 - 25² = 25

E (S²) = ( 25 + 100 + 25 ) / 3 = 50

σ² = ( 10² + 20² + 30² ) / 3 - 20² = 66,67

E (S²) ≠ σ² come vedi anche in questo caso la varianza campionaria risulta distorta, ma se la moltiplichi per il fattore di correzione ti risulterà uguale alla varianza della popolazione

E (S²_corr) = E (S²) * n * (N-1) / N = 50 * 2 * 2/3 = 66,67

Dopo tutti questi calcoli dei vari stimatori, se ti sono rimasti dubbi sul concetto della varianza guarda questo mio video in cui te la spiego in modo semplice e chiaro utilizzando una metafora statistica.

YouTube video — Varianza spiegata con una metafora

Considerazioni sul parametro da stimare

Possibili valori del parametro

Quando si sceglie uno stimatore, è importante considerare i possibili valori del parametro da stimare.

Alcuni stimatori possono essere più adatti per stimare parametri che assumono valori in un intervallo specifico, mentre altri possono essere più adatti per parametri con valori su una scala più ampia.

Confronto tra diversi stimatori

Il confronto tra stimatori può essere basato su varie proprietà, come la correttezza, la consistenza e l'efficienza.

È fondamentale selezionare uno stimatore che sia appropriato per il parametro di interesse e che possa fornire stime accurate e precise.

Stimatori Excel

Non esiste un comando specifico

Stimatori SPSS

Non esiste un comando specifico

Riassumendo

Gli stimatori sono strumenti fondamentali nella statistica inferenziale per trarre conclusioni sulla popolazione a partire dai dati del campione.
Esistono diversi metodi di stima: metodo dei minimi quadrati, metodo di massima verosimiglianza e metodo dei momenti.
Le proprietà importanti degli stimatori sono correttezza, consistenza e efficienza.
La scelta dello stimatore più appropriato dipende dalla natura dei dati, dal parametro da stimare e dalle proprietà desiderate dello stimatore.
Considerare l'intervallo di confidenza associato alla stima è fondamentale, poiché indica l'incertezza e la precisione della stima.
Confrontare diversi stimatori può essere utile per determinare quale sia il migliore per un dato problema, basandosi sulle loro proprietà e sull'appropriatezza per il parametro di interesse.

"Se torturi i numeri abbastanza a lungo, confesseranno qualsiasi cosa."
Gregg Easterbrook

Iscriviti alla Newsletter

Se hai bisogno d’informazioni che non hai trovato nella sezione servizi o dei video corsi, scrivimi un messaggio o chiamami.
Domande, prezzi, richieste, delucidazioni...tutto quello che ti serve. Cercherò di risponderti entro le 24h.