In uno degli articoli precedenti ti ho parlato della . Oggi invece affronteremo la distribuzione ipergeometrica, molto simile alla precedente, ma che si differenzia dal fatto che gli eventi sono indipendenti mentre nella binomiale sono dipendenti.
La variabile aleatoria ipergeometrica è una distribuzione di probabilità discreta. Viene utilizzata per stimare la probabilità di ottenere un certo numero di successi in un campione di dimensione fissa, estratto senza reimmissione (o reinserimento, o riposizione) da una popolazione finita.
Significa che, una volta estratti n elementi dal campione, essi vengono rimossi e non possono essere selezionati nuovamente.
Questa distribuzione è asimmetrica e la sua forma dipende dalla dimensione del campione rispetto alla popolazione, nonché dal numero di successi e di insuccessi nella stessa.
Una proprietà fondamentale della distribuzione ipergeometrica è la sua relazione con la variabile casuale binomiale.
La principale differenza è che la variabile casuale ipergeometrica presume una popolazione finita e il campione viene estratto senza reinserimento (eventi dipendenti), mentre nella variabile casuale binomiale la popolazione è infinita e il campione viene estratto con reimmissione (eventi indipendenti).
Se vuoi approfondire la distribuzione binomiale, ti metto a disposizione una lezione presa dal mio videocorso su probabilità e variabili casuali.
La distribuzione ipergeometrica può essere utilizzata nei seguenti casi:
In generale, la distribuzione ipergeometrica viene utilizzata quando la popolazione è finita e non è possibile effettuare l'assunzione di indipendenza tra le osservazioni.
Prima di tutto devi definire i valori dei parametri della distribuzione ipergeometrica, che sono:
N = numerosità della popolazione
n = numerosità del campione
k = successi della popolazione
x = successi del campione
Questa formula fornisce la probabilità di ottenere esattamente x successi in un campione di dimensione n estratto da una popolazione di dimensione N con k successi.
Ricordandoti che un numero fattoriale (n!) è la moltiplicazione di quel numero per tutti i numeri interi precedenti, esempio: 4! = 4 * 3 * 2 * 1, di seguito trovi passaggi per il calcolo della funzione di massa di probabilità.
Adesso devi calcolare il primo coefficiente della formula che rappresenta le combinazioni di x successi del campione all'interno dei k successi della popolazione.
Ora trova il secondo coefficiente della formula che rappresenta le combinazioni di n-x insuccessi del campione all'interno dei N-k insuccessi della popolazione.
Infine trova l'ultimo coefficiente che determina le combinazioni di n osservazioni del campione all'interno delle N osservazioni della popolazione.
Moltiplica i primi due coefficienti binomiali e dividili per il terzo. Il risultato ottenuto è la probabilità calcolata per il valore x.
Assicurati che il risultato ottenuto sia un valore compreso tra 0 e 1 e che la somma delle probabilità per tutti i possibili valori di k sia uguale a 1.
La funzione di ripartizione di una distribuzione binomiale è invece data da:
La funzione ci informa sulla probabilità cumulata, ovvero che il numero di successi sia inferiore o uguale a un determinato valore x.
Come tutte le funzioni di ripartizioni discrete devi sommare le probabilità che vanno dalla x più piccola fino a quella desiderata.
Come già dovresti sapere la media si ottiene moltiplicando le modalità per le frequenze assolute e dividendo il tutto per n.
Qui però hai le probabilità che sono uguali alle frequenze relative della statistica descrittiva e quindi ti basterebbe moltiplicarle per le modalità x, senza dividere il tutto per n.
Ma la variabile ipergeometrica, come tutte le variabili casuali, ha una formula che ti calcola direttamente media, varianza e deviazione standard.
MEDIA = E(X) = n * ( k / n )
Nota: Il simbolo di un valore atteso di una qualsiasi variabile casuale è E(X) perchè deriva dall’inglese Expectation, cioè aspettativa che in statistica è sinonimo di media.
VARIANZA = V(X) = (n*k) * (N-k) * (N-n) / [N2 * (N-1)]
DEVIAZIONE STANDARD = σ(X) = √ (n*k) * (N-k) * (N-n) / [N2 * (N-1)]
Se ancora hai dubbi sulla formula non ti preoccupare perché ho realizzato un video, con l'aiuto della calcolatrice scientifica SHARP, che ti permetterà di svolgere un'esercizio sulla distribuzione ipergeometrica in modo semplice e veloce.
Immagina di avere una scatola piena di palline di due colori diversi e di cui conosci il loro numero.
La distribuzione ipergeometrica è come una formula magica che ti aiuta a scoprire la probabilità di estrarre un certo numero di palline, senza dover guardare nella scatola.
Ad esempio, se ci sono 20 palline nella scatola, di cui 12 palline rosse e 8 palline nere, e vuoi prenderne 5 a caso, la distribuzione ipergeometrica ti aiuta a calcolare la probabilità, per esempio, di ottenere 3 palline rosse in quel campione di 5 palline.
DISTRIB.IPERGEOM.N (s_campione; num_campione; s_pop; num_pop; cumulativo)
Non esiste un comando specifico.
"La statistica: l’unica scienza che permette a esperti diversi, usando gli stessi numeri, di trarne diverse conclusioni."
Evan Esar