adriano gilardone Docente di Statistica Matematica Excel Spss sfruttare excel consulenze statistiche lezione videocorsi

Distribuzione ipergeometrica

YouTube video
Postato il 26 Aprile 2023
Tag

In uno degli articoli precedenti ti ho parlato della distribuzione binomiale. Oggi invece affronteremo la distribuzione ipergeometrica, molto simile alla precedente, ma che si differenzia dal fatto che gli eventi sono indipendenti mentre nella binomiale sono dipendenti.

Cos'è la distribuzione ipergeometrica

La variabile aleatoria ipergeometrica è una distribuzione di probabilità discreta. Viene utilizzata per stimare la probabilità di ottenere un certo numero di successi in un campione di dimensione fissa, estratto senza reimmissione (o reinserimento, o riposizione) da una popolazione finita.

Significa che, una volta estratti n elementi dal campione, essi vengono rimossi e non possono essere selezionati nuovamente.

Caratteristiche della distribuzione ipergeometrica

Asimmetria

Questa distribuzione è asimmetrica e la sua forma dipende dalla dimensione del campione rispetto alla popolazione, nonché dal numero di successi e di insuccessi nella stessa.

Relazione con la distribuzione binomiale

Una proprietà fondamentale della distribuzione ipergeometrica è la sua relazione con la variabile casuale binomiale.

La principale differenza è che la variabile casuale ipergeometrica presume una popolazione finita e il campione viene estratto senza reinserimento (eventi dipendenti), mentre nella variabile casuale binomiale la popolazione è infinita e il campione viene estratto con reimmissione (eventi indipendenti).

Se vuoi approfondire la distribuzione binomiale, ti metto a disposizione una lezione presa dal mio videocorso su probabilità e variabili casuali.

YouTube video
Esercizio svolto sulla distribuzione binomiale

Quando si usa la distribuzione ipergeometrica

La distribuzione ipergeometrica può essere utilizzata nei seguenti casi:

  • Quando si devono calcolare le probabilità di ottenere un certo numero di successi in un campione di n prove dipendenti.
  • Quando si devono confrontare due campioni per valutare se provengono dalla stessa popolazione, in particolare quando la popolazione è piccola.
  • Quando si effettuano test di ipotesi e si vuole calcolare la probabilità di ottenere un certo numero di successi sotto l'ipotesi nulla.
  • Quando si eseguono analisi di controllo di qualità per valutare la probabilità di trovare difetti in un lotto di prodotti.
  • Quando si effettuano studi di biologia per valutare la probabilità di trovare un certo numero di individui di una specie in un campione di dimensioni note.

In generale, la distribuzione ipergeometrica viene utilizzata quando la popolazione è finita e non è possibile effettuare l'assunzione di indipendenza tra le osservazioni.

Distribuzione di probabilità

Prima di tutto devi definire i valori dei parametri della distribuzione ipergeometrica, che sono:

N = numerosità della popolazione

n = numerosità del campione

k = successi della popolazione

x = successi del campione

Funzione di massa di probabilità

distribuzione ipergeometrica

Questa formula fornisce la probabilità di ottenere esattamente x successi in un campione di dimensione n estratto da una popolazione di dimensione N con k successi.

Ricordandoti che un numero fattoriale (n!) è la moltiplicazione di quel numero per tutti i numeri interi precedenti, esempio: 4! = 4 * 3 * 2 * 1, di seguito trovi passaggi per il calcolo della funzione di massa di probabilità.

Calcola il coefficiente binomiale dei successi

distribuzione ipergeometrica

Adesso devi calcolare il primo coefficiente della formula che rappresenta le combinazioni di x successi del campione all'interno dei k successi della popolazione.

Calcola il coefficiente binomiale degli insuccessi

distribuzione ipergeometrica

Ora trova il secondo coefficiente della formula che rappresenta le combinazioni di n-x insuccessi del campione all'interno dei N-k insuccessi della popolazione.

Calcola il coefficiente binomiale della numerosità

distribuzione ipergeometrica

Infine trova l'ultimo coefficiente che determina le combinazioni di n osservazioni del campione all'interno delle N osservazioni della popolazione.

Applica la formula

Moltiplica i primi due coefficienti binomiali e dividili per il terzo. Il risultato ottenuto è la probabilità calcolata per il valore x.

Verifica che i risultati siano plausibili

Assicurati che il risultato ottenuto sia un valore compreso tra 0 e 1 e che la somma delle probabilità per tutti i possibili valori di k sia uguale a 1.

Funzione di ripartizione

La funzione di ripartizione di una distribuzione binomiale è invece data da:

distribuzione ipergeometrica

La funzione ci informa sulla probabilità cumulata, ovvero che il numero di successi sia inferiore o uguale a un determinato valore x.

Come tutte le funzioni di ripartizioni discrete devi sommare le probabilità che vanno dalla x più piccola fino a quella desiderata.

Media e varianza

Come già dovresti sapere la media si ottiene moltiplicando le modalità per le frequenze assolute e dividendo il tutto per n.

Qui però hai le probabilità che sono uguali alle frequenze relative della statistica descrittiva e quindi ti basterebbe moltiplicarle per le modalità x, senza dividere il tutto per n.

Ma la variabile ipergeometrica, come tutte le variabili casuali, ha una formula che ti calcola direttamente media, varianza e deviazione standard.

MEDIA = E(X) = n * ( k / n )

Nota: Il simbolo di un valore atteso di una qualsiasi variabile casuale è E(X) perchè deriva dall’inglese Expectation, cioè aspettativa che in statistica è sinonimo di media.

VARIANZA = V(X) = (n*k) * (N-k) * (N-n) / [N2 * (N-1)]

DEVIAZIONE STANDARD = σ(X) = √ (n*k) * (N-k) * (N-n) / [N2 * (N-1)]

Se ancora hai dubbi sulla formula non ti preoccupare perché ho realizzato un video, con l'aiuto della calcolatrice scientifica SHARP, che ti permetterà di svolgere un'esercizio sulla distribuzione ipergeometrica in modo semplice e veloce.

YouTube video

Esempi di applicazione della distribuzione ipergeometrica

Immagina di avere una scatola piena di palline di due colori diversi e di cui conosci il loro numero.

La distribuzione ipergeometrica è come una formula magica che ti aiuta a scoprire la probabilità di estrarre un certo numero di palline, senza dover guardare nella scatola.

Ad esempio, se ci sono 20 palline nella scatola, di cui 12 palline rosse e 8 palline nere, e vuoi prenderne 5 a caso, la distribuzione ipergeometrica ti aiuta a calcolare la probabilità, per esempio, di ottenere 3 palline rosse in quel campione di 5 palline.

Distribuzione ipergeometrica EXCEL

DISTRIB.IPERGEOM.N (s_campione; num_campione; s_pop; num_pop; cumulativo)

Distribuzione ipergeometrica SPSS

Non esiste un comando specifico.

Riassumendo

  • La distribuzione ipergeometrica è una distribuzione di probabilità discreta, che fornisce la probabilità di ottenere un certo numero di successi in un campione estratto senza reintroduzione da una popolazione finita.
  • Questa distribuzione è asimmetrica e la sua forma dipende dalla dimensione del campione rispetto alla popolazione, nonché dal numero di successi e di insuccessi nella popolazione.
  • La distribuzione ipergeometrica può essere vista come una generalizzazione della distribuzione binomiale, dove gli eventi non sono più indipendenti.
  • La distribuzione ipergeometrica può essere usata in diversi casi tra cui test di ipotesi, analisi di controllo, studi di biologia.

"La statistica: l’unica scienza che permette a esperti diversi, usando gli stessi numeri, di trarne diverse conclusioni."
Evan Esar

Ripetizioni private

Ho intrapreso una interessante collaborazione con il sito di TROVAPROF.IT

Questa start-up mette in relazione studenti che cercano lezioni private con professori di qualsiasi materia. Se stai cercano delle ripetizioni per le materie che non tratto io, allora ti consiglio di fare un salto su TROVAPROF.IT, un portale completamente gratuito per dare o ricevere lezioni private.

Iscriviti alla Newsletter

Se hai bisogno d’informazioni che non hai trovato nella sezione servizi o dei video corsi, scrivimi un messaggio o chiamami.
Domande, prezzi, richieste, delucidazioni...tutto quello che ti serve. Cercherò di risponderti entro le 24h.
Newsletter

Consenso al trattamento dei dati
Utilizzerò i tuoi dati (nome ed indirizzo mail) solo per inviarti gratuitamente via mail la newsletter mensile. Niente spam, niente scocciature, ti disiscrivi in un click quando vuoi.

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram