Benvenuto nel mio blog dove troverai articoli interessanti sul mondo della statistica e dell’analisi dati.
Clicca su una delle categorie qua sotto o utilizza i tag nella colonna di destra.
L'uso della regressione logistica è aumentato nel corso degli anni '80 e attualmente costituisce uno dei metodi più utilizzati nella ricerca nelle scienze della salute e in particolare in epidemiologia. […]
La distribuzione di Poisson è una variabile casuale discreta usata per contare il numero di volte con cui un certo evento si verifica in un arco di tempo. Esempi distribuzione […]
La distribuzione binomiale è una variabile casuale discreta usata per probabilizzare il numero di successi ottenuti eseguendo un certo numero di prove di uno stesso esperimento. Se viene compiuta una […]
Una variabile casuale X è una variabile il cui valore dipende dall'esito di un fenomeno aleatorio cioè che si riferisce a un evento casuale. Possiamo anche descriverlo come una funzione […]
Il test di Kruskal-Wallis (dal nome dell’inventore Allen Wallis) noto anche come test H, è l'alternativa non parametrica al test ANOVA unidirezionale per dati non accoppiati. È un'estensione del test […]
Il test di Mann-Whitney è il test non parametrico che si usa al posto del t-test a campioni indipendenti quando non è soddisfatta la normalità nella distribuzione dei due campioni. […]
Il t-test a campioni indipendenti, chiamato anche t-test dei due campioni, o test t di Student, è un test statistico inferenziale che determina se esiste una differenza significativa tra le […]
Il t-test a campioni accoppiati, chiamato anche t-test a campioni appaiati o t-test per campioni dipendenti, è uno strumento di analisi dati utilizzato per determinare se la differenza media tra […]
Un odds ratio (OR) o rapporto di probabilità è una misura di associazione molto utilizzata in epidemiologia e rappresenta la probabilità che si verifichi un risultato data un’esposizione a un […]
Anova è l’acronimo di Analysis of Variance, cioè l’analisi della varianza è quella tecnica statistica che ti permette di verificare se c’è relazione tra una variabile dipendente quantitativa e una […]
L’alpha di Cronbach è un indice statistico molto utilizzato al giorno d’oggi che consente di misurare l’affidabilità interna di un questionario composto da domande quantitative (items) su scale Likert. Per […]
La cluster analysis, detta analisi dei cluster o dei gruppi in italiano, è una tecnica di data analysis multivariata che permette di suddividere le osservazioni contenute nel dataset in gruppi, […]
L’analisi delle componenti principali, detta anche ACP oppure PCA dall’inglese principal component analysis, è una tecnica statistica multivariata molto utilizzata soprattutto nel campo della medicina e della psicologia dove si […]
Il Boxplot, chiamato anche grafico a scatola e baffi per la sua forma geometrica, è una rappresentazione grafica molto importante utilizzata nell’ambito della statistica descrittiva per estrapolare informazioni riguardanti la […]
L’obiettivo principale della statistica è quello di fare una verifica di ipotesi. Ad esempio potresti condurre un esperimento per testare se un certo medicinale sia efficace contro il mal di […]
Livello di confidenza Nell’ambito della statistica inferenziale molto spesso si ha la necessità di stimare un numero che non si conosce. Tale numero prende il nome di parametro della popolazione […]
La distribuzione normale, detta anche curva Gaussiana dal famoso matematico tedesco Gauss, è senza dubbio la distribuzione più usata in statistica. Probabilmente non te ne sei mai accorto, ma sei […]
Il sistema di ipotesi Il test del Chi-quadrato di indipendenza è un test non parametrico che si effettua con lo scopo di verificare se esiste associazione, o dipendenza, tra due […]
Significato del p-value Il p-value, o valore p è la probabilità di ottenere uno specifico insieme di osservazioni nel caso in cui l’ipotesi nulla fosse vera. Questo numero viene calcolato […]
L’indice di eterogeneità di Gini misura quanto una distribuzione statistica sia appunto eterogenea ossia quanto le frequenze differiscano tra di loro (etero = diverso, gen = generale). La varianza e la […]
La differenza media semplice o la differenza media con ripetizione, sono indici di mutua variabilità che si ottiengono facendo la media aritmetica tra tutte le possibili differenze, in valore assoluto, […]
Lo scarto o scostamento semplice medio è un indicatore di dispersione di valori numerici che deve essere affiancato alla media aritmetica. In questo articolo ho già spiegato come la media […]
I numeri indice sono dei rapporti statistici, delle divisioni quindi, tra l’intensità di un fenomeno al tempo t e l’intensità dello stesso fenomeno rilevata in un altro tempo. Risultano molto […]
L’indice di concentrazione di Gini misura il grado di diseguaglianza nella distribuzione del reddito. E’ impiegato negli studi economici-politici anche per altri fenomeni quali la ricchezza o le voci di […]
Per comprendere bene le caratteristiche iniziali di un fenomeno è importante sapere quali sono i suoi indici di posizione. In questo articolo ho già spiegato il significato della mediana dicendo che […]
Che cos'è la mediana La mediana è uno dei piú importanti indicatori della statistica descrittiva. Insieme alla media aritmetica e alla moda forma parte degli indici di sintesi che servono […]
Un concetto molto importante quando si studia un modello di regressione lineare è quello della scomposizione della varianza totale nella somma di due varianze: varianza spiegata e varianza residua. In […]
Come visto in un precedente articolo, la varianza è una misura di quanto variano i numeri. A dir la verità avevamo sottolineato come la sua radice quadrata, la deviazione standard, fosse […]
L’articolo di oggi tratta uno degli argomenti più importanti di tutta la statistica nell’ambito delle relazioni tra due variabili: la retta di regressione lineare dei minimi quadrati. In sintesi scoprirai […]
Quando si mettono in relazione due variabili quantitative, la prima cosa a cui si pensa è calcolare la correlazione lineare. Esistono tanti tipi di relazioni tra due fenomeni, ma questo […]
Nell’ambito dello studio sulla dipendenza in distribuzione, cioè la connessione tra due caratteri qualitativi, sono di particolare importanza gli indici che mostrano l’intensità del grado di connessione e l'indice V […]
Se qualche volta nella vita hai avuto a che fare con la statistica, probabilmente ti sarai imbattuto nel Chi Quadro di Pearson. Il suo utilizzo è vastissimo e anche se […]
Il coefficiente di variazione è un indice che serve per confrontare la variabilità di due o più fenomeni. Un errore grave è quello di usare la deviazione standard, che è […]
La deviazione standard o scarto quadratico medio è un indice di quanto i numeri si distanzino dalla media aritmetica. In pratica misura "mediamente" quanto i valori di una distribuzione si […]
Uno dei più importanti indicatori per misurare la variabilità di una distribuzione è la varianza. In questo articolo ho spiegato come la media aritmetica sia l’indicatore di sintesi più comune, ma […]
Come si definisce la media aritmetica Definizione E' un indicatore di sintesi che misura la tendenza centrale in un contesto di equidistribuzione. Ovviamente questa definizione non è l'unica perché ne […]