adriano gilardone Docente di Statistica Matematica Excel Spss sfruttare excel consulenze statistiche lezione videocorsi

Statistica bivariata: come analizzare la relazione tra 2 variabili

YouTube video
Postato il 11 Maggio 2020
Tag

Uno degli aspetti considerati più interessanti della statistica è la possibilità di cercare e analizzare le relazioni che si intessono tra due fenomeni, che a prima vista possono sempre distanti oppure scollegati tra loro. Ed è proprio da questo particolare aspetto che deriva il nome di statistica bivariata.

Ma quando si entra in questo campo?

Si parla di statistica bivariata quando, dopo aver rappresentato il campione o la popolazione con la statistica descrittiva, si passa ad una fase successiva in cui si cerca di individuare dei legami tra le variabili. Quando i caratteri incrociati sono solo due allora è il campo della statistica bivariata.

Per un ricercatore è molto importante vedere come si comportano i caratteri d’interesse, ma lo è ancor di più se sussistono dei legami fra essi.

Vediamo ora nel dettaglio quali sono le principali tecniche di statistica bivariata, che sono tre:

  1. Connessione o dipendenza in distribuzione
  2. Anova a una via o dipendenza in media
  3. Regressione lineare semplice

Connessione o dipendenza in distribuzione

Cos’è la statistica bivariata

La prima tecnica di statistica bivariata che analizzeremo in questo articolo è la connessione o dipendenza in distribuzione. Un primo aspetto da sottolineare quando si parla di questo argomento è che i caratteri devono essere entrambi qualitativi, o al massimo quantitativi riclassificati in categorie.

Qual è la differenza tra queste due tipologie di variabili?

Le variabili quantitative contengono dei valori numerici, che possono essere calcolate. Alcuni esempi possono essere l'età, la popolazione totale di una città, il numero di figli che ha una coppia.

Le variabili qualitative sono invece, come dice il nome stesso, valori qualitativi e quindi non legati ad un numero. Alcuni esempi possono essere il colore degli occhi, il titolo di studio, oppure il sesso biologico di una persona.

Una volta delineato a quale tipologia appartengono i caratteri che stiamo analizzando, si passa alla seconda fase. Si cerca quindi, attraverso il test del chi-quadrato, di stabilire se esiste la relazione tra le variabili che abbiamo preso in considerazione.

Come capirlo? Molto semplice: se il p-value del test è inferiore al livello di alfa prefissato (di solito il 5% o l’1%) allora puoi affermare che il legame è significativo.

Dopodiché esistono diversi indicatori che vanno da 0 a 1, che esprimono l'intensità di questa connessione: più il valore si avvicina a 1 e più forte sarà la relazione tra le due variabili. Se, invece, il valore fosse uguale a 0, ti ritroveresti nella situazione di indipendenza statistica: avrai avuto conferma che, tra i due caratteri presi in considerazione, non esiste nessuna relazione significativa.

Anova a una via o dipendenza in media

La seconda tecnica di statistica bivariata è l’anova, acronimo inglese di Analysis of Variance, che mette in relazione una variabile quantitativa con una qualitativa. Come si può notare fin da subito, questa è una delle differenze rispetto alla connessione o dipendenza in distribuzione analizzata precedentemente: come visto prima, infatti, in quel caso i due caratteri presi in considerazione dovevano appartenere alla stessa tipologia, mentre qui è centrale che siano di due tipi differenti.

In questo caso, lo scopo dell'Anova a una via (o dipendenza in media) è osservare se la media del carattere quantitativo varia al variare delle modalità del fenomeno qualitativo.

Quando si utilizza questa tecnica statistica, il primo passaggio da seguire è effettuare un F test e, se il suo p-value risulta significativo, allora vorrà dire che almeno una delle medie differisce dalle altre.

A questo punto, una volta compreso se esiste questa relazione tra le due variabili, si potrà passare a cercare di capirne l'intensità dell'F test. In questo caso, un indicatore molto usato per determinarlo si basa sulla scomposizione della varianza totale in varianza fra gruppi e varianza nei gruppi.

Il rapporto tra varianza fra gruppi e varianza totale dà luogo al rapporto di correlazione di Pearson o indice di dipendenza in media. Anche questo valore va da 0 a 1 e più ci si avvicina 1, più le medie saranno differenti, mentre se il valore fosse uguale a 0 vorrebbe dire che le medie sono tutte uguali e di conseguenza saremmo nella situazione di indipendenza in media.

Regressione lineare semplice

statistica bivariata

La terza e ultima tecnica di statistica bivariata è la regressione lineare semplice, che è uno dei modelli più diffusi in statistica per la previsione della relazione tra due variabili quantitative.

Una volta eseguita, il risultato che si ottiene è la retta di regressione lineare, nella quale il coefficiente angolare ti dice di quanto cresce, o decresce, il fenomeno dipendente Y grazie a un cambiamento unitario del carattere indipendente X. Se guardi il grafico qui sopra, vedrai proprio l'esempio di questo rapporto appena spiegato: all'aumentare della lunghezza, in questo caso il carattere indipendente X, aumenta anche il peso, che sarà quindi il fenomeno dipendente Y.

L'altro parametro è l'intercetta che esprime il valore di Y quando viene posta a zero la X, sempre se nella realtà ha senso fare questa operazione.

Oltre alla significatività del test F, dobbiamo valutare l’attendibilità del modello attraverso l'indice di bontà di adattamento R-quadro. Anche in questo caso il numero va da 0 a 1, dove 1 rappresenta la perfezione del modello, e quindi i dati reali si trovano tutti sulla retta, mentre se fosse 0 il modello non avrebbe senso perché la retta sarebbe parallela all'asse delle X.

Anche in questo caso troveremo una scomposizione della varianza totale, che però si suddivide in varianza spiegata e varianza residua. Se non sei certo di quale sia la differenza tra le due, ti rimando all'articolo di approfondimento, per poterti informare in modo dettagliato su questo specifico argomento.

Conclusioni

Adesso che sei arrivato alla fine di questo articolo hai potuto gettare le basi per cominciare ad introdurti al mondo della statistica bivariata. Ovviamente l'argomento è molto vasto, ce ne sono moltissimi altri da conoscere in modo specifico. Per questo motivo, puoi consultare gli articoli del mio blog, in modo da poter trovare tutte le delucidazioni che ti servono, e aumentare sempre più le tue conoscenze.

Per approfondire al meglio i vari indicatori e tecniche statistiche ho, inoltre, creato dei videocorsi specifici, dove ti spiegherò, video dopo video, come comprendere al meglio i diversi argomenti. Per dar loro un'occhiata vai nella sezione videocorsi, così potrai consultare i dettagli! Troverai non solo vari corsi di statistica (tra cui, ovviamente, anche di statistica bivariata), ma anche di SPSS e di Excel, e potrai scegliere quello che si avvicina di più alle tue necessità

Infine, se vuoi puoi confrontarti direttamente con me, così da vedere insieme eventuali problemi complessi o analisi che devi approfondire: contattami in privato, troverai tutti i riferimenti cliccando qui!

La statistica è la grammatica della scienza.

(KARL PEARSON - Statistico britannico)

Ripetizioni private

Ho intrapreso una interessante collaborazione con il sito di TROVAPROF.IT

Questa start-up mette in relazione studenti che cercano lezioni private con professori di qualsiasi materia. Se stai cercano delle ripetizioni per le materie che non tratto io, allora ti consiglio di fare un salto su TROVAPROF.IT, un portale completamente gratuito per dare o ricevere lezioni private.

Iscriviti alla Newsletter

Se hai bisogno d’informazioni che non hai trovato nella sezione servizi o dei video corsi, scrivimi un messaggio o chiamami.
Domande, prezzi, richieste, delucidazioni...tutto quello che ti serve. Cercherò di risponderti entro le 24h.
Newsletter

Consenso al trattamento dei dati
Utilizzerò i tuoi dati (nome ed indirizzo mail) solo per inviarti gratuitamente via mail la newsletter mensile. Niente spam, niente scocciature, ti disiscrivi in un click quando vuoi.

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram