Quando si mettono in relazione due variabili quantitative, la prima cosa a cui si pensa è calcolare la correlazione lineare. Esistono tanti tipi di relazioni tra due fenomeni, ma questo è sicuramente il più studiato nel percorso universitario.
Dire che una relazione è lineare significa che il carattere Y cresce in maniera direttamente o inversamente proporzionale al carattere X. In poche parole devi immaginarti un piano cartesiano dove la nuvola di punti ha una distribuzione che tende ad avvicinarsi ad una retta
Serve per misurare la direzione e l'intensità del legame tra due variabili quantitative.
La direzione è vista facilmente dal segno del coefficiente quindi sarà negativa o positiva.
L'intensità è misurata da un numero numero che è compreso tra 0 e 1, per la correlazione positiva, e tra 0 e -1 per la correlazione negativa
Rispettivamente per X e Y, somma ogni valore e dividi per il conteggio degli stessi.
Se hai dubbi sul calcolo, puoi guardare l’articolo dove ti spiego tutti i passaggi qui.
La deviazione standard, o scarto quadratico medio, è la radice quadrata della varianza.
La formula è: Covarianza XY = Momento Misto - (Media X * Media Y)
R = Cov(XY) / [ Dev Std (X) * Dev Std (Y) ]
Il coefficiente di correlazione lineare di Pearson è un numero che sta tra -1 e +1, vediamo il significato negli estremi.
Al crescere della variabile X, il fenomeno Y decresce linearmente. Vuol dire che Y dipende totalmente da X e ogni qualvolta si aumenterà di un'unità la X, la Y descrescerà del coefficiente angolare della retta.
Al crescere della variabile X, il fenomeno Y rimane stazionario. Vuol dire che Y non dipende assolutamente da X e ogni qualvolta si aumenterà di un'unità la X, la Y rimarrà costante.
Al crescere della variabile X, il fenomeno Y cresce linearmente. Vuol dire che Y dipende totalmente da X e ogni qualvolta si aumenterà di un'unità la X, la Y crescerà del coefficiente angolare della retta.
Per avere un'idea dell'ordine di grandezza del coefficiente ti metto una tabella orientativa che può esserti utile se devi commentare il valore ad un esame universitario o in un'analisi di dati.
Il coefficiente di correlazione lineare, detto di Pearson o di Bravais-Pearson in onore dei due autori che lo hanno sviluppato nel corso degli anni, può essere soggetto ad un'errata interpretazione. Prima di spiegarti quello che intendo, guardati il video qua sotto perché ti servirà come aiuto per l'esempio che voglio spiegare.
Per comprendere meglio il significato di questo importante indice ti lascio il video che ho realizzato sul mio canale di Youtube per spiegarti con un esempio di vita reale cosa rappresenta.
In questo esempio ho rappresentato la popolazione della città di Cremona dal 1978 al 2010. Come vedi la decrescita è costante fino agli anni 2000 dove invece si arresta e anzi ha una tendenza inversa. In questo caso l'indice di correlazione è pari a -0,91, quindi un valore molto alto, ma che tuttavia ti informa in modo errato della relazione tra i residenti cremonesi e il tempo.
Infatti, risentendo dei molti anni di decrescita, non riesce a percepire l'inversione di tendenza della parte finale e ti restituisce un'intensità negativa facendoti credere che la popolazione sia in continua decrescita. E allora che si fa?
Ripensa alla metafora del video. L'amore è inteso come una delle tante relazioni che possono intercorrere tra due esseri umani. Se ti innamori di una persona è quasi certo che non avrai alcun legame di parentela con tale individuo. Quindi alta correlazione amorosa e bassa correlazione di parentela. Dipende da ciò che vuoi misurare
Il coefficiente di correlazione si chiama lineare perché valuta SOLO una relazione lineare, pertanto se noti che i valori non seguono questa tendenza è inutile che lo usi.
CORRELAZIONE (matrice1;matrice2)
PEARSON (matrice1;matrice2)
Analizza >>> Correlazione >>> Bivariata
Ho realizzato un video per spiegarti come trovare la correlazione lineare in SPSS. Rientra in uno dei dieci capitoli del mio videocorso sulle analisi statistiche. Se sei interessato guarda la presentazione nella quale ti spiego cosa troverai e tutti i dettagli per diventare un professionista delle analisi.
Il mio tempo sui 100 metri era previsto da fisici e statistici americani per il 2030. Sono in anticipo di 22 anni? Bene, non mi pongo limiti.
(USAIN BOLT - Atleta Giamaicano)