adriano gilardone Docente di Statistica Matematica Excel Spss sfruttare excel consulenze statistiche lezione videocorsi

blog

blog

R quadro: significato, calcolo e interpretazione

YouTube video
Postato il 11 Novembre 2024
Tag

L'R quadro, noto anche come coefficiente di determinazione, è una metrica che serve per valutare l'accuratezza dei modelli di regressione lineare

In questo articolo, ti spiego cosa indica, come calcolare e come interpretare l’R quadro, fornendo guide pratiche ed esempi concreti. 

Da 20 anni aiuto gli studenti universitari a preparare - e superare - l’esame di statistica con lezioni private e tanti contenuti gratuiti, fruibili sul mio blog, sul canale YouTube e anche con guide complete di formulario, come questa:

Cosa indica l'R quadro 

L'R quadro è una misura statistica che indica la proporzione della varianza nella variabile dipendente (Y) che è spiegata dalla variabile indipendente (X) in un modello di regressione lineare

In pratica valuta quanta differenza c’è tra i valori reali osservati nel campione (yi) e i valori fittizi che il modello ha stimato (yi^).

Se queste differenze sono piccole il modello si adatta bene ai dati e di conseguenza l'R2 sarà alto, viceversa se le differenze tra valori attesi e osservati sono grandi, il modello non spiega bene la variabilità presente nei dati restituendo un R2 basso

L'importanza dell'R quadro nella regressione lineare risiede nella sua capacità di fornire una misura sintetica della bontà di adattamento del modello. 

Questo permette ai ricercatori e agli analisti di valutare rapidamente l'efficacia del modello nel descrivere i dati e di confrontare diversi modelli tra loro. 

Tuttavia, è importante notare che un alto valore di R2 non implica necessariamente che il modello sia corretto o che abbia capacità predittive, poiché potrebbe essere influenzato da outlier o da una sovradattamento ai dati.

Come calcolare l'R quadro

Calcola le medie aritmetiche

Rispettivamente per X e Y, somma ogni valore e dividi per il conteggio degli stessi.

Calcola le varianze

Guarda l’articolo dove spiego tutti i passaggi per calcolare la varianza, nel caso avessi dei dubbi.

Calcola le deviazioni standard

La deviazione standard, o scarto quadratico medio, è la radice quadrata della varianza.

analisi dati tesi

Calcola la covarianza

La formula è: Covarianza XY = Momento Misto - (Media X * Media Y)

Momento misto

  • Moltiplica, per ogni riga, le xi * le yi
  • Somma la colonna delle xi * yi
  • Dividi la somma per N

Calcola il coefficiente di correlazione di lineare di Pearson

R = Cov(XY) / [ Dev Std (X) * Dev Std (Y) ]

YouTube video

Calcola l'R quadro

R quadro = R2, fai semplicemente il quadrato del coefficiente di correlazione lineare di Pearson

Alternative per calcolare l'R quadro

Con la devianza residua

devianza residua

Con la devianza spiegata

YouTube video

In questo caso prende il nome di indice o coefficiente di determinazione

devianza spiegata

Con il coefficiente angolare

coefficiente angolare

R quadro multiplo

Finora ho trattato un indice di bontà di adattamento che riguarda una regressione lineare semplice nella quale esiste solo una variabile indipendente (X).

Adesso invece ti mostro la formula per un modello di regressione lineare multipla nella quale sono presenti diverse variabili indipendenti.

r quadro multiplo

Come interpretare l'R quadro 

Un R2 significativo indica che il modello di regressione spiega una parte sostanziale della variabilità dei dati osservati. In generale:

Valori di R quadro vicini a 1

Un valore di R2 vicino a 1 suggerisce che il modello di regressione spiega quasi tutta la variabilità dei dati osservati. Questo è considerato un buon segno, poiché significa che il modello si adatta molto bene ai dati.

Valori di R quadro vicini o uguali a 0

Un valore di R quadro vicino a 0 indica che il modello di regressione non riesce a spiegare la variabilità dei dati osservati. In questo caso, il modello non è utile per prevedere la variabile dipendente.

Questo può accadere per diversi motivi:

  • Il modello potrebbe non essere appropriato per i dati.
  • Le variabili indipendenti potrebbero non avere una relazione lineare con la variabile dipendente.
  • Potrebbero esserci errori nella raccolta o nell'analisi dei dati.

Considerazioni aggiuntive

R quadro corretto

Quando si confrontano modelli con un numero diverso di variabili indipendenti, è più utile considerare l'R quadro corretto (Adjusted R-Squared), che tiene conto del numero di variabili nel modello e fornisce una misura più accurata della bontà di adattamento.

Infatti dal punto di vista matematico il solo inserire una variabile indipendente in più, provoca nel modello un aumento dell'R quadro anche se la variabile non ha nulla a che fare con lo studio che si sta facendo.

Con l'R quadro corretto si evita questo problema. La formula è:

r quadro

Overfitting

Un R quadro molto alto potrebbe indicare un sovradattamento (overfitting) del modello, dove il modello si adatta troppo bene ai dati, ma non generalizza bene su nuovi dati. È importante bilanciare la complessità del modello con la sua capacità di generalizzare.

Quando l'R quadro è buono?

Il significato di un "buon" R2 può variare in base al contesto e al campo di applicazione. In generale dovresti seguire la logica della tabellina che ti mostro sotto, ma a seconda del contesto in cui ti trovi l'interpretazione può variare.

indice di bontà di adattamento

Scienze sociali e comportamentali

In questi campi, è comune vedere valori di R2 più bassi, spesso tra 0.2 e 0.5. Anche un R2 di 0.3 può essere considerato accettabile, poiché i fenomeni studiati sono complessi e influenzati da molte variabili.

corso statistica

Scienze naturali e ingegneristiche

In questi campi, i valori di R2 tendono ad essere più alti, spesso tra 0.7 e 0.9. Un R2 superiore a 0.8 è generalmente considerato molto buono.

Finanza ed economia

I valori di R2 possono variare ampiamente. Un R2 di 0.6 o superiore è spesso considerato buono.

Pseudo R quadro

Siccome l'R2 aiuta molto gli statistici a interpretare l'intensità delle relazioni in modello di regressione lineare, anche nei modelli di regressione non lineari, in primis quelli di regressione logistica, si è cercato di trovare un modo per individuarlo in quando non è possibile calcolarlo matematicamente.

A tal proposito sono stati creati degli pseudo R quadro per far in modo che si avesse più o meno la stessa interpretazione.

Nella regressione logistica sono famosi l'R2 di Nagelkerge e l'R2 di Cox e Snell. Se hai bisogno di un approfondimento ho creato un corso di analisi dati completo. Ti lascio qua sotto un intro del capitolo sulla regressione logistica.

YouTube video

R quadro Excel

Per calcolare l' R2 bisogna elevare al quadrato il coefficiente di correlazione lineare di Pearson che di trova con queste due funzioni:

CORRELAZIONE (matrice1;matrice2)

PEARSON (matrice1;matrice2)

R quadro Spss

Analizza >>> Regressione >>> Lineare

Riassumendo 

  • L'R quadrato valuta l'accuratezza dei modelli di regressione lineare.
  • Un valore vicino a 1 significa che il modello spiega quasi tutta la variabilità, mentre un valore vicino a 0 indica che il modello non è utile per spiegare la variabilità. 
  • L’R quadrato corretto è utile per confrontare modelli con un numero diverso di variabili indipendenti.
  • Un R2 molto alto potrebbe indicare un sovradattamento.

Ripetizioni private

Ho intrapreso una interessante collaborazione con il sito di TROVAPROF.IT

Questa start-up mette in relazione studenti che cercano lezioni private con professori di qualsiasi materia. Se stai cercano delle ripetizioni per le materie che non tratto io, allora ti consiglio di fare un salto su TROVAPROF.IT, un portale completamente gratuito per dare o ricevere lezioni private.

Iscriviti alla Newsletter

Se hai bisogno d’informazioni che non hai trovato nella sezione servizi o dei video corsi, scrivimi un messaggio o chiamami.
Domande, prezzi, richieste, delucidazioni...tutto quello che ti serve. Cercherò di risponderti entro le 24h.
Newsletter

Consenso al trattamento dei dati
Utilizzerò i tuoi dati (nome ed indirizzo mail) solo per inviarti gratuitamente via mail la newsletter mensile. Niente spam, niente scocciature, ti disiscrivi in un click quando vuoi.

arrow-up-circle
linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram