adriano gilardone Docente di Statistica Matematica Excel Spss sfruttare excel consulenze statistiche lezione videocorsi

blog

blog

Moderazione Statistica

YouTube video
Postato il 30 Giugno 2023
Tag

La moderazione statistica, nel contesto delle ricerche, è un concetto che riguarda l'interazione tra variabili. In particolare, ci riferiamo a una variabile moderatrice come la terza variabile che influenza la relazione tra una variabile indipendente e una dipendente. Questo significa che il legame tra le due variabili può variare in forza e in direzione (o entrambe), a seconda del valore assunto dal moderatore.

È quindi evidente l'importanza di tale carattere nel determinare le condizioni alle quali un particolare fenomeno si manifesta.

analisi dati tesi

Importanza della moderazione statistica

La moderazione statistica gioca un ruolo cruciale soprattutto nella ricerca psicologica. Questa permette di mettere in luce le circostanze specifiche sotto le quali un effetto diventa evidente o meno. Infatti, può aiutare a spiegare perché talvolta le relazioni tra due variabili appaiono inconsistenti o contrastanti: la presenza di un moderatore potrebbe essere la chiave per decifrare tali discrepanze.

Differenze tra moderazione e mediazione

La moderazione statistica viene a volte confusa con la mediazione. Entrambe riguardano le interazioni tra due o più variabili, ma differiscono notevolmente nel loro concetto e interpretazione. Ti schematizzo le due situazioni per aiutarti nella comprensione.

moderazione statistica

La moderazione statistica si verifica quando l'effetto di una variabile indipendente sulla variabile dipendente cambia a seconda dei livelli di un'altra variabile, detta appunto moderatore.

In altre parole, il moderatore modifica l'intensità o la direzione della relazione tra la variabile indipendente e la variabile dipendente.

Questo significa che la moderazione risponde alla domanda di ricerca riguardante il "per chi" un effetto si verifica.

Usando una delle mie metafore, puoi immaginare il moderatore come un vero moderatore di un talk show politico che fa parlare il partito "zero" e il partito "uno" separatamente.

Il discorso cambia con la mediazione statistica. Nello schema sotto puoi notare che il mediatore si trova sempre in mezzo, ma implica un meccanismo differente.

mediazione statistica

Nota come il processo attraverso il quale l'effetto di una variabile indipendente sulla variabile dipendente sia trasmesso dal mediatore.

In una mediazione, la variabile indipendente influisce sia sulla variabile dipendente sia sulla variabile mediatrice, che a sua volta influisce sulla variabile dipendente.

La domanda a cui risponde la mediazione è dunque il "perché" un effetto si verifica.

Una differenza fondamentale tra moderazione e mediazione è quindi dove si situa la terza variabile nel modello di relazione. Nel caso della moderazione statistica, la terza variabile è esterna alla relazione di base, modificandone l'intensità o la direzione. Nella mediazione, la terza variabile è interna alla relazione, servendo come un ponte o un canale attraverso il quale la variabile indipendente influisce sulla variabile dipendente.

Siccome il modello di moderazione statistica è una regressione lineare, ti consiglio di guardarti il mio video in cui spiego questo argomento con una metafora statistica.

YouTube video
Regressione lineare spiegata con una metafora

Esempio moderazione statistica

Di seguito ti spiego tutti i possibili casi che puoi incontrare quando svolgi una regressione multipla. Per semplicità userò solo due variabili indipendenti di cui una sarà il moderatore di tipo dicotomico, quindi che può assumere solo due modalità. 0 e 1.

Immagina che vuoi studiare come lo stipendio di un gruppo di lavoratori possa cambiare al crescere degli anni lavorativi. Al tempo stesso però vuoi vedere se c'è differenza di crescita tra uomini e donne. I numeri sono totalmente inventati, ma ahimé potrebbe anche rappresentare una situazione reale.

Le variabili oggetto di studio sono le seguenti:

Y = Variabile Dipendente = Stipendio

X = Variabile Indipendente = Anni Lavorativi

M = Moderatore = Sesso ( 0 = Femmine ; 1 = Maschi )

corso spss

Regressione lineare SENZA moderatore

Quando si svolge una regressione lineare multipla devi stare attento al fatto di considerare o meno gli effetti interazione.

L'effetto interazione si ottiene moltiplicando tra loro due o più variabili. Potresti dunque crearlo tu nel dataset andando a moltiplicare la o le colonne interessate. In questo esempio ne hai solo uno quello che ottieni tra gli anni lavorativi e il sesso.

L'interpretazione è abbastanza semplice perché ti dice quanto cambio l'effetto degli anni lavorativi al variare dei livelli del genere, quindi passando da femmine a maschi.

In questa prima parte però ti mostro i risultati senza l'effetto interazione e quindi senza l'influenza che può generare il moderatore sesso. É fondamentale sapere come si ha codificato la variabile dicotomica e quindi conoscere che lo 0 è attribuito alle femmine mentre l'1 ai maschi.

Y = B0 + B1 * X + B2 * M

Stipendio = B0 + B1 * Anni Lavorativi + B2 * Sesso

dove:

B0 = intercetta = 700

B1 = coefficiente di regressione degli anni lavorativi = 80

B2 = coefficiente di regressione del sesso = 300

quindi l'equazione diventa:

Ciò significa che ogni anno lo stipendio aumenterà di 80 euro, ma il punto di partenza sarà diverso tra uomini e donne.

Infatti le donne avranno un primo stipendio pari a 700 euro, in quanto se sostituisci lo 0 in anni e lo 0 in sesso (le donne avevano come codifica lo 0 della variabile sesso), sparisce tutto tranne la costante 700.

Mentre gli uomini partiranno da 1000 euro, in quanto se sostituisci lo 0 in anni e l'1 in sesso (gli uomini avevano come codifica l'1 della variabile sesso), spariscono gli anni ma alla costante 700 si aggiunge un 300 del sesso.

Questo concetto lo potresti anche vedere con due regressioni semplici separate che risulterebbero avere queste equazioni:

Stipendio donne = 700 + 80 * Anni Lavorativi

Stipendio uomini = 1000 + 80 * Anni Lavorativi

Se rappresenti le due rette in un grafico puoi apprezzare come i due stipendi siano diversi, ma non interagiscono con la variabile anni in quanto crescono alla stessa maniera, solo partono da un punto differente.

corso spss

Regressione lineare CON moderatore

In questo secondo modello vedrai come la variabile sesso venga utilizzata come moderatore per far capire il ruolo dell'effetto interazione.

Le regressione lineare multipla prevede dunque l'inserimento di questa variabile fittizia creata moltiplicando gli anni lavorativi per il sesso. Il modello risulta essere:

Y = B0 + B1 * X + B2 * M + B3 * X * M

Stipendio = B0 + B1 * Anni L + B2 * Sesso + B3 * Anni L * Sesso

dove:

B0 = intercetta = 900

B1 = coefficiente di regressione degli anni lavorativi = 60

B2 = coefficiente di regressione del sesso = - 50

B3 = coefficiente di regressione dell'interazione = 30

quindi l'equazione diventa:

Stipendio = 900 + 60 * Anni L - 50 * Sesso + 30 * Anni L * Sesso

Ciò significa che stavolta saranno gli uomini a partire con uno stipendio più basso, ma ogni anno anno avranno un "bonus" in più rispetto alle donne. Per capire meglio quanto appena detto sostituisci nell'equazione una volta lo 0 per le donne e una volta l'1 per gli uomini.

Così facendo otterrai ancora due rette separate che ti daranno l'idea di quanto aumenta lo stipendio ogni anno a seconda che tu sia donna o uomo.

Sesso = 0 = Donne

Stipendio donne = 900 + 60 * Anni L - 50 * (0) + 30 * Anni L * (0)

Stipendio donne = 900 + 60 * Anni L

Sesso = 1 = Uomini

Stipendio uomini = 900 + 60 * Anni L - 50 * (1) + 30 * Anni L * (1)

Stipendio uomini = 850 + 90 * Anni L

Anche qui rappresentando il modello con due regressioni semplici si percepisce meglio l'effetto interazione del moderatore sesso

Moderazione statistica

L'uso di un modello di moderazione statistica ci permette di ottenere una comprensione più dettagliata delle relazioni tra variabili. In questo caso, ci permette di vedere non solo che l'anzianità è legata allo stipendio, ma anche che questa relazione è più forte per gli uomini rispetto alle donne. Questo ci offre una visione più completa e precisa delle dinamiche salariali nel luogo di lavoro, e potrebbe suggerire direzioni per ulteriori indagini o interventi.

Centrare la variabile continua

Durante una regressione lineare a volte è impossibile commentare l'effetto di una variabile indipendente quando questa assuma il valore zero.

Il motivo è semplice perchè nella realtà potrebbe non esistere lo zero di quel fenomeno. Prova a pensare all'età, l'altezza o il peso delle persone. Tali caratteri non possono valere zero per ovvi motivi.

Questo può portare a delle stime degli effetti lineari che non hanno senso o che sono difficilmente interpretabili. Per ovviare a questa problematica, puoi utilizzare un metodo noto come centramento delle variabili.

Riprendendo l'esempio sopra immagina che al posto della variabile X = Anni Lavorativi hai la variabile X = Età della persona e dalle statistiche descrittive l'età media risulta pari a 40 anni.

Stipendio = B0 + B1 * Età + B2 * Sesso + B3 * Età * Sesso

Se volessi calcolare lo stipendio di una persona che ha zero anni capisci bene che otterresti un risultato inutile poiché non esistono persone con età = 0.

Ecco dove interviene il centramento. Crea una nuova variabile, che puoi chiamare Età Centrata, sottraendo dall'età di ogni individuo la media di 40 anni.

Età Centrata = Età - 40

Ora se ci pensi quando l'Età Centrata è uguale a zero, significa che l'età della persona è uguale a 40.

Di conseguenza in un modello di regressione lineare, se commenti il valore zero della variabile Età Centrata è come se stessi commentando il valore medio della variabile Età delle persone.

Questo approccio al centramento delle variabili può facilitare notevolmente l'interpretazione dei risultati delle analisi di moderazione statistica, come quelle discusse nei paragrafi precedenti.

Ad esempio, nel nostro studio sulla differenza di stipendi tra uomini e donne, il centrare la variabile età ci permette di trovare lo stipendio delle persone per qualsiasi età e di conseguenza inserendo il numero zero di interpretare lo stipendio per un individuo con età pari a 40 anni.

Le due equazioni finali potrebbero dunque risultare così:

Stipendio donne = 1800 + 60 * Età Centrata

Stipendio donne = 1800

Lo stipendio medio per una donna di 40 anni è di 1800 euro.

Stipendio uomini = 2200 + 90 * Età Centrata

Stipendio uomini = 2200

Lo stipendio medio per un uomo di 40 anni è di 2200 euro.

Sebbene sia possibile centrare una variabile intorno a qualsiasi valore, solitamente si utilizza la media, in quanto rappresenta il valore più rappresentativo della distribuzione della variabile.

corso spss

Dicotomizzare la variabile continua

Un'altra strategia che può essere utilizzata nel trattamento delle variabili è la dicotomizzazione o median-split. Questa operazione consiste nel trasformare una variabile continua in una variabile categorica, dividendola in due gruppi sulla base della mediana. Tutti i casi con punteggi inferiori alla mediana formano un gruppo, mentre i casi con punteggi uguali o superiori alla mediana costituiscono l'altro gruppo.

Tuttavia, è importante notare che questa pratica deve essere utilizzata con cautela. La dicotomizzazione può infatti portare a una perdita di potere statistico e di attendibilità, in quanto riduce la quantità di variazione e informazione presenti nei dati.

Un approccio alternativo, che può essere utilizzato quando una variabile è categorica e l'altra continua, consiste nel stimare gli effetti della variabile continua su due gruppi distinti definiti dalla variabile categorica.

In pratica è il procedimento visto in precedenza nel grafico a dispersione dove le due rette rappresentano due regressioni lineari semplici, ma provengono dal modello di regressione lineare multiplo.

Anche se questo metodo restituisce le stesse identiche stime puntuali degli effetti semplici, i test inferenziali (come il t-test, i valori p e gli intervalli di confidenza) possono differire. Questo perché vengono calcolati su campioni più piccoli e non omogenei, rendendo i test meno potenti e meno affidabili. Pertanto, questo approccio è generalmente sconsigliato, soprattutto considerando la facilità con cui è possibile ottenere questi effetti e i relativi test con il modello moderato.

La questione della dicotomizzazione si lega strettamente con quello che abbiamo discusso nel paragrafo precedente sul centrare le variabili. Entrambi questi processi sono metodi per trattare le variabili in un modo che facilita l'interpretazione dei risultati dell'analisi, ma devono essere utilizzati con attenzione per evitare di compromettere l'integrità dei dati e la potenza dell'analisi.

Moderazione statistica in Excel

Scheda dati >>> Analisi dati >>> Regressione

Se vuoi approfondire la regressione lineare in Excel, in questo video te lo spiego in modo facile e chiaro.

YouTube video
Come usare la funzione REGR.LIN

Moderazione statistica in SPSS

Analizza >>> Regressione >>> Lineare

Se vuoi approfondire la tua conoscenza su SPSS della regressione lineare, ti lascio questo breve video di presentazione del capitolo 7 del mio corso.

YouTube video
Video presentazione cap. 7

Riassumendo

  • La moderazione statistica è un concetto chiave nelle ricerche psicologiche. Esplora come la relazione tra due variabili possa cambiare in base al valore di una terza variabile.
  • L'analisi di moderazione statistica può rivelare le specifiche circostanze in cui un determinato effetto o fenomeno si manifesta, aggiungendo una dimensione di complessità all'interpretazione dei dati.
  • La rappresentazione di un effetto di moderazione attraverso grafici di moderazione statistica può aiutare a comprendere e a comunicare efficacemente queste relazioni complesse.
  • Interpretare i risultati di un'analisi di moderazione statistica richiede attenzione. È necessario considerare sia l'importanza statistica dell'effetto di moderazione, sia il suo significato pratico.

"Le statistiche sono una forma di realizzazione del desiderio, proprio come i sogni."
Jean Baudrillard

Ripetizioni private

Ho intrapreso una interessante collaborazione con il sito di TROVAPROF.IT

Questa start-up mette in relazione studenti che cercano lezioni private con professori di qualsiasi materia. Se stai cercano delle ripetizioni per le materie che non tratto io, allora ti consiglio di fare un salto su TROVAPROF.IT, un portale completamente gratuito per dare o ricevere lezioni private.

Iscriviti alla Newsletter

Se hai bisogno d’informazioni che non hai trovato nella sezione servizi o dei video corsi, scrivimi un messaggio o chiamami.
Domande, prezzi, richieste, delucidazioni...tutto quello che ti serve. Cercherò di risponderti entro le 24h.
Newsletter

Consenso al trattamento dei dati
Utilizzerò i tuoi dati (nome ed indirizzo mail) solo per inviarti gratuitamente via mail la newsletter mensile. Niente spam, niente scocciature, ti disiscrivi in un click quando vuoi.

arrow-up-circle
linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram