La moderazione statistica, nel contesto delle ricerche, è un concetto che riguarda l'interazione tra variabili. In particolare, ci riferiamo a una variabile moderatrice come la terza variabile che influenza la relazione tra una variabile indipendente e una dipendente. Questo significa che il legame tra le due variabili può variare in forza e in direzione (o entrambe), a seconda del valore assunto dal moderatore.
È quindi evidente l'importanza di tale carattere nel determinare le condizioni alle quali un particolare fenomeno si manifesta.
La moderazione statistica gioca un ruolo cruciale soprattutto nella ricerca psicologica. Questa permette di mettere in luce le circostanze specifiche sotto le quali un effetto diventa evidente o meno. Infatti, può aiutare a spiegare perché talvolta le relazioni tra due variabili appaiono inconsistenti o contrastanti: la presenza di un moderatore potrebbe essere la chiave per decifrare tali discrepanze.
La moderazione statistica viene a volte confusa con la mediazione. Entrambe riguardano le interazioni tra due o più variabili, ma differiscono notevolmente nel loro concetto e interpretazione. Ti schematizzo le due situazioni per aiutarti nella comprensione.
La moderazione statistica si verifica quando l'effetto di una variabile indipendente sulla variabile dipendente cambia a seconda dei livelli di un'altra variabile, detta appunto moderatore.
In altre parole, il moderatore modifica l'intensità o la direzione della relazione tra la variabile indipendente e la variabile dipendente.
Questo significa che la moderazione risponde alla domanda di ricerca riguardante il "per chi" un effetto si verifica.
Usando una delle mie metafore, puoi immaginare il moderatore come un vero moderatore di un talk show politico che fa parlare il partito "zero" e il partito "uno" separatamente.
Il discorso cambia con la mediazione statistica. Nello schema sotto puoi notare che il mediatore si trova sempre in mezzo, ma implica un meccanismo differente.
Nota come il processo attraverso il quale l'effetto di una variabile indipendente sulla variabile dipendente sia trasmesso dal mediatore.
In una mediazione, la variabile indipendente influisce sia sulla variabile dipendente sia sulla variabile mediatrice, che a sua volta influisce sulla variabile dipendente.
La domanda a cui risponde la mediazione è dunque il "perché" un effetto si verifica.
Una differenza fondamentale tra moderazione e mediazione è quindi dove si situa la terza variabile nel modello di relazione. Nel caso della moderazione statistica, la terza variabile è esterna alla relazione di base, modificandone l'intensità o la direzione. Nella mediazione, la terza variabile è interna alla relazione, servendo come un ponte o un canale attraverso il quale la variabile indipendente influisce sulla variabile dipendente.
Siccome il modello di moderazione statistica è una regressione lineare, ti consiglio di guardarti il mio video in cui spiego questo argomento con una metafora statistica.
Di seguito ti spiego tutti i possibili casi che puoi incontrare quando svolgi una regressione multipla. Per semplicità userò solo due variabili indipendenti di cui una sarà il moderatore di tipo dicotomico, quindi che può assumere solo due modalità. 0 e 1.
Immagina che vuoi studiare come lo stipendio di un gruppo di lavoratori possa cambiare al crescere degli anni lavorativi. Al tempo stesso però vuoi vedere se c'è differenza di crescita tra uomini e donne. I numeri sono totalmente inventati, ma ahimé potrebbe anche rappresentare una situazione reale.
Le variabili oggetto di studio sono le seguenti:
Y = Variabile Dipendente = Stipendio
X = Variabile Indipendente = Anni Lavorativi
M = Moderatore = Sesso ( 0 = Femmine ; 1 = Maschi )
Quando si svolge una regressione lineare multipla devi stare attento al fatto di considerare o meno gli effetti interazione.
L'effetto interazione si ottiene moltiplicando tra loro due o più variabili. Potresti dunque crearlo tu nel dataset andando a moltiplicare la o le colonne interessate. In questo esempio ne hai solo uno quello che ottieni tra gli anni lavorativi e il sesso.
L'interpretazione è abbastanza semplice perché ti dice quanto cambio l'effetto degli anni lavorativi al variare dei livelli del genere, quindi passando da femmine a maschi.
In questa prima parte però ti mostro i risultati senza l'effetto interazione e quindi senza l'influenza che può generare il moderatore sesso. É fondamentale sapere come si ha codificato la variabile dicotomica e quindi conoscere che lo 0 è attribuito alle femmine mentre l'1 ai maschi.
Y = B0 + B1 * X + B2 * M
Stipendio = B0 + B1 * Anni Lavorativi + B2 * Sesso
dove:
B0 = intercetta = 700
B1 = coefficiente di regressione degli anni lavorativi = 80
B2 = coefficiente di regressione del sesso = 300
quindi l'equazione diventa:
Stipendio = 700 + 80 * Anni Lavorativi + 300 * Sesso
Ciò significa che ogni anno lo stipendio aumenterà di 80 euro, ma il punto di partenza sarà diverso tra uomini e donne.
Infatti le donne avranno un primo stipendio pari a 700 euro, in quanto se sostituisci lo 0 in anni e lo 0 in sesso (le donne avevano come codifica lo 0 della variabile sesso), sparisce tutto tranne la costante 700.
Mentre gli uomini partiranno da 1000 euro, in quanto se sostituisci lo 0 in anni e l'1 in sesso (gli uomini avevano come codifica l'1 della variabile sesso), spariscono gli anni ma alla costante 700 si aggiunge un 300 del sesso.
Questo concetto lo potresti anche vedere con due regressioni semplici separate che risulterebbero avere queste equazioni:
Stipendio donne = 700 + 80 * Anni Lavorativi
Stipendio uomini = 1000 + 80 * Anni Lavorativi
Se rappresenti le due rette in un grafico puoi apprezzare come i due stipendi siano diversi, ma non interagiscono con la variabile anni in quanto crescono alla stessa maniera, solo partono da un punto differente.
In questo secondo modello vedrai come la variabile sesso venga utilizzata come moderatore per far capire il ruolo dell'effetto interazione.
Le regressione lineare multipla prevede dunque l'inserimento di questa variabile fittizia creata moltiplicando gli anni lavorativi per il sesso. Il modello risulta essere:
Y = B0 + B1 * X + B2 * M + B3 * X * M
Stipendio = B0 + B1 * Anni L + B2 * Sesso + B3 * Anni L * Sesso
dove:
B0 = intercetta = 900
B1 = coefficiente di regressione degli anni lavorativi = 60
B2 = coefficiente di regressione del sesso = - 50
B3 = coefficiente di regressione dell'interazione = 30
quindi l'equazione diventa:
Stipendio = 900 + 60 * Anni L - 50 * Sesso + 30 * Anni L * Sesso
Ciò significa che stavolta saranno gli uomini a partire con uno stipendio più basso, ma ogni anno anno avranno un "bonus" in più rispetto alle donne. Per capire meglio quanto appena detto sostituisci nell'equazione una volta lo 0 per le donne e una volta l'1 per gli uomini.
Così facendo otterrai ancora due rette separate che ti daranno l'idea di quanto aumenta lo stipendio ogni anno a seconda che tu sia donna o uomo.
Sesso = 0 = Donne
Stipendio donne = 900 + 60 * Anni L - 50 * (0) + 30 * Anni L * (0)
Stipendio donne = 900 + 60 * Anni L
Sesso = 1 = Uomini
Stipendio uomini = 900 + 60 * Anni L - 50 * (1) + 30 * Anni L * (1)
Stipendio uomini = 850 + 90 * Anni L
Anche qui rappresentando il modello con due regressioni semplici si percepisce meglio l'effetto interazione del moderatore sesso
L'uso di un modello di moderazione statistica ci permette di ottenere una comprensione più dettagliata delle relazioni tra variabili. In questo caso, ci permette di vedere non solo che l'anzianità è legata allo stipendio, ma anche che questa relazione è più forte per gli uomini rispetto alle donne. Questo ci offre una visione più completa e precisa delle dinamiche salariali nel luogo di lavoro, e potrebbe suggerire direzioni per ulteriori indagini o interventi.
Durante una regressione lineare a volte è impossibile commentare l'effetto di una variabile indipendente quando questa assuma il valore zero.
Il motivo è semplice perchè nella realtà potrebbe non esistere lo zero di quel fenomeno. Prova a pensare all'età, l'altezza o il peso delle persone. Tali caratteri non possono valere zero per ovvi motivi.
Questo può portare a delle stime degli effetti lineari che non hanno senso o che sono difficilmente interpretabili. Per ovviare a questa problematica, puoi utilizzare un metodo noto come centramento delle variabili.
Riprendendo l'esempio sopra immagina che al posto della variabile X = Anni Lavorativi hai la variabile X = Età della persona e dalle statistiche descrittive l'età media risulta pari a 40 anni.
Stipendio = B0 + B1 * Età + B2 * Sesso + B3 * Età * Sesso
Se volessi calcolare lo stipendio di una persona che ha zero anni capisci bene che otterresti un risultato inutile poiché non esistono persone con età = 0.
Ecco dove interviene il centramento. Crea una nuova variabile, che puoi chiamare Età Centrata, sottraendo dall'età di ogni individuo la media di 40 anni.
Età Centrata = Età - 40
Ora se ci pensi quando l'Età Centrata è uguale a zero, significa che l'età della persona è uguale a 40.
Di conseguenza in un modello di regressione lineare, se commenti il valore zero della variabile Età Centrata è come se stessi commentando il valore medio della variabile Età delle persone.
Questo approccio al centramento delle variabili può facilitare notevolmente l'interpretazione dei risultati delle analisi di moderazione statistica, come quelle discusse nei paragrafi precedenti.
Ad esempio, nel nostro studio sulla differenza di stipendi tra uomini e donne, il centrare la variabile età ci permette di trovare lo stipendio delle persone per qualsiasi età e di conseguenza inserendo il numero zero di interpretare lo stipendio per un individuo con età pari a 40 anni.
Le due equazioni finali potrebbero dunque risultare così:
Stipendio donne = 1800 + 60 * Età Centrata
Stipendio donne = 1800
Lo stipendio medio per una donna di 40 anni è di 1800 euro.
Stipendio uomini = 2200 + 90 * Età Centrata
Stipendio uomini = 2200
Lo stipendio medio per un uomo di 40 anni è di 2200 euro.
Sebbene sia possibile centrare una variabile intorno a qualsiasi valore, solitamente si utilizza la media, in quanto rappresenta il valore più rappresentativo della distribuzione della variabile.
Un'altra strategia che può essere utilizzata nel trattamento delle variabili è la dicotomizzazione o median-split. Questa operazione consiste nel trasformare una variabile continua in una variabile categorica, dividendola in due gruppi sulla base della mediana. Tutti i casi con punteggi inferiori alla mediana formano un gruppo, mentre i casi con punteggi uguali o superiori alla mediana costituiscono l'altro gruppo.
Tuttavia, è importante notare che questa pratica deve essere utilizzata con cautela. La dicotomizzazione può infatti portare a una perdita di potere statistico e di attendibilità, in quanto riduce la quantità di variazione e informazione presenti nei dati.
Un approccio alternativo, che può essere utilizzato quando una variabile è categorica e l'altra continua, consiste nel stimare gli effetti della variabile continua su due gruppi distinti definiti dalla variabile categorica.
In pratica è il procedimento visto in precedenza nel grafico a dispersione dove le due rette rappresentano due regressioni lineari semplici, ma provengono dal modello di regressione lineare multiplo.
Anche se questo metodo restituisce le stesse identiche stime puntuali degli effetti semplici, i test inferenziali (come il t-test, i valori p e gli intervalli di confidenza) possono differire. Questo perché vengono calcolati su campioni più piccoli e non omogenei, rendendo i test meno potenti e meno affidabili. Pertanto, questo approccio è generalmente sconsigliato, soprattutto considerando la facilità con cui è possibile ottenere questi effetti e i relativi test con il modello moderato.
La questione della dicotomizzazione si lega strettamente con quello che abbiamo discusso nel paragrafo precedente sul centrare le variabili. Entrambi questi processi sono metodi per trattare le variabili in un modo che facilita l'interpretazione dei risultati dell'analisi, ma devono essere utilizzati con attenzione per evitare di compromettere l'integrità dei dati e la potenza dell'analisi.
Scheda dati >>> Analisi dati >>> Regressione
Se vuoi approfondire la regressione lineare in Excel, in questo video te lo spiego in modo facile e chiaro.
Analizza >>> Regressione >>> Lineare
Se vuoi approfondire la tua conoscenza su SPSS della regressione lineare, ti lascio questo breve video di presentazione del capitolo 7 del mio corso.
"Le statistiche sono una forma di realizzazione del desiderio, proprio come i sogni."
Jean Baudrillard