analisi tesi dati adriano gilardone Docente di Statistica Matematica Excel Spss dal 2007

Analisi dati tesi

Da quasi 20 anni aiuto gli studenti universitari a superare l’ultimo ostacolo della loro carriera, cioè l’analisi dati per la tesi.
Offro il sostegno necessario per l’avanzamento in ogni fase, dalla realizzazione del questionario, se ne avrai bisogno, fino al commento finale dei risultati.

Lo farò con professionalità, semplicità nelle spiegazioni e metodo organizzativo. Il mio supporto sarà totale grazie all’assistenza via mail, whatsapp o skype.

L’unico aspetto di cui non mi occupo è la scrittura finale della tua tesi, ma mi avvalgo di collaboratori fidati che possono aiutarti anche in questa esigenza.

I software che utilizzo sono SPSS, Excel e R-Studio.
vuoi saperne di più?
YouTube video

Questa consulenza fa per te se:

Hai competenze di statistica nulle o minime che non ti permettono di comprendere l’analisi dei dati
Hai poco tempo e hai bisogno di un professionista che riesca a gestire il tutto togliendoti dallo stress
Non sei supportato dal tuo tutor e non ti è del tutto chiaro cosa devi fare
Vuoi la sicurezza di fare un bel lavoro, corretto e organizzato
Hai bisogno di qualcuno che sappia quali tecniche statistiche siano adeguate per i tuoi dati
Hai bisogno che qualcuno ti interpreti i risultati
richiedi la tua consulenza

Come funziona

CONTATTO
Se hai bisogno dell’analisi dati per la tesi compila il form spiegandomi quello che ti serve.
Allega il materiale che hai a disposizione (dataset, la tua tesi, articoli di riferimento…) cercando di farmi capire a cosa si riferiscono i dati.

PREVENTIVO
Una volta ricevuta la mail ti ricontatto per eventuali dubbi e per farti un preventivo.
Se accetti ci accordiamo sulla tempistica, che di solito non supera i 5 giorni, ma se avrai urgenza posso anche svolgerti l’analisi in un solo giorno.

ANALISI
Avendo chiaro le tue esigenze procedo all’analisi vera e propria. Da una parte eseguo quello che mi chiedi e dall’altra implemento ulteriori statistiche se lo ritengo opportuno per il tuo scopo, il tutto già compreso nel preventivo.
Se durante il processo mi rende conto che c’è qualcosa che non va, ti aggiorno costantemente.

VIDEO ESPLICATIVO: 
Terminata l’analisi ti registro un video in cui ti spiego tutti i passaggi e soprattutto ti commento ogni singolo indice, grafico o risultato.
Il video è molto utile perché potrai riguardarlo quante volte vorrai e chiarirti le idee in qualsiasi momento.

CONSEGNA: 
Di norma svolgo le analisi in SPSS e poi esporto i dati in EXCEL dimodoché tu possa formattare le tabelle a tuo piacimento e inserirle nella tesi con dei semplici copia e incolla.
Ti fornisco comunque tutte le estensioni di SPSS (.sav, .spv, .sps) affinchè il tuo tuor possa, nell’eventualità, consultarle.

SUPPORTO POST ANALISI: 
Dopo la consegna rimango a disposizione per qualsiasi cosa.
Precisazione: un ulteriore chiarimento via mail o WhatsApp è compreso nella consulenza. Se hai bisogno di altre analisi o spiegazioni, potrebbe esserci la necessità di integrare il preventivo iniziale.

richiedi ora la tua consulenza

Analisi statistiche

Di seguito ecco tutte le tecniche che posso utilizzare per l’analisi dei dati:

PREPARAZIONE E PULIZIA DATI

- analisi valori mancanti 
- ricodifica delle variabili 
- creazione di nuove
- variabili e indici 
- pulizia degli outliers

T-TEST

- t-test a campione singolo 
- t-test a campioni indipendenti 
- t-test a campioni appaiati

CORRELAZIONE LINEARE

- coefficiente di correlazione di Pearson
- correlazione di Spearman

STATISTICHE DESCRITTIVE

- tabelle di frequenze: assolute, percentuali e cumulate 
- grafici: a torta, a barre, istogrammi, boxplot, a dispersione 
- indicatori di sintesi: moda, media, mediana, quartili, percentili 
- indicatori di variabilità: varianza, deviazione standard, coefficiente di variazione, range interquartile 
- indicatori di forma: asimmetria, curtosi

ANOVA

- anova univariata a una via 
- anova a due vie 
- anova fattoriale 
- anova a misure ripetute 
- anova mista 
- eta quadro 
- ancova
- anova multivariata 
- manova 
- mancova 
- anova di Poisson 
- anova logistica

TEST DEL CHI QUADRATO

- tabelle di contingenza 
- indice Phi
- indice V di Cramer 
- indice gamma 
- odds-ratio 
- indice tau di Kendall 
- inidice lambda di Goodman e Kruskal 
- inidice D di Somers

REGRESSIONE LINEARE

- modello di regressione lineare semplice 
- modello di regressione lineare multipla 
- bontà di adattamento (r-quadro) 
- grafici 
- modelli di mediazione statistica 
- modelli di moderazione statistica

REGRESSIONE LOGISTICA

- regressione logistica binaria 
- regressione logistica multinomiale 
- chi-quadrato di Wald 
- pseudo r-quadro 
- test di Hosmer e Lemeshow

ASSUNZIONI DEL MODELLO LINEARE

- indipendenza dei residui 
- outliers 
- omoschedasticità 
- normalità dei residui 
- linearità 
- assenza di collinearità

TEST NON PARAMETRICI

- test di Wilcoxon dei segni (Wilcoxon signed ranks test) 
- Mann-Whitney (Wilcoxon rank-sum test) 
- Friedman 
- Kruskal-Wallis

ANALISI FATTORIALE

- analisi fattoriale confermativa (AFC) 
- analisi fattoriale esplorativa (AFE) 
- analisi delle componenti principali (APC) 
- alpha di Cronbach

CLUSTER ANALYSIS

- cluster gerarchico 
- cluster k-means 
- cluster two step

CONJOINT ANALYSIS

- descrizione del modello 
- programmi di utilità 
- valori d’importanza 
- correlazioni 
- probabilità di preferenza

ANALISI DEL DISCRIMINANTE

- test di uguaglianza delle medie 
- test di significatività 
- lambda di Wilks 
- baricentri 
- grafici a dispersione

ANALISI DELLE CORRISPONDENZE

- punti riga 
- punti colonna 
- punteggi nella dimensione 
- grafici a dispersione

richiedi ora la tua consulenza

Cosa dicono di me

Con le difficolta' e le lacune didattiche riguardanti le materie scientifiche che avevo non e' stato facile per me affrontare un esame come statistica senza i giusti strumenti analitici e di compensione della materia. A giudicare anche (e soprattutto) dal mio voto finale direi che sono state necessarie ed essenziali le lezioni con Adriano, per la chiarezza e la "semplicita'" delle spiegazioni, la PAZIENZA e la competenza.

Clara
Psicologia

Mi sono trovato molto bene poiche' ho saputo apprendere 2 materie importanti senza dover "sorbire" i metodi istituzionali e formali di buona parte dei professori. Adesso conosco piuttosto bene le basi della statistica, che ho appreso un anno fa, ma di cui ricordo ancora buona parte. Ho avuto maggiori difficolta' in matematica, dovuta a delle mie gravi lacune, ma devo ammettere che dopo qualche mese sapevo affrontare lo studio di funzioni in maniera decorosa, e saper spiegare in circa 3 mesi il programma di 3 anni di liceo, e' un compito davvero non facile, e credo che solo pochi siano in grado di farlo. La cosa migliore dello studio con Adriano e' stata la sua capacita' di rendere empirico agli occhi di uno studente, un mondo che quasi tutti i professori insegnano come una scienza che va accettata cosi' com'e', che sia la matematica o la statistica. Adriano ha saputo dare un "senso logico" allo studio di queste materie.

Lorenzo
Economia

La piu' grande virtu' di Adriano e' la pazienza: io ero ansioso per i miei due esami di statistica e con me ne ha tenuta tanta. A differenza dei manuali che usano in Bicocca, Adriano e' esplicativo, lineare e conciso, molto meglio dei docenti dei vari corsi dell'ateneo.

Roberto
Economia

Ho avuto la fortuna di trovare Adriano sul web mentre cercavo aiuto per ripetizioni di statistica. Disponibilita', flessibilita' e soprattutto competenza, sono i requisiti chiave che ho riscrontrato da questa collaborazione per poter terminare i miei utlitmi esami del mio corso di laurea magistrale.

Jessica
Economia

Ho fatto con Adriano diverse lezioni private di statistica 2 uno degli esami piu' tosti di scienze statistiche; io vengo dalla facolta di matematica in cui tutto o e' bianco o e' nero e passare ad una facolta' che sembra apparentemente simile ma nella quale esiste anche il grigio, per me e' stato difficile. Mi sono trovata benissimo: spiegazioni molto chiare, fornisce materiale aggiuntivo composto da esercizi svolti per aver chiari gli argomenti e renderli piu' comprensibili.
Molto disponibile e sempre pronto ad aiutarti, si vede che ha passione per il suo lavoro e che vuole trasmettere lo stesso ai suoi studenti.
Mi sono rivolta a lui anche per un aiuto in una tesina di statistica economica 2 nella quale si chiedeva di fare un'analisi multivariata delle aziende prese in esame. e' stato puntuale, chiaro, completo e disponibile ad ogni mia richiesta.

Giulia
Scienze Statistiche

Quanto costa

A partire da 300 €

Per questa consulenza non posso stabilire a priori il prezzo in quanto ogni tesi rappresenta un mondo a sé fatto di esigenze differenti, di quantità e qualità delle analisi statistiche. Detto questo, prima di qualsiasi cosa, ti fornisco un preventivo totalmente gratuito, per cui potrai valutare se il mio servizio rispecchia le tue necessità. 

Il mio consiglio è di compilare il form per spiegarmi il tuo progetto e poi valutare in base al preventivo se proseguire o meno con me.

vai al preventivo

Analisi dati tesi: guida completa alla tua ricerca statistica

Perché dovrei affidarmi a un consulente esterno (che poi sono anche un docente) per analizzare i dati della mia tesi?

Forse perché Il tuo relatore/relatrice ti parla di correlazioni, anova, t-test, ma non ricordi niente di quello che avevi studiato? Forse perché hai poco tempo per risolvere tutto? Forse perché ti senti insicuro/a?

I motivi sono svariati e allora ho pensato di scrivere questo articolo in cui ti spiego cosa fare per terminare la carriera universitaria e presentare al meglio la tua ricerca, sia essa un’analisi statistica in medicina, un’analisi di dati per psicologia o un'analisi dei dati di vendita.

Premetto che questa non è una guida esaustiva perché le competenze sono molte ed è per questo che docenti come me dedicano il proprio lavoro all’analisi dei dati statistici, ma serve a te per farti comprendere quanti e quali cose c'è da sapere quando si vuole superare l'ultimo scalino prima di laurearsi.

La raccolta dati

La maggior parte degli studenti quando si affida a me ha già ultimato, o sta per farlo, la raccolta dei dati utili alla propria ricerca. Questo a volte è un bene, ma spesso è anche un male.

Uno statistico va interpellato prima di sottoporre un questionario o una ricerca affinché non ci siano errori successivamente che non possono più essere rimediati.

Cosa c'è da sapere quando si raccolgono i dati tramite un questionario

  • Domande chiare e specifiche sono meglio di domande generiche. Esempio: Provi un'emozione di euforia quando viaggi è preferibile rispetto alla generica Quanto ti piace viaggiare
  • Una domanda con accezione negativa può cambiare la risposta rispetto a una fornita con accezione positiva. Esempio: Quanto disprezzi gli immigrati ha un impatto emotivo più forte di Quanto apprezzi gli immigrati)
  • Codifica corretta: Meglio chiedere l'età direttamente in anni piuttosto che in classi. Nel primo caso potrai eventualmente raggruppare il campione in classi nel secondo invece ti troverai in difficoltà se avrai una distribuzione delle frequenze non omogenea
  • Ordine delle domande: Il posizionamento nel questionario influisce sulle risposte. In alcuni casi le persone tendono a rispondere sempre nella stessa maniera perché percepiscono che le domande ravvicinate si assomigliano
  • Lunghezza e pesantezza delle domande: Domande corpose ed esplicative, questionari lunghi e dettagliati aiutano meglio a capire i fenomeni, ma potrebbe essere più difficile reperire i dati in modo corretto in quanto le persone non hanno voglia di perdere tempo per compilare questionari

Il professionista che si dedica a questa sa bene come muoversi per far si che il mezzo con cui si vogliono reperire i dati sia formulato nella maniera migliore.

Organizzazione e pulizia dei dati

Prima di iniziare la vera e propria analisi statistica dei dati devi organizzarli in un supporto informatico e non basta buttarli in Excel o SPSS.

Per usare una metafora, se devi fare una torta (per esempio l’analisi economica dei dati della tua tesi), non basta comprare gli ingredienti e portarli a casa, ma dovrai sistemarli bene nella tua cucina. Alcune cose andranno nel frigorifero, altre negli scaffali, altre nella dispensa.

Così vale per i dati, a cui dovrai dare particolare attenzione in fase di codifica e qui ti viene in soccorso tutto ciò che ho spiegato in questo articolo su come creare un dataset in Excel.

E’ fondamentale seguire tutti i passaggi affinché si possa procedere all’analisi dati con excel, ma è anche il punto di partenza per l’utilizzo di qualsiasi software di analisi dati, come spiegato in quest’altro articolo su come creare un dataset in SPSS.

L'ordine e la precisione è una cosa che sempre mi hanno contraddistinto nella vita personale e credo che anche in quella lavorativa servano molto.

Con i dati organizzati bene si possono fare tante analisi interessanti ed è per questo che do molta importanza a questa fase iniziale dell'analisi.

Qui un esempio di come lavoro tratto dal mio video corso sull'analisi dati in SPSS

Analisi dati tesi

Ipotesi di ricerca

Quando inizi un progetto per la tesi il relatore o la relatrice ti approvano una o più ipotesi di ricerca e fin qui è una banale considerazione.

Quello che molti studenti non riescono a capire è come tradurre queste ipotesi in termini statistici e soprattutto quali tecniche usare affinché si possa ottenere un risultato decente.

A tal proposito devi innanzitutto identificare le variabili indipendenti, dipendenti e di controllo.

In base a come sono state codificate, qualitative o quantitative, avrai a disposizione differenti analisi statistiche.

E’ chiaro che se non sei attrezzato per svolgere in autonomia l’analisi dei dati, ti devi affidare a un professionista. In questo caso ti consiglio di contattarmi per spiegarmi la tua situazione.

In ogni caso le informazioni che ti ho scritto sopra me le dovrai fornire perché altrimenti non posso sapere quali variabili esogene (indipendenti) influenzano le variabili endogene (dipendenti).

Analisi statistica descrittiva

Una volta preparato il database e con le ipotesi di ricerca ben chiare, si passa all’analisi dati.

Il primo step è raccontare un po' come è fatto il campione attraverso le classiche statistiche descrittive.

Distribuzioni di frequenza

Bisogna calcolare le frequenze di tutte le variabili presenti nel questionario o nella fonte di dati anche se poi non verranno inserite nella tesi.

Questo serve al ricercatore per scoprire diverse cose tra le quali:

Dati mancanti

Se una domanda presenta molti dati mancanti, tipo più della metà, non può essere utile all’analisi e deve essere scartata.

Oppure possono essere individuati degli errori come il fatto che alcuni non abbiano risposto perché non hanno compreso bene la domanda.

Ricodifica di variabili

Spesso mi capita che alla tipica domanda sul titolo di istruzione vengano date troppe risposte del tipo: nessuno, elementari, medie, diploma professionale, diploma, laurea, dottorato…

Non c’è bisogno di un dettaglio tanto specifico e si possono raggruppare alcune voci per rendere la distribuzione migliore.

Frequenze elevate

Se ci si accorge che una variabile ha una frequenza troppo elevata, probabilmente può essere inutilizzabile proprio come una che non ha risposte.

Per esempio se in un’analisi statistica di psicologia vuoi vedere il comportamento di acquisto di due gruppi e uno dei due rappresenta solo il 10% del campione, capisci bene che i risultati non saranno molto attendibili.

Statistiche descrittive

In questa fase si usano diversi indici per sintetizzare al meglio le variabili e gli eventuali costrutti.

I costrutti, detti anche fattori, si usano soprattutto per l’analisi fattoriale cosa che in una tesi statistica è spesso ricorrente, ma di questo te ne parlo più avanti.

Per il momento sappi che le analisi descrittive racchiudono:

Indicatori di sintesi

I più utilizzati sono la media aritmetica e la mediana. Ti rimando ai miei articoli per maggiori dettagli o ai miei video nella playlist delle metafore statistiche.

In sostanza si cerca di fare una descrizione sommaria delle principali variabili.

Indicatori di variabilità

I più utilizzati sono la varianza, deviazione standard e il coefficiente di variazione. Qui lo scopo è differente. Ricorda che un indicatore di sintesi senza uno di variabilità non ha senso! infatti se i numeri variano troppo perchè la deviazione standard è elevata rispetto alla propria media, allora tale media è poco attendibile.

Grafici

Per una migliore rappresentazione poi, è meglio inserire dei grafici riepilogativi che impattano meglio alla vista.

E’ chiaro che devi sapere quali usare e quando usarli. Troppi grafici appesantiscono, pochi non rendono l’idea, ma soprattutto usarne uno fuori contesto rischia di non far arrivare al pubblico l’informazione desiderata.

Uno dei più utilizzati in questa fase è il boxplot che ben rappresenta indicatori di sintesi e di variabilità.

Analisi statistica bivariata

L’aspetto più interessante che caratterizza l’analisi dei dati statistici per le tesi è la relazione tra le variabili.

Un primo approccio è quello che vede mettere a confronto due variabili, da qui il nome di statistica bivariata.

A seconda della tipologia dei fenomeni, possiamo distinguere tre macro categorie

Due variabili qualitative

In questo caso la tecnica più usata è quella del test del chi-quadrato che in base a un p-value significativo ti dice se c’è una connessione tra le due variabili.

In questo video te lo spiego con una metafora statistica.

YouTube video
p-value spiegato semplice con una metafora statistica

Per sapere poi quanto è intensa la relazione ti devi affidare a indici che misurano il cosiddetto effect-size, cioè la grandezza dell’effetto.

Uno dei più noti è la V di Cramer, ma ce ne sono tantissimi e se stai facendo un’analisi statistica per la tua tesi di medicina sicuramente ti troverai a fare i conti con l’odds ratio un numero che ti dice quanto è probabile il verificarsi un di un evento data un’esposizione a un fattore di rischio.

Una variabile qualitativa e una quantitativa

La variabile qualitativa ha il ruolo di indipendente che influenza la quantitativa dipendente.

E’ il caso del t-test a campioni indipendenti dove, per esempio, puoi vedere se c’è differenza di spesa tra maschi e femmine, o se un trattamento innovativo rispetto a uno tradizionale migliora le capacità cognitive.

Questo lo puoi utilizzare quando la variabile indipendente ha solo due categorie e per questo viene chiamata dicotomica.

Se ne avesse più di due allora dovresti fare un’anova univariata a una via. Il concetto rimane lo stesso solo che le medie da confrontare non saranno due, ma di più.

C’è anche il t-test a campioni appaiati che utilizzi quando vuoi valutare una media in due periodi temporali differenti. Per esempio se stai facendo una tesi per un corso di psicologia potresti ritrovarti a valutare l’efficacia di una terapia contro la depressione e quindi avere delle misurazioni pre e post trattamento.

Un’ultima tecnica che mi sento di citare è quella della regressione logistica dove la variabile qualitativa deve essere per forza dicotomica (e codificata con 0 = Assenza del fenomeno, 1 = presenza del fenomeno) ed è usata come variabile endogena in quanto il modello costruito serve a prevedere quali e quante persone tenderanno a rientrare nella categoria uguale a 1.

Due variabili quantitative

Avrai sicuramente sentito parlare nel tuo percorso di studi della regressione lineare semplice, uno dei più famosi metodi statistici per l'analisi economica o di qualsiasi altro settore.

Se devi usare questa tecnica ricorda che devi rispettare diverse assunzioni e in generale ci sono moltissime cose da sapere.

Non basta saper usare un comando in SPSS o utilizzare un componente aggiuntivo in Excel per essere un bravo statistico

YouTube video
Retta di regressione lineare spiegata in modo semplice con una metafora

Analisi multivariata

Come dice il nome stesso, qui le analisi vengono fatte con molte variabili, o almeno più di due.

Tra le varie tecniche rientra sempre la regressione lineare che qui si chiamerà multivariata.

Come ti accennavo prima c’è una tecnica chiamata analisi fattoriale o in alternativa l’analisi delle componenti principali che si esegue per racchiudere in pochi fattori le domande di un questionario.

Per esempio vuoi capire un processo decisionale per l’acquisto di un prodotto o servizio sulla base del comportamento dei clienti.

A quel punto fai delle domande mirate, magari prese da papers già convalidati, che sai andranno a essere raggruppate in fattori per poi utilizzare quest’ultimi come nuove variabili del tuo dataset.

Tutto ciò dà un valore aggiunto se ovviamente eseguito con criterio e rispettando tutti gli step che un’analisi di dati prevede.

Altra ipotesi può essere quella di categorizzare il campione in diversi gruppi. In questo caso ti viene in aiuto la cluster analysis.

Lo scopo è creare una nuova variabile che raggruppi le righe, cioè le osservazione, che possono essere individui, aziende, stati…

YouTube video

Analisi dati tesi: Conclusioni

Ci sono tanti tipi di analisi che si possono eseguire per analizzare i dati e qui ho cercato di riassumere brevemente i principali strumenti di analisi.

Credimi se ti dico che dietro tutto questo c’è un gran lavoro di studio, approfondimento e passione che mi ha portato a essere il professionista che sono oggi.

Spero di averti aiutato un pochino e se dovessi aver bisogno di un’analisi statistica dei dati della tua tesi contattami pure e sarò lieto aiutarti.

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram