CONTATTO:
Se hai bisogno dell’analisi dati per la tesi compila il form spiegandomi quello che ti serve.
Allega il materiale che hai a disposizione (dataset, la tua tesi, articoli di riferimento…) cercando di farmi capire a cosa si riferiscono i dati.
PREVENTIVO:
Una volta ricevuta la mail ti ricontatto per eventuali dubbi e per farti un preventivo.
Se accetti ci accordiamo sulla tempistica, che di solito non supera i 5 giorni, ma se avrai urgenza posso anche svolgerti l’analisi in un solo giorno.
ANALISI:
Avendo chiaro le tue esigenze procedo all’analisi vera e propria. Da una parte eseguo quello che mi chiedi e dall’altra implemento ulteriori statistiche se lo ritengo opportuno per il tuo scopo, il tutto già compreso nel preventivo.
Se durante il processo mi rende conto che c’è qualcosa che non va, ti aggiorno costantemente.
VIDEO ESPLICATIVO:
Terminata l’analisi ti registro un video in cui ti spiego tutti i passaggi e soprattutto ti commento ogni singolo indice, grafico o risultato.
Il video è molto utile perché potrai riguardarlo quante volte vorrai e chiarirti le idee in qualsiasi momento.
CONSEGNA:
Di norma svolgo le analisi in SPSS e poi esporto i dati in EXCEL dimodoché tu possa formattare le tabelle a tuo piacimento e inserirle nella tesi con dei semplici copia e incolla.
Ti fornisco comunque tutte le estensioni di SPSS (.sav, .spv, .sps) affinchè il tuo tuor possa, nell’eventualità, consultarle.
SUPPORTO POST ANALISI:
Dopo la consegna rimango a disposizione per qualsiasi cosa.
Precisazione: un ulteriore chiarimento via mail o WhatsApp è compreso nella consulenza. Se hai bisogno di altre analisi o spiegazioni, potrebbe esserci la necessità di integrare il preventivo iniziale.
Di seguito ecco tutte le tecniche che posso utilizzare per l’analisi dei dati:
- analisi valori mancanti
- ricodifica delle variabili
- creazione di nuove
- variabili e indici
- pulizia degli outliers
- t-test a campione singolo
- t-test a campioni indipendenti
- t-test a campioni appaiati
- coefficiente di correlazione di Pearson
- correlazione di Spearman
- tabelle di frequenze: assolute, percentuali e cumulate
- grafici: a torta, a barre, istogrammi, boxplot, a dispersione
- indicatori di sintesi: moda, media, mediana, quartili, percentili
- indicatori di variabilità: varianza, deviazione standard, coefficiente di variazione, range interquartile
- indicatori di forma: asimmetria, curtosi
- anova univariata a una via
- anova a due vie
- anova fattoriale
- anova a misure ripetute
- anova mista
- eta quadro
- ancova
- anova multivariata
- manova
- mancova
- anova di Poisson
- anova logistica
- tabelle di contingenza
- indice Phi
- indice V di Cramer
- indice gamma
- odds-ratio
- indice tau di Kendall
- inidice lambda di Goodman e Kruskal
- inidice D di Somers
- modello di regressione lineare semplice
- modello di regressione lineare multipla
- bontà di adattamento (r-quadro)
- grafici
- modelli di mediazione statistica
- modelli di moderazione statistica
- regressione logistica binaria
- regressione logistica multinomiale
- chi-quadrato di Wald
- pseudo r-quadro
- test di Hosmer e Lemeshow
- indipendenza dei residui
- outliers
- omoschedasticità
- normalità dei residui
- linearità
- assenza di collinearità
- test di Wilcoxon dei segni (Wilcoxon signed ranks test)
- Mann-Whitney (Wilcoxon rank-sum test)
- Friedman
- Kruskal-Wallis
- analisi fattoriale confermativa (AFC)
- analisi fattoriale esplorativa (AFE)
- analisi delle componenti principali (APC)
- alpha di Cronbach
- cluster gerarchico
- cluster k-means
- cluster two step
- descrizione del modello
- programmi di utilità
- valori d’importanza
- correlazioni
- probabilità di preferenza
- test di uguaglianza delle medie
- test di significatività
- lambda di Wilks
- baricentri
- grafici a dispersione
- punti riga
- punti colonna
- punteggi nella dimensione
- grafici a dispersione
A partire da 300 €
Per questa consulenza non posso stabilire a priori il prezzo in quanto ogni tesi rappresenta un mondo a sé fatto di esigenze differenti, di quantità e qualità delle analisi statistiche. Detto questo, prima di qualsiasi cosa, ti fornisco un preventivo totalmente gratuito, per cui potrai valutare se il mio servizio rispecchia le tue necessità.
Il mio consiglio è di compilare il form per spiegarmi il tuo progetto e poi valutare in base al preventivo se proseguire o meno con me.
Perché dovrei affidarmi a un consulente esterno (che poi sono anche un docente) per analizzare i dati della mia tesi?
Forse perché Il tuo relatore/relatrice ti parla di correlazioni, anova, t-test, ma non ricordi niente di quello che avevi studiato? Forse perché hai poco tempo per risolvere tutto? Forse perché ti senti insicuro/a?
I motivi sono svariati e allora ho pensato di scrivere questo articolo in cui ti spiego cosa fare per terminare la carriera universitaria e presentare al meglio la tua ricerca, sia essa un’analisi statistica in medicina, un’analisi di dati per psicologia o un'analisi dei dati di vendita.
Premetto che questa non è una guida esaustiva perché le competenze sono molte ed è per questo che docenti come me dedicano il proprio lavoro all’analisi dei dati statistici, ma serve a te per farti comprendere quanti e quali cose c'è da sapere quando si vuole superare l'ultimo scalino prima di laurearsi.
La maggior parte degli studenti quando si affida a me ha già ultimato, o sta per farlo, la raccolta dei dati utili alla propria ricerca. Questo a volte è un bene, ma spesso è anche un male.
Uno statistico va interpellato prima di sottoporre un questionario o una ricerca affinché non ci siano errori successivamente che non possono più essere rimediati.
Il professionista che si dedica a questa sa bene come muoversi per far si che il mezzo con cui si vogliono reperire i dati sia formulato nella maniera migliore.
Prima di iniziare la vera e propria analisi statistica dei dati devi organizzarli in un supporto informatico e non basta buttarli in Excel o SPSS.
Per usare una metafora, se devi fare una torta (per esempio l’analisi economica dei dati della tua tesi), non basta comprare gli ingredienti e portarli a casa, ma dovrai sistemarli bene nella tua cucina. Alcune cose andranno nel frigorifero, altre negli scaffali, altre nella dispensa.
Così vale per i dati, a cui dovrai dare particolare attenzione in fase di codifica e qui ti viene in soccorso tutto ciò che ho spiegato in questo articolo su come creare un dataset in Excel.
E’ fondamentale seguire tutti i passaggi affinché si possa procedere all’analisi dati con excel, ma è anche il punto di partenza per l’utilizzo di qualsiasi software di analisi dati, come spiegato in quest’altro articolo su come creare un dataset in SPSS.
L'ordine e la precisione è una cosa che sempre mi hanno contraddistinto nella vita personale e credo che anche in quella lavorativa servano molto.
Con i dati organizzati bene si possono fare tante analisi interessanti ed è per questo che do molta importanza a questa fase iniziale dell'analisi.
Qui un esempio di come lavoro tratto dal mio video corso sull'analisi dati in SPSS
Quando inizi un progetto per la tesi il relatore o la relatrice ti approvano una o più ipotesi di ricerca e fin qui è una banale considerazione.
Quello che molti studenti non riescono a capire è come tradurre queste ipotesi in termini statistici e soprattutto quali tecniche usare affinché si possa ottenere un risultato decente.
A tal proposito devi innanzitutto identificare le variabili indipendenti, dipendenti e di controllo.
In base a come sono state codificate, qualitative o quantitative, avrai a disposizione differenti analisi statistiche.
E’ chiaro che se non sei attrezzato per svolgere in autonomia l’analisi dei dati, ti devi affidare a un professionista. In questo caso ti consiglio di contattarmi per spiegarmi la tua situazione.
In ogni caso le informazioni che ti ho scritto sopra me le dovrai fornire perché altrimenti non posso sapere quali variabili esogene (indipendenti) influenzano le variabili endogene (dipendenti).
Una volta preparato il database e con le ipotesi di ricerca ben chiare, si passa all’analisi dati.
Il primo step è raccontare un po' come è fatto il campione attraverso le classiche statistiche descrittive.
Bisogna calcolare le frequenze di tutte le variabili presenti nel questionario o nella fonte di dati anche se poi non verranno inserite nella tesi.
Questo serve al ricercatore per scoprire diverse cose tra le quali:
Se una domanda presenta molti dati mancanti, tipo più della metà, non può essere utile all’analisi e deve essere scartata.
Oppure possono essere individuati degli errori come il fatto che alcuni non abbiano risposto perché non hanno compreso bene la domanda.
Spesso mi capita che alla tipica domanda sul titolo di istruzione vengano date troppe risposte del tipo: nessuno, elementari, medie, diploma professionale, diploma, laurea, dottorato…
Non c’è bisogno di un dettaglio tanto specifico e si possono raggruppare alcune voci per rendere la distribuzione migliore.
Se ci si accorge che una variabile ha una frequenza troppo elevata, probabilmente può essere inutilizzabile proprio come una che non ha risposte.
Per esempio se in un’analisi statistica di psicologia vuoi vedere il comportamento di acquisto di due gruppi e uno dei due rappresenta solo il 10% del campione, capisci bene che i risultati non saranno molto attendibili.
In questa fase si usano diversi indici per sintetizzare al meglio le variabili e gli eventuali costrutti.
I costrutti, detti anche fattori, si usano soprattutto per l’analisi fattoriale cosa che in una tesi statistica è spesso ricorrente, ma di questo te ne parlo più avanti.
Per il momento sappi che le analisi descrittive racchiudono:
I più utilizzati sono la media aritmetica e la mediana. Ti rimando ai miei articoli per maggiori dettagli o ai miei video nella playlist delle metafore statistiche.
In sostanza si cerca di fare una descrizione sommaria delle principali variabili.
I più utilizzati sono la varianza, deviazione standard e il coefficiente di variazione. Qui lo scopo è differente. Ricorda che un indicatore di sintesi senza uno di variabilità non ha senso! infatti se i numeri variano troppo perchè la deviazione standard è elevata rispetto alla propria media, allora tale media è poco attendibile.
Per una migliore rappresentazione poi, è meglio inserire dei grafici riepilogativi che impattano meglio alla vista.
E’ chiaro che devi sapere quali usare e quando usarli. Troppi grafici appesantiscono, pochi non rendono l’idea, ma soprattutto usarne uno fuori contesto rischia di non far arrivare al pubblico l’informazione desiderata.
Uno dei più utilizzati in questa fase è il boxplot che ben rappresenta indicatori di sintesi e di variabilità.
L’aspetto più interessante che caratterizza l’analisi dei dati statistici per le tesi è la relazione tra le variabili.
Un primo approccio è quello che vede mettere a confronto due variabili, da qui il nome di statistica bivariata.
A seconda della tipologia dei fenomeni, possiamo distinguere tre macro categorie
In questo caso la tecnica più usata è quella del test del chi-quadrato che in base a un p-value significativo ti dice se c’è una connessione tra le due variabili.
In questo video te lo spiego con una metafora statistica.
Per sapere poi quanto è intensa la relazione ti devi affidare a indici che misurano il cosiddetto effect-size, cioè la grandezza dell’effetto.
Uno dei più noti è la V di Cramer, ma ce ne sono tantissimi e se stai facendo un’analisi statistica per la tua tesi di medicina sicuramente ti troverai a fare i conti con l’odds ratio un numero che ti dice quanto è probabile il verificarsi un di un evento data un’esposizione a un fattore di rischio.
La variabile qualitativa ha il ruolo di indipendente che influenza la quantitativa dipendente.
E’ il caso del t-test a campioni indipendenti dove, per esempio, puoi vedere se c’è differenza di spesa tra maschi e femmine, o se un trattamento innovativo rispetto a uno tradizionale migliora le capacità cognitive.
Questo lo puoi utilizzare quando la variabile indipendente ha solo due categorie e per questo viene chiamata dicotomica.
Se ne avesse più di due allora dovresti fare un’anova univariata a una via. Il concetto rimane lo stesso solo che le medie da confrontare non saranno due, ma di più.
C’è anche il t-test a campioni appaiati che utilizzi quando vuoi valutare una media in due periodi temporali differenti. Per esempio se stai facendo una tesi per un corso di psicologia potresti ritrovarti a valutare l’efficacia di una terapia contro la depressione e quindi avere delle misurazioni pre e post trattamento.
Un’ultima tecnica che mi sento di citare è quella della regressione logistica dove la variabile qualitativa deve essere per forza dicotomica (e codificata con 0 = Assenza del fenomeno, 1 = presenza del fenomeno) ed è usata come variabile endogena in quanto il modello costruito serve a prevedere quali e quante persone tenderanno a rientrare nella categoria uguale a 1.
Avrai sicuramente sentito parlare nel tuo percorso di studi della regressione lineare semplice, uno dei più famosi metodi statistici per l'analisi economica o di qualsiasi altro settore.
Se devi usare questa tecnica ricorda che devi rispettare diverse assunzioni e in generale ci sono moltissime cose da sapere.
Non basta saper usare un comando in SPSS o utilizzare un componente aggiuntivo in Excel per essere un bravo statistico
Come dice il nome stesso, qui le analisi vengono fatte con molte variabili, o almeno più di due.
Tra le varie tecniche rientra sempre la regressione lineare che qui si chiamerà multivariata.
Come ti accennavo prima c’è una tecnica chiamata analisi fattoriale o in alternativa l’analisi delle componenti principali che si esegue per racchiudere in pochi fattori le domande di un questionario.
Per esempio vuoi capire un processo decisionale per l’acquisto di un prodotto o servizio sulla base del comportamento dei clienti.
A quel punto fai delle domande mirate, magari prese da papers già convalidati, che sai andranno a essere raggruppate in fattori per poi utilizzare quest’ultimi come nuove variabili del tuo dataset.
Tutto ciò dà un valore aggiunto se ovviamente eseguito con criterio e rispettando tutti gli step che un’analisi di dati prevede.
Altra ipotesi può essere quella di categorizzare il campione in diversi gruppi. In questo caso ti viene in aiuto la cluster analysis.
Lo scopo è creare una nuova variabile che raggruppi le righe, cioè le osservazione, che possono essere individui, aziende, stati…
Ci sono tanti tipi di analisi che si possono eseguire per analizzare i dati e qui ho cercato di riassumere brevemente i principali strumenti di analisi.
Credimi se ti dico che dietro tutto questo c’è un gran lavoro di studio, approfondimento e passione che mi ha portato a essere il professionista che sono oggi.
Spero di averti aiutato un pochino e se dovessi aver bisogno di un’analisi statistica dei dati della tua tesi contattami pure e sarò lieto aiutarti.