whatsapp
Adriano Gilardone
Adriano Gilardone
adriano gilardone Docente di Statistica Matematica Excel Spss sfruttare excel consulenze statistiche lezione videocorsi
blog

blog

Come creare un database EXCEL

Ultima modifica (11 Aprile 2025)
YouTube video
Postato il 6 Luglio 2020
Tag

Nelle consulenze statistiche che mi capita di fare a studenti universitari o lavoratori, un problema enorme che riscontro è quello della creazione e organizzazione di un database Excel.

Quando si fa una ricerca quantitativa c’è bisogno di immagazzinare i dati in un programma, come per esempio EXCEL o SPSS.

Le persone trovano in difficoltà anche solo nell’inserire i dati, figuriamoci se lo devono fare in una maniera professionale.

In questo articolo voglio spiegarti con semplicità il modo corretto per raccogliere e codificare i dati per creare un database Excel.

Ti mostrerò come inserire dati in Excel indipendentemente dal fatto che li devi scrivere a mano o scaricarli da un programma esterno, come per esempio google moduli.

Prima ancora di iniziare a reperire i dati da mettere nel tuo database Excel, hai bisogno di creare un foglio con le codifiche e la spiegazione delle variabili.

Tieni presente che se ti affidi a un professionista per un'analisi dati tesi, devi dargli uno strumento, il database Excel, che gli faccia capire di cosa stai parlando.

Il modo migliore per farlo è lo schema che ti ho preparato e dunque vediamo insieme come creare un una set di dati in Excel.

Etichetta variabili database EXCEL

etichetta delle variabili

In questa griglia ho inserito una serie di variabili che ti possono capitare quando, per esempio, sottoponi un questionario a un campione.

L'esempio si riferisce alla valutazione da parte degli utenti di alcuni oggetti che vengono mostrati loro ed è preso direttamente dal mio videocorso sull'analisi delle componenti principali e cluster analysis.

Questo fa parte di un foglio del database Excel che riguarda solo le variabili per spiegare come sono nominate e codificate. Più avanti vedrai l'altro foglio con i dati veri e propri.

La prima colonna contiene i nomi delle variabili che, come puoi notare, sono nomi corti fatti dalla lettera V, che sta per variabile, seguita da un numero.

Se ti stai chiedendo perché tu debba chiamare le variabili in questo modo sappi che in molti software, tra cui SPSS, è agevole avere nomi corti e ordinati. Questo rende il lavoro più efficiente dal punto di vista pratico.

La seconda colonna associa ai nomi quello delle etichette delle variabili che saranno effettivamente quello che vedrai nelle tabelle di frequenza, grafici o tutte le altre statistiche.

É molto importante che sia esplicativa, ma al tempo stesso sintetica altrimenti per il lettore sarà difficile identificarne il significato.

Nella terza colonna ho voluto mettere le ipotetiche domande di un questionario, ad esempio “Valuta da 1 a 7 quanto ritieni l'oggetto: Piacevole”.

Se usassi questa come etichetta sarebbe lunga e ripetitiva visto che le successive 8 hanno la stessa metrica, cambia solo l'aggettivo.

Inoltre, un bravo statistico riesce a capire il significato delle variabili se lo schema è chiaro e ordinato piuttosto che lungo e dispersivo.

Raggruppamento in fattori

Detto questo se nel tuo disegno di ricerca sono presenti degli item che formano dei fattori, cosa fondamentale nello studio dell'analisi fattoriale, dovresti assegnargli dei nomi adeguati.

Per esempio, io ho ipotizzato che 7 domande chiedessero tutte informazioni sul fattore PIACEVOLEZZA. Di conseguenza raggrupperò a fianco una cella che mi indichi proprio questo fattore.

Faccio la stessa cosa con il secondo blocco di due variabili che chiamo STILE e si riferisce al fatto che le persone giudicano gli oggetti aventi un certo stile.

Hai notato che nel fattore Piacevolezza ci sono due variabili che sono colorate con un blu scuro a differenza delle altre azzurre?

I colori nel mio modo di insegnare e di fare consulenza hanno un'importanza non solo estetica, ma soprattutto logica.

Ribaltamento delle variabili

L'esempio che sto utilizzando per spiegarti come si organizza un database Excel è la classica situazione che ti ritrovi in un'analisi delle componenti principali, ma è utile anche in altri ambiti.

Quando una variabile statistica ha un'accezione negativa, mentre le altre ce l'hanno positiva, allora devi ribaltare la variabile stessa.

Se noti gli aggettivi azzurri sono "positivi" mentre quelli blu "negativi", pertanto se stai creando un fattore positivo come la "piacevolezza", tutte le variabili dovranno avere accezione positiva.

A me interessa che mi segnali questa particolarità dimodochè io sappia che, per realizzare l'analisi dei dati in modo corretto, dovrò ribaltare la variabile scambiando tutti i valori. (1=7, 2=6,...,7=1).

Il concetto di ribaltare una variabile lo devi applicare solo se ti trovi nella situazione spiegata altrimenti puoi ovviamente sorvolare sulla questione.

Codifica variabili database EXCEL

Alle variabili appena descritte si usa attribuire una scala Likert a 5,7 o 9 punte, le cui modalità in generale vanno da totalmente in disaccordo a totalmente d’accordo o cose simili.

Ci sono poi altri tipi di fenomeni che vengono chiamati dicotomici, come per esempio il sesso che è la classica nominale dicotomica, cioè una variabile che ha solo due modalità, femmina e maschio.

Nel database Excel che ti sto proponendo la variabile "Chiarezza" è l'unica che ha una dicotomia in quanto gli oggetti mostrati possono essere solo scuri o chiari.

Di solito le categorie delle variabili dicotomiche vengono etichettate con 0 e 1 e non con 1 e 2, piccolo ma importante dettaglio.

Sebbene la differenza sembrerebbe di poco conto, non lo è quando questi caratteri vengono inseriti in un modello di regressione e prendono il nome di variabili dummy. Se le codifichi con 1 e 2 non puoi inserirle, mentre con 0 e 1 si.

La variabile "Forma" invece, pur essendo anch’essa di tipo nominale, ha più di due modalità. La consuetudine è quella di partire dal numero 1 fino al raggiungimento dell’ultima categoria, in questo esempio la terza.

La variabile "Grandezza" è una variabile qualitativa come le precedenti, ma in questo caso la chiamiamo ordinale perché le modalità hanno una caratteristica in più, e cioè si possono ordinare in modo crescente.

É per questo che nella terza colonna del foglio ho voluto aggiungere il "Livello" delle variabili indicando se sono nominali (nominal in inglese), ordinali (ordinal), o scala (scale) cioè quelle numeriche.

Ultima tipologia sono appunte le variabili quantitative come la "Famigliarità". Qui i rispondenti davano un'ipotetica percentuale di conoscenza dell'oggetto.

Queste fenomeni non hanno bisogno di codifiche in quanto sono i numeri stessi che esprimono il valore del carattere.

Ora passiamo a un altro foglio del database Excel, cioè quello che contiene effettivamente in dati per l'analisi statistica.

Foglio dati del database Excel

database excel

Il foglio del set di dati prevede nella prima riga il nome sintetico delle variabili e nella prima colonna il numero identificativo di ogni osservazione. Tutti i dati sono dei numeri anche se la maggior parte di essi rappresenta una categoria qualitativa.

Questo è il modo corretto di compilare un database Excel in quanto i dati possono essere facilmente importati in SPSS (ma anche in altri software) e poi successivamente etichettati con le caratteristiche viste prima.

Possono far eccezione i dati di tipo anagrafico o identificativo come nome, cognome, mail, residenza e così via.

Grazie alla procedura organizzativa che ti ho proposto in questo articolo, riesci ad ottenere tre vantaggi che agevolano me per l'analisi dei dati e soprattutto te per la comprensione e gestione degli stessi.

corso excel

Vantaggi organizzativi del database Excel

Il perché questo metodo possa essere molto utile nell'affrontare un'analisi dati te lo riassumo in questi tre vantaggi.

Comprensione da parte di chi scrive

Come accennato all'inizio qualsiasi professionista e soprattutto la maggior parte degli studenti fa fatica ad orientarsi quando deve gestire un enorme quantitativo di dati.

Per questa ragione ho creato questo metodo, per aiutare più persone possibili a gestire il proprio database Excel in modo efficiente e organizzato e perché no anche colorato.

Se ci pensi un file Excel creato in questa maniera permette a te di capire cosa c'è dentro anche a distanza di molto tempo, perché tramite il foglio variabile avrai sempre uno schema riepilogativo.

Comprensione da parte di chi legge

Alla volta di poter chiedere un supporto per un'analisi dati tesi o per una consulenza personalizzata sarà più facile far capire allo statistico cosa c'è nel database Excel.

Basterà una semplice mail per poter descrivere i vari fogli e la visione dettagliata delle variabili e dei dati permetterà al tuo interlocutore di capire meglio il lavoro.

A questo punto manca un ultimo passaggio per trasferire a me le informazioni necessarie per sapere quali statistiche ti devo fare e questo coincide con il terzo vantaggio.

Schema delle analisi

analisi statistiche

    Lo scopo di un'analisi statistica è quella di verificare delle ipotesi, osservare se ci sono delle relazioni tra le variabili.

    A tal proposito ti basterà usare i nomi delle variabili, ecco qui il vantaggio di farle corte, ed incrociarle con quelle di tuo interesse.

    Posto che le statistiche descrittive e i grafici te le faccio a priori di tutte le variabili, tu dovrai indicarmi solo quelle che vuoi intersecare tra di loro.

    In un terzo foglio dunque potrai compilare uno schema simile a quello della foto sopra e da lì in poi sarà mia cura dedicarmi all'analisi dei dati.

    Ti lascio due video nel quale spiego i miei servizi di analisi dati tesi e di consulenza personalizzata e mi auguro di averti trasmesso come si realizza un database Excel.

    YouTube video
    YouTube video

    Iscriviti alla Newsletter

    Se hai bisogno d’informazioni che non hai trovato nella sezione servizi o dei video corsi, scrivimi un messaggio o chiamami.
    Domande, prezzi, richieste, delucidazioni...tutto quello che ti serve. Cercherò di risponderti entro le 24h.
    Newsletter

    Consenso al trattamento dei dati
    Utilizzerò i tuoi dati (nome ed indirizzo mail) solo per inviarti gratuitamente via mail la newsletter mensile. Niente spam, niente scocciature, ti disiscrivi in un click quando vuoi.

    arrow-up-circle
    linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram