Come fare un grafico a dispersione su Excel? Ma soprattutto, perché farlo?
Partiamo dalle basi: i grafici a dispersione ti aiutano a rivelare nei tuoi dati schemi, tendenze e correlazioni che potrebbero non essere evidenti nell’immediato. Crearli su Excel è semplice e veloce, se sai dove mettere le mani.
Dimmi un po’: sei mai finito a grattarti la testa davanti a un foglio Excel, o anche su fogli Google, chiedendoti come trasformare quel mare di numeri in qualcosa di visivamente comprensibile?
Sei nel posto giusto: sono Adriano Gilardone, docente di statistica e formatore di Excel da oltre 20 anni. In questo articolo ti spiego tutto ciò che devi sapere su come fare grafici a dispersione in Excel. Sì, parlo proprio di quei grafici che sembrano puntini sparati a caso, ma che in realtà nascondono informazioni significative sui tuoi dati.
Vediamo quali.
Un grafico a dispersione - conosciuto anche come diagramma di dispersione o scatter plot - è quel tipo di grafico che mette in relazione due variabili quantitative sotto forma di punti.
Tanto per fare un esempio, se stai cercando di capire se le variabili "ore di studio" e "voto all'esame" interagiscono tra loro, il grafico a dispersione fa certamente a caso tuo.
Vuoi imparare come rappresentare i tuoi dati attraverso grafici d’impatto?
Ho creato un corso intensivo su questo argomento: 2 ore di lezione editate da me per non perdere tempo, file Excel con soluzioni e video esplicativi che ti faranno diventare un vero esperto di grafici, anche per quelli a dispersione.
Il grafico a dispersione è uno strumento potente per la visualizzazione dei dati. Ecco perché:
Aiuta a identificare visivamente se c'è una possibile correlazione lineare tra due variabili o, in generale, una relazione di qualche tipo. Sono direttamente proporzionali? C'è una relazione quadratica, esponenziale, logaritmica? O forse non c'è correlazione affatto?
Hai mai avuto dati che semplicemente non si adattano allo schema?
Il grafico a dispersione rende questi outliers (o valori anomali) chiaramente visibili, permettendo un'analisi e una pulizia dei dati per una migliore interpretazione.
Visualizzare più gruppi di dati sullo stesso grafico a dispersione ti aiuta a confrontarli direttamente, vedendo come differiscono o si assomigliano.
Creare un grafico a dispersione su Excel è meno complicato di quanto pensi. Segui questi passi:
Scegli le colonne che contengono le variabili che vuoi analizzare e selezionale a partire dall’intestazione.
Vai su Inserisci > Grafico > A dispersione
Utilizza gli strumenti di Excel per cambiare colori, aggiungere etichette e rendere il tuo grafico ancora più leggibile. Per farlo hai due opzioni.
Questa azione apre un pannello di opzioni sulla destra, permettendoti di apportare modifiche dirette agli elementi selezionati del grafico.
Compare la scheda "Strumenti grafico" nella barra del menu superiore. Cliccando sul bottone "Aggiungi elemento grafico", posizionato nell'angolo in alto a sinistra, avrai accesso a un'ampia gamma di opzioni per personalizzare il tuo grafico.
Una volta che hai selezionato i tuoi dati e hai creato il grafico a dispersione, un aspetto cruciale per rendere il tuo grafico veramente efficace è l'aggiustamento della scala degli assi. Ecco come fare:
Fai doppio clic sull'asse che intendi modificare o far clic destro sull'asse e seleziona "Formato asse" dal menu contestuale. Questo aprirà un pannello di opzioni sul lato destro.
Nel pannello "Opzioni assi", troverai diverse opzioni per personalizzare la scala. Puoi modificare il valore minimo e massimo dell'asse, che è utile per concentrarti su una specifica area dei tuoi dati.
Ricorda che un grafico può cambiare totalmente significato a seconda della scala che scegli. Un erronea scelta della può fuorviare le informazioni visive che un grafico a dispersione restituisce.
Puoi anche regolare le unità della scala (i segni lungo l'asse che indicano i valori) per rendere il grafico più facile da leggere. Un intervallo troppo stretto può rendere il grafico sovraffollato, mentre un intervallo troppo ampio può rendere difficile la lettura dei dettagli.
Se stai lavorando con numeri molto grandi o molto piccoli, potresti voler modificare il formato numerico degli assi per migliorare la leggibilità. Ad esempio, puoi usare il formato scientifico o abbreviare i numeri con migliaia (K) o milioni (M).
Ormai sai bene a cosa serve un grafico a dispersione: è una narrazione visiva che permette di esplorare la relazione tra variabili.
Leggi attentamente i prossimi paragrafi per comprendere appieno i vantaggi che presenta.
Quando di parla di correlazione si sotto intende una correlazione lineare, cioè un legame direttamente proporzionale tra due variabili che dal punto di vista grafico si vede osservando i punti come se fossero su una retta.
La correlazione lineare può essere di tre tipi:
I punti si dispongono in modo ascendente da sinistra verso destra, ciò significa che, man mano che la variabile X aumenta, anche la Y tende ad aumentare.
Un esempio classico è il rapporto tra “ore di studio” e “voto all’esame”: più ore dedichi allo studio, migliori risultati puoi aspettarti.
I punti si dispongono in modo discendente da sinistra verso destra, ciò significa che, man mano che la variabile X aumenta, la Y tende ad diminuire.
Un esempio può essere il rapporto tra il prezzo di un bene e la sua domanda: più il prezzo aumenta e più la domanda diminuisce.
Se i punti sono distribuiti apparentemente a caso, senza mostrare alcun pattern ascendente o discendente, allora le due variabili non presentano una correlazione lineare evidente.
Se vuoi approfondire l’argomento, leggi l’articolo dove parlo del coefficiente lineare di Pearson.
Un esempio può essere il fatto che la quantità mangiata in un anno di cioccolato non ha alcuna influenza sulla rata del mutuo della propria casa.
Excel consente di andare oltre il semplice grafico a dispersione bidimensionale, introducendo la possibilità di analizzare tre variabili quantitative contemporaneamente. Questo tipo di grafico è particolarmente utile per visualizzare relazioni complesse e gerarchie all'interno dei tuoi dati.
In questo caso, puoi rappresentare i tuoi dati usando un grafico a bolle, dove la dimensione di ogni bolla riflette il valore o la grandezza di una terza variabile.
Un valido strumento di Excel è l'aggiunta di etichette personalizzate ai punti del grafico. Questo significa che puoi fare in modo che ogni punto mostri informazioni aggiuntive, come altri valori di dati o descrizioni.
È un ottimo modo per rendere i tuoi grafici interattivi e ancora più informativi.
Ma, c’è un ma: devi sapere che non tutte le versioni di Excel o add-on permettono di rendere le etichette interattive. Tutti i miei articoli fanno riferimento alla versione di Office 365. Nella maggior parte dei casi non c'è differenza tra versioni o se c'è è minima.
Clicca sul grafico per attivare le due schede in alto.
Vai alla scheda "Struttura grafico" e poi scegli il pulsante a sinistra "Aggiungi elemento grafico" come già visto in precedenza.
Clicca su "Etichette dati" > e poi su "Altre opzioni etichette dati..." per aprire un menu di opzioni dettagliate a destra.
In alternativa, se disponibile, puoi anche cliccare direttamente su un punto del grafico, fare clic destro e selezionare "Aggiungi etichetta dati" > "Aggiungi etichetta dati", ma se usi questo metodo dovrai poi fare doppio clic su un dato affinchè ti compaia il menu di opzioni a destra
Adesso nel pannello "Opzioni etichetta", dovrai mettere il flag a "Valore da celle" (ed eventualmente togliere altri flag inutili). A questo punto ti si apre una finestrella che ti chiede di inserire l'intervallo dove sono contenute le etichette. Fatta la selezione, le etichette verranno inserite automaticamente vicino ai punti o alle bolle se hai fatto un grafico con 3 variabili.
Ultimo punto, ma decisamente il più importante, sono le linee di tendenza che possono aiutarti a vedere la direzione generale dei tuoi dati.
Excel può calcolare e tracciare automaticamente queste linee per te. Ecco come fare.
Vai alla scheda "Struttura grafico", disponibile in alto, e clicca su "Aggiungi elemento grafico". Selezione "Linea di tendenza" dall'elenco delle opzioni.
Excel ti mette a disposizione:
Una cosa molto utile in questo pannello sono i due flag in basso che riguardano la visualizzazione dell'equazione sul grafico e del valore R quadrato.
Il primo ti restituisce la formula che sta dietro al modello rappresentato nel grafico, mentre il secondo ti dà la bontà di adattamento di questo modello
Inserisci >>> Grafico >>> Dispersione (XY)
Grafici >>> Finestre di dialogo legacy >>> Dispersione/Punti