In un precedente articolo abbiamo parlato degli indici di tendenza centrale (media, moda e mediana). Questa volta analizzeremo gli indici di variabilità. In particolar modo concentreremo la nostra attenzione sulla deviazione standard, sulla varianza e sul coefficiente di variazione e la loro implementazione in SPSS, in R studio e in Excel.

Varianza, deviazione standard e coefficiente di variazione

Cosa sono gli indici di dispersione (o indici di variabilità)

In generale, gli indici di dispersione ci dicono quanto i valori si disperdono intorno alle misure di tendenza centrale, ovvero quanto si disperdono intorno al valore più rappresentativo del centro della distribuzione: più l’indice di variabilità è grande, maggiore sarà la variabilità dei dati che sto analizzando.

Utilizziamo gli indici di dispersione quando la variabile considerata è di tipo quantitativo o se è misurata su scala a intervalli o a rapporti equivalenti.

Come calcolare la Varianza e la varianza campionaria corretta

Un modo per calcolare la variabilità dei dati tenendo conto di tutti i valori della distribuzione, consiste nel calcolare la distanza (o scarto) di ciascun valore dalla media.

Se sommiamo i quadrati delle deviazioni o scarti dalla media e dividiamo questa somma per il numero delle osservazioni otteniamo la varianza.

Formula della varianza

ESEMPIO:

Nel seguente esempio viene analizzata la varianza della variabile età.

Varianza, deviazione standard e coefficiente di variazione: esempio età

Facciamo, come prima cosa, la media delle osservazioni.

Formula della media delle osservazioni

Ora possiamo utilizzare la media ottenuta per il calcolo della varianza.

calcolo della varianza

Quando la varianza viene calcolata su una popolazione, si indica con il simbolo greco σ2 ; quando, invece, viene calcolata su un campione si indica con s2. Nel caso in cui la varianza viene calcolata su un campione, inoltre, il denominatore è sostituito da n-1 così da ottenere una stima corretta della dispersione della variabile nella popolazione da cui il campione in esame è stato estratto: si parla, infatti, di varianza campionaria corretta.

Un limite della varianza come misura di dispersione è quella di avere una unità di misura espressa al quadrato. Per questo motivo, si ricorre, molto spesso, al calcolo della deviazione standard.

Deviazione standard: cos’è e come calcolarla

La deviazione standard, in generale, è pari alla radice quadrata della varianza.

A differenza di quest’ultima, la deviazione standard è un indice che viene espresso con la stessa unità di misura dei valori osservati. Indica quanto, in media, ciascun valore si discosta dalla media della popolazione.

formula deviazione standard

ESEMPIO:

Considerando l’esempio precedente, applichiamo solamente il radicando.

Questo indice di dispersione può essere interpretato anche come misura di accuratezza della media: più la deviazione standard è elevata, meno la media è efficace nel fornire un valore che sia rappresentativo dell’intera distribuzione.

Anche in questo caso, se la deviazione standard viene calcolata sulla popolazione intera, si usa la lettera greca σ ; invece, se viene calcolata su un campione si utilizza la lettera (o ds).

Un limite della deviazione standard è rappresentato dal fatto che non è un indice adatto per confrontare la dispersione di distribuzioni i cui punteggi sono espressi in unità di misura differenti.

Una misura di dispersione che non risente dell’unità di misura è il coefficiente di variazione.

Coefficiente di variazione: cos’è e quando si usa

Il coefficiente di variazione è un indice che si basa sul rapporto tra deviazione standard e media:

formula coefficiente di variazione

Attenzione: da non confondere con l’intervallo di variazione!

Questo indice esprime il grado di dispersione dei punteggi in termini di scostamento percentuale dalla media. Viene chiamato anche deviazione standard relativa.

È utile quando si vuole confrontare la dispersione di distribuzioni i cui punteggi sono espressi da unità di misure differenti.

ESEMPIO:

Consideriamo ora, oltre ai dati usati in precedenza, la media dei voti di 4 studenti e la relativa deviazione standard.

formula esempio coefficiente di variazione

Si legge come: “in media i punteggi si discostano dal valore centrale di una quantità pari a circa il 22% della media”.

In questo esempio specifico, notiamo che il coefficiente di variazione della seconda distribuzione (distribuzione espressa in anni) ha una dispersione maggiore rispetto alla prima distribuzione (espressa in voti).

Varianza, deviazione standard e coefficiente di variazione: a che servono e come calcolarli con Excel, SPSS e R

Varianza, deviazione standard e coefficiente di variazione in excel

  1. Riportiamo su un foglio Excel i dati di esempio:dati di esempio riportati su excel
  2. Su una qualunque cella vuota scriviamo il comando “VARIANZA.POP.VALORI” preceduto dall’uguale; nelle parentesi vanno inseriti i dati per il calcolo della varianza; premere invio.comando var.pop.valori

Si procede in modo analogo per il calcolo della deviazione standard.

comando dev.st.pop

Il coefficiente di variazione non ha una formula propria. Per questo dovremmo calcolarlo a “mano”: ci posizioniamo in una cella vuota di Excel; digitiamo l’uguale; selezioniamo la cella della deviazione standard; digitiamo l’operatore di divisione; selezioniamo la cella della media; moltiplichiamo il tutto per 100.

calcolo coefficiente di variazione su Excel

Varianza, deviazione standard e coefficiente di variazione in R Studio

Per calcolare gli indici In R Studio, bisognerà creare un vettorecon i valori età “x” e usare il comando mean() per la media, var() per la varianza e sd() per la deviazione standard. Per il coefficiente di variazione non esiste un comando specifico: quindi utilizzeremo i comandi precedenti per la formula del coefficiente di variazione andando a dividere sd() e mean() e infine moltiplicandolo per 100.

dimostrazione comandi su r studio

Varianza, deviazione standard e coefficiente di variazione in SPSS

  1. Per calcolare gli indici di varianza deviazione standard in SPSS, dal menù Analizza, selezionare Statistiche descrittive e poi frequenza.Dimostrazione passaggi SPSS
  2.  A questo punto si aprirà una finestra di dialogo: selezionare la variabile (quantitative) per cui calcoleremo i due indici. Selezionare l’opzione Statistiche.selezione variabile su SPSS
  3. Flaggare Varianza deviazione standard dall’elenco di statistiche proposte. Diamo Continua Ok per confermare le nostre scelte e visualizzare i risultati.

dimostrazione caselle da flaggare

Per il calcolo del coefficiente di variazione, invece, anche in SPSS non esiste una formula specifica o un’opzione da “flaggare”. Si ricorre a questo punto al classico calcolo “a mano”: dalla finestra di dialogo introdotta in precedenza, si seleziona, oltre alla deviazione standard, anche la media. Diamo il “continua” e l’ok per visualizzare i risultati. A questo punto prendiamo il valore della deviazione standard e lo dividiamo per la media della distribuzione; infine moltiplichiamo per 100.

Hai ancora dubbi sul calcolo degli indici di variabilità o hai bisogno di una nostra consulenza per un problema specifico?

Nessun problema, scrivici e spiegaci la tua necessità! Il preventivo è gratuito e senza impegno!

Contattaci per una consulenza statistica

Articolo a cura della Dott.ssa Aurelia Colucci