La mediana (statistica) – Proprietà, caratteristiche ed esercizi svolti

La mediana è un indice di sintesi statistico, proprio come lo è la media aritmetica.
In questo post, parliamo di cosa sia la mediana (o valore mediano), di come si calcoli, e delle sue proprietà.

Potete trovare anche un video dedicato a questo argomento in fondo al post.

Cos’è la mediana?

La mediana è un indice statistico che aiuta a riassumere una distribuzione di caratteri quantitativi o qualitativi ordinali. Ma non lasciarti spaventare dalla definizione! In realtà, il concetto è super intuitivo.

Cos’è la mediana?
È quel valore che sta esattamente nel mezzo di una distribuzione ordinata. In altre parole, metà dei dati si trova prima della mediana e metà dopo.

Facciamo subito un esempio pratico!
Immaginiamo di osservare il fatturato annuo (in migliaia di euro) di 11 aziende, ottenendo questi valori già ordinati:

9009801.0201.0801.1001.2001.3001.5001.8002.1002300

Ora, chiediti: quale valore si trova esattamente al centro?
Prenditi qualche secondo per pensarci…

Se hai detto 1.200, hai centrato il punto!
Infatti:
Ci sono 5 valori più piccoli di 1.200
Ci sono 5 valori più grandi di 1.200

Quindi, la mediana (che d’ora in poi indicheremo con Me) è:
Me = 1.200

Semplice, vero?
Adesso vediamo le regole di calcolo e i passaggi da seguire per trovare la mediana in ogni situazione!

La mediana statistica

Come si calcola la mediana?

Il calcolo della mediana cambia leggermente in base al numero di osservazioni: è diverso se i dati sono in numero pari o dispari. Vediamo insieme i passaggi chiave per trovarla in modo semplice e veloce!

1.Ordinare i dati in ordine crescente (dal più piccolo al più grande).
2.Contare il numero di osservazioni (n) e verificare se è pari o dispari.

Se n è dispari:

  • C’è un unico valore centrale;
  • Quel valore è la mediana!

Se n è pari:

  • Ci sono due valori centrali.
  • La mediana si ottiene facendo la media dei due valori centrali.

Perché c’è questa distinzione tra n pari ed n dispari?

Perché se il numero di caratteri osservati è dispari, ci sarà un carattere esattamente al centro, e quello sarà il nostro valore mediano.
Mentre, se il numero di caratteri osservati è pari, non ci sarà un valore che divide la distribuzione esattamente in due.

Come vediamo nell’immagine seguente, la prima distribuzione ha 7 valori (n=7), quindi dispari. Il quarto valore, quindi, è quello mediano. A sinistra del quarto valore ci sono 3 numeri, e a destra ci sono altri 3 numeri.

Mediana pari dispari

Osservando invece la seconda distribuzione, in cui il numero di osservazioni è pari (n=8). Vediamo che non c’è un valore che divide esattamente in due la distribuzione. Se scegliessimo il valore 9, avremmo tre numeri alla sua sinistra (1, 3, 4), e quattro numeri alla sua destra (11, 15, 18, 20).

Allo stesso modo, se scegliessimo il valore 11, avremmo 4 numeri alla sua sinistra, e tre alla sua destra.

In casi come questo, la mediana si calcola facendo la media tra i due valori centrali (9 ed 11), quindi sarà 10 in questo caso specifico.

Dopo aver visto queste regole di base, passeremo agli esempi pratici per fissare meglio il concetto. Inoltre, scopriremo come si calcola la mediana quando i dati sono raggruppati in classi.

Prima di passare agli esempi, però, date un’occhiata qui di seguito allo schema per il calcolo della mediana, in cui vengono riassunti per grandi linee i passaggi da effettuare.

Schema per il calcolo della mediana

Schema calcolo mediana

Robustezza della mediana

Si dice che la mediana sia un indice “robusto”. Per capire cosa si intende, puoi guardare il video qui sotto:

YouTube player

Calcolare la mediana di una distribuzione per classi

CIl metodo per calcolare la mediana in una distribuzione per classi è differente.
Bisogna prima calcolare la classe mediana, e una volta identificata la classe mediana, è necessario calcolare il valore mediano con il metodo dell’interpolazione.

Per evitare di appesantire ulteriormente questo articolo, ce n’è uno dedicato proprio al calcolo della mediana di una distribuzione per classi, che potete trovare cliccando su questo pulsante:

Esercizi svolti sul calcolo della mediana

Vediamo adesso alcuni esercizi didattici, senza alcuna pretesa di completezza.
Questi esercizi svolti che ci servono soltanto come una sorta di “mappa” per capire come risolvere gli esercizi sul calcolo della mediana.

Esercizio 1 – Calcolo semplice

Abbiamo pesato 25 confezioni di pasta di semola di grano duro da 500 grammi, per verificarne i pesi effettivi, e si sono ottenuti i seguenti dati:

499, 498, 503, 502, 496, 499, 503, 500, 498, 499, 500, 496, 499, 498, 503, 496, 499, 499, 496, 499, 498, 498, 496, 498, 498

Determinare la mediana.

Svolgimento esercizio 1

Come abbiamo visto, anzitutto dobbiamo ordinare i nostri valori in modo crescente, ottenendo:

Una volta ordinati i valori in modo crescente, dobbiamo vedere se il numero di osservazioni è pari o dispari.

Abbiamo effettuato 25 osservazioni (n=25).

n è DISPARI!

Quando n è dispari, la mediana è esattamente il valore che sta nel mezzo (che divide in due le osservazioni)ed è il valore in posizione (n+1) / 2.

n = 25, significa che la mediana è il valore in posizione: (25+1)/2.

Ovvero 26/2 = 13

La mediana è il valore che si trova in posizione 13.

Andiamo a vedere qual è questo valore:

Vediamo il valore in posizione 13 evidenziato in grassetto, ed è 499.

Me = 499

Esercizio 2 – Calcolo della mediana di una distribuzione di frequenze

Prendiamo i dati dell’esercizio precedente (Esercizio 1)e organizziamo la distribuzione unitaria semplice in una distribuzione di frequenze, ottenendo la seguente distribuzione:

X (peso)Frequenza assoluta
4965
4987
4997
5002
5021
5033
TOTALE (n)25

I dati in questa distribuzione di frequenze sono già ordinati in modo crescente, quindi non dobbiamo preoccuparci di ordinare i dati.

Sappiamo già, se abbiamo visto l’esercizio 1, quale sarà il valore della mediana. Lo scopo è quello di mostrare come si calcola la mediana quando anziché avere una distribuzione unitaria semplice (una lista)abbiamo di fronte una distribuzione di frequenza.

Verifichiamo subito qual è il numero di osservazioni (n), e sappiamo che è 25.

n dispari

Ripetiamo ancora una volta che quando n è dispari, la mediana è esattamente il valore che sta nel mezzo (che divide in due le osservazioni)ed è il valore in posizione (n+1) / 2.

Come nell’esercizio precedente, n = 25, significa che la mediana è il valore in posizione: (25+1)/2.

Ovvero 26/2 = 13

La mediana è il valore che si trova in posizione 13.

Per sapere qual è il valore che si trova in posizione 13, può essere utile aggiungere alle frequenze assolute, anche le frequenze cumulate:

X (peso)Frequenza assolutaFrequenza cumulata
49655
498712
499719
500221
502122
503325
TOTALE (n)25

Vediamo che nella terza riga il valore della frequenza cumulata è 19, mentre nella seconda riga è 11. Significa che il valore in posizione 13, è 499 (in corrispondenza della frequenza cumulata 19).

Come ci aspettavamo, la mediana è 499.

Me = 499

Esercizio 3 – Calcolo della mediana con n pari

Abbiamo pesato 26 confezioni di pasta di semola di grano duro da 500 grammi, per verificarne i pesi effettivi, e si sono ottenuti i seguenti dati:

499, 498, 503, 502, 496, 499, 503, 500, 498, 499, 500, 496, 499, 498, 503, 496, 499, 499, 496, 499, 498, 498, 496, 498, 498, 504

Calcolare la mediana

Svolgimento esercizio 3

Anche qui, riordiniamo i valori in modo crescente, e otteniamo la seguente lista:

Una volta riordinati i valori, ci chiediamo se n (il numero di osservazioni) è pari o dispari, e sappiamo essere pari (n=26).

Quando il numero di osservazioni (n) è pari, la mediana è data dal valore medio dei due valori centrali.

Quali sono i due valori centrali? Sono il valore in posizione n/2, ed il valore in posizione (n/2)+1.

Dal momento che n=26, i due valori centrali saranno:

n/2 = 26/2 = 13

(n/2)+1 = (26/2)+1 = 13 + 1 = 14

I due valori centrali sono quelli in posizione 13 e 14.

Andiamo ad evidenziarli nella nostra distribuzione:

Il valore in posizione 13 è 499. Anche il valore in posizione 14 è 499.

La media aritmetica dei due valori è data da:

(499+499)/2 = 499

Dunque la mediana è 499.

Me = 499

In questo caso è stato semplce calcolarla, perché i due valori centrali erano uguali (entrambi 499), ma anche quando sono diversi, il principio è lo stesso: si sommano i due valori, e si dividono per due (ottenendo così la media aritmentica dei due valori).

Esercizio 4 – Calcolo della mediana di una distribuzione per classi

La seguente tabella riassume il consumo in kw di un piccolo comune rilevato per 300 giorni:

Consumo giornaliero (in kw)Giorni (frequenza assoluta)
0 – 9950
100 – 19985
200 – 39965
400 – 59955
600 – 100045
TOTALE(n)300

Calcolare la mediana.

Svolgimento esercizio 4

Anche in questo caso, i dati sono già ordinati in modo crescente, quindi non dobbiamo preoccuparci di ordinarli.

La distribuzione ci dice che per 50 giorni, si sono consumati tra gli 0 e i 99 kw nel comune. Per 85 giorni si sono consumati tra i 100 e i 199 kw, e così via.

Dal momento che abbiamo davanti una distribuzione di frequenze, è utile calcolare le frequenze cumulate, perché questo ci aiuterà a identificare la classe mediana.

Consumo giornaliero (in kw)Giorni (frequenza assoluta)Frequenza cumulata
0 – 995050
100 – 19985135
200 – 39965200
400 – 59955255
600 – 100045300
TOTALE(n)300

Adesso che abbiamo ordinato i dati e calcolato le frequenze cumulate, dobbiamo dividere n per due.

Sappiamo che n=300.

n/2 = 300/2 = 150

La classe mediana è quella in posizione 150

Come vediamo dalle frequenze cumulate, la classe in posizione 150 è la classe 200-399.

Adesso che abbiamo trovato la classe mediana, come facciamo a trovare la mediana?

Con un semplice metodo (detto metodo dell’interpolazione), che consiste nell’applicare questa formula:

Calcolare la mediana di una distribuzione in classi - Metodo dell'interpolazione

Dove:

Linf è il limite inferiore della classe mediana.

fm è la frequenza assoluta della classe mediana.

n è il numero di osservazioni totali.

Finf è la frequenza cumulata della classe precedente a quella mediana (ovvero la somma delle frequenze assolute delle classi precedenti a quella mediana).

w è l’ampiezza della classe mediana.

Nel nostro esempio, il limite inferiore della classe mediana è 200 (ricordiamo che la classe mediana è 200-399). La frequenza assoluta della classe mediana è 65. Il numero di osservazioni totali (n)è 300, e la frequenza cumulata della classe precedente a quella mediana è 135.

L’ampiezza della classe mediana (w)è 199 (399 – 200 = 199).

Applicando la formula con questi dati, otteniamo:

La mediana, quindi, è uguale a 245,92.

Domande e risposte

Cos’è la mediana?

La mediana è un indice statistico che ci permette di sintetizzare il valore centrale di un carattere osservato. È quel valore che divide esattamente in due una distribuzione di frequenze.

Su quali tipi di caratteri si può calcolare la mediana?

La mediana può essere calcolata per caratteri quantitativi e anche per caratteri qualitativi ordinali (al contrario della media aritmetica, che può essere calcolata esclusivamente per caratteri quantitativi).

Video

YouTube player

Facci sapere cosa ne pensi di questo post lasciando una valutazione qui sotto!

Questo post ti è stato utile?

0 / 5 5 Voti: 9

Your page rank:

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Torna in alto