La mediana è un indice di sintesi statistico, proprio come lo è la media aritmetica.
In questo post, parliamo di cosa sia la mediana (o valore mediano), di come si calcoli, e delle sue proprietà.
Potete trovare anche un video dedicato a questo argomento in fondo al post.
Cos’è la mediana?
La mediana è un indice di sintesi di una distribuzione di caratteri quantitativi o qualitativi ordinali, ed è rappresentata dal valore della modalità che si trova esattamente nel mezzo della distribuzione.
Sebbene la definizione possa sembrare complicata, non c’è niente di più semplice.
La mediana è quel valore che divide una distribuzione esattamente a metà.
A “sinistra” e a “destra” della mediana si trova lo stesso numero di osservazioni.
Facciamo un esempio, che renderà tutto più chiaro.
Ipotizziamo di osservare il fatturato annuo (in migliaia di euro) di undici aziende, e di avere i seguenti valori:
900 | 980 | 1.020 | 1.080 | 1.100 | 1.200 | 1.300 | 1.500 | 1.800 | 2.100 | 2300 |
Come potete vedere, i valori sono già ordinati dal più basso al più alto (e vedremo tra poco che è necessario ordinare i valori per calcolare la mediana).
Osservate per un attimo il fatturato annuo delle undici aziende.
Qual è il valore, tra quelli osservati, che divide esattamente in due parti la distribuzione?
Prendetevi qualche secondo per pensarci prima di continuare a leggere.
Spero che abbiate indovinato. Il valore mediano (quello che divide esattamente in due la distribuzione)è:
1.200
Vediamo che “a sinistra” di 1.200 ci sono cinque osservazioni (ovvero cinque valori sono inferiori a 1.200), e “a destra” di 1.200 ci sono altre cinque osservazioni (cinque valori sono superiori a 1.200).
La mediana (che indicheremo d’ora in poi con Me)è quindi 1.200:
Me = 1.200
Come abbiamo visto in questo esempio, il concetto di mediana (o valore mediano)è estremamente semplice.
Andiamo a vedere adesso le regole di calcolo e i vari passaggi da prendere in considerazione.
Come si calcola la mediana?
Il calcolo della mediana è differente a seconda che i valori osservati (i valori della distribuzione)siano pari oppure dispari. Vediamo qual è il ragionamento e quali sono i passaggi da svolgere per il calcolo, e dopo facciamo un paio di esempi pratici.
Successivamente vedremo in che modo si calcola la mediana quando siamo di fronte ad una distribuzione per classi.
In sintesi, i passaggi per il calcolo della mediana sono i seguenti:
- Anzitutto ordinare i dati in ordine crescente (dal più piccolo al più grande)
- Vedere se il numero di osservazioni (n)è pari o dispari
- Se n è pari, ci saranno due valori centrali. Allora bisogna calcolare i due valori centrali e fare la media di essi. Quella sarà la mediana.
- Se n è dispari, allora basta calcolare il valore centrale (perché ce ne sarà uno soltanto).
Perché c’è questa distinzione tra n pari ed n dispari?
Perché se il numero di caratteri osservati è dispari, ci sarà un carattere esattamente al centro, e quello sarà il nostro valore mediano.
Mentre, se il numero di caratteri osservati è pari, non ci sarà un valore che divide la distribuzione esattamente in due.
Come vediamo nell’immagine seguente, la prima distribuzione ha 7 valori (n=7), quindi dispari. Il quarto valore, quindi, è quello mediano. A sinistra del quarto valore ci sono 3 numeri, e a destra ci sono altri 3 numeri.
Osserviamo invece la seconda distribuzione, in cui il numero di osservazioni è pari (n=8). Vediamo che non c’è un valore che divide esattamente in due la distribuzione. Se scegliessimo il valore 9, avremmo tre numeri alla sua sinistra (1, 3, 4), e quattro numeri alla sua destra (11, 15, 18, 20).
Allo stesso modo, se scegliessimo il valore 11, avremmo 4 numeri alla sua sinistra, e tre alla sua destra.
In casi come questo, la mediana si calcola facendo la media tra i due valori centrali (9 ed 11), quindi sarà 10 in questo caso specifico.
Vedremo diversi esempi tra pochissimo, per chiarire ulteriormente il concetto.
Prima di passare agli esempi, però, date un’occhiata qui di seguito allo schema per il calcolo della mediana, in cui vengono riassunti per grandi linee i passaggi da effettuare.
Schema per il calcolo della mediana
Robustezza della mediana
Si dice che la mediana sia un indice “robusto”. Per capire cosa si intende, potete guardare il video qui sotto:
Calcolare la mediana di una distribuzione per classi
Come vediamo nell’infografica qui sopra, il metodo per calcolare la mediana in una distribuzione per classi è differente.
Bisogna prima calcolare la classe mediana, e una volta identificata la classe mediana, è necessario calcolare il valore mediano con il metodo dell’interpolazione.
C’è anche un esercizio svolto sul calcolo della mediana in una distribuzione per classi più in basso.
Per evitare di appesantire ulteriormente questo articolo, ce n’è uno dedicato proprio al calcolo della mediana di una distribuzione per classi, che potete trovare a questo link:
Post sul calcolo della mediana di una distribuzione in classi
Esercizi svolti sul calcolo della mediana
Vediamo adesso alcuni esercizi didattici, senza alcuna pretesa di completezza.
Questi esercizi svolti che ci servono soltanto come una sorta di “mappa” per capire come risolvere gli esercizi sul calcolo della mediana.
Esercizio 1 – Calcolo semplice
Abbiamo pesato 25 confezioni di pasta di semola di grano duro da 500 grammi, per verificarne i pesi effettivi, e si sono ottenuti i seguenti dati:
PESO EFFETTIVO (in grammi) |
499 |
498 |
503 |
502 |
496 |
499 |
503 |
500 |
498 |
499 |
500 |
496 |
499 |
498 |
503 |
496 |
499 |
499 |
496 |
499 |
498 |
498 |
496 |
498 |
498 |
Determinare la mediana.
Come abbiamo visto, anzitutto dobbiamo ordinare i nostri valori in modo crescente, ottenendo:
PESO EFFETTIVO (in grammi) |
496 |
496 |
496 |
496 |
496 |
498 |
498 |
498 |
498 |
498 |
498 |
498 |
499 |
499 |
499 |
499 |
499 |
499 |
499 |
500 |
500 |
502 |
503 |
503 |
503 |
Una volta ordinati i valori in modo crescente, dobbiamo vedere se il numero di osservazioni è pari o dispari.
Abbiamo effettuato 25 osservazioni (n=25).
n è DISPARI!
Quando n è dispari, la mediana è esattamente il valore che sta nel mezzo (che divide in due le osservazioni)ed è il valore in posizione (n+1) / 2.
n = 25, significa che la mediana è il valore in posizione: (25+1)/2.
Ovvero 26/2 = 13
La mediana è il valore che si trova in posizione 13.
Andiamo a vedere qual è questo valore:
POSIZIONE | PESO EFFETTIVO (in grammi) |
1 | 496 |
2 | 496 |
3 | 496 |
4 | 496 |
5 | 496 |
6 | 498 |
7 | 498 |
8 | 498 |
9 | 498 |
10 | 498 |
11 | 498 |
12 | 498 |
13 | 499 |
14 | 499 |
15 | 499 |
16 | 499 |
17 | 499 |
18 | 499 |
19 | 499 |
20 | 500 |
21 | 500 |
22 | 502 |
23 | 503 |
24 | 503 |
25 | 503 |
Vediamo il valore in posizione 13 evidenziato in grassetto, ed è 499.
Me = 499
Esercizio 2 – Calcolo della mediana di una distribuzione di frequenze
Prendiamo i dati dell’esercizio precedente (Esercizio 1)e organizziamo la distribuzione unitaria semplice in una distribuzione di frequenze, ottenendo la seguente distribuzione:
X (peso) | Frequenza assoluta |
496 | 5 |
498 | 7 |
499 | 7 |
500 | 2 |
502 | 1 |
503 | 3 |
TOTALE (n) | 25 |
I dati in questa distribuzione di frequenze sono già ordinati in modo crescente, quindi non dobbiamo preoccuparci di ordinare i dati.
Sappiamo già, se abbiamo visto l’esercizio 1, quale sarà il valore della mediana. Lo scopo è quello di mostrare come si calcola la mediana quando anziché avere una distribuzione unitaria semplice (una lista)abbiamo di fronte una distribuzione di frequenza.
Verifichiamo subito qual è il numero di osservazioni (n), e sappiamo che è 25.
n dispari
Ripetiamo ancora una volta che quando n è dispari, la mediana è esattamente il valore che sta nel mezzo (che divide in due le osservazioni)ed è il valore in posizione (n+1) / 2.
Come nell’esercizio precedente, n = 25, significa che la mediana è il valore in posizione: (25+1)/2.
Ovvero 26/2 = 13
La mediana è il valore che si trova in posizione 13.
Per sapere qual è il valore che si trova in posizione 13, può essere utile aggiungere alle frequenze assolute, anche le frequenze cumulate:
X (peso) | Frequenza assoluta | Frequenza cumulata |
496 | 5 | 5 |
498 | 7 | 12 |
499 | 7 | 19 |
500 | 2 | 21 |
502 | 1 | 22 |
503 | 3 | 25 |
TOTALE (n) | 25 |
Vediamo che nella terza riga il valore della frequenza cumulata è 19, mentre nella seconda riga è 11. Significa che il valore in posizione 13, è 499 (in corrispondenza della frequenza cumulata 19).
Come ci aspettavamo, la mediana è 499.
Me = 499
Esercizio 3 – Calcolo della mediana con n pari
Abbiamo pesato 26 confezioni di pasta di semola di grano duro da 500 grammi, per verificarne i pesi effettivi, e si sono ottenuti i seguenti dati:
PESO EFFETTIVO (in grammi) |
499 |
498 |
503 |
502 |
496 |
499 |
503 |
500 |
498 |
499 |
500 |
496 |
499 |
498 |
503 |
496 |
499 |
499 |
496 |
499 |
498 |
498 |
496 |
498 |
498 |
504 |
Anche qui, riordiniamo i valori in modo crescente, e otteniamo la seguente lista:
POSIZIONE | PESO EFFETTIVO (in grammi) |
1 | 496 |
2 | 496 |
3 | 496 |
4 | 496 |
5 | 496 |
6 | 498 |
7 | 498 |
8 | 498 |
9 | 498 |
10 | 498 |
11 | 498 |
12 | 498 |
13 | 499 |
14 | 499 |
15 | 499 |
16 | 499 |
17 | 499 |
18 | 499 |
19 | 499 |
20 | 500 |
21 | 500 |
22 | 502 |
23 | 503 |
24 | 503 |
25 | 503 |
26 | 504 |
Una volta riordinati i valori, ci chiediamo se n (il numero di osservazioni) è pari o dispari, e sappiamo essere pari (n=26).
Quando il numero di osservazioni (n) è pari, la mediana è data dal valore medio dei due valori centrali.
Quali sono i due valori centrali? Sono il valore in posizione n/2, ed il valore in posizione (n/2)+1.
Dal momento che n=26, i due valori centrali saranno:
n/2 = 26/2 = 13
(n/2)+1 = (26/2)+1 = 13 + 1 = 14
I due valori centrali sono quelli in posizione 13 e 14.
Andiamo ad evidenziarli nella nostra distribuzione:
POSIZIONE | PESO EFFETTIVO (in grammi) |
1 | 496 |
2 | 496 |
3 | 496 |
4 | 496 |
5 | 496 |
6 | 498 |
7 | 498 |
8 | 498 |
9 | 498 |
10 | 498 |
11 | 498 |
12 | 498 |
13 | 499 |
14 | 499 |
15 | 499 |
16 | 499 |
17 | 499 |
18 | 499 |
19 | 499 |
20 | 500 |
21 | 500 |
22 | 502 |
23 | 503 |
24 | 503 |
25 | 503 |
26 | 504 |
Il valore in posizione 13 è 499. Anche il valore in posizione 14 è 499.
La media aritmetica dei due valori è data da:
(499+499)/2 = 499
Dunque la mediana è 499.
Me = 499
In questo caso è stato semplce calcolarla, perché i due valori centrali erano uguali (entrambi 499), ma anche quando sono diversi, il principio è lo stesso: si sommano i due valori, e si dividono per due (ottenendo così la media aritmentica dei due valori).
Esercizio 4 – Calcolo della mediana di una distribuzione per classi
La seguente tabella riassume il consumo in kw di un piccolo comune rilevato per 300 giorni:
Consumo giornaliero (in kw) | Giorni (frequenza assoluta) |
0 – 99 | 50 |
100 – 199 | 85 |
200 – 399 | 65 |
400 – 599 | 55 |
600 – 1000 | 45 |
TOTALE(n) | 300 |
Calcolare la mediana.
Anche in questo caso, i dati sono già ordinati in modo crescente, quindi non dobbiamo preoccuparci di ordinarli.
La distribuzione ci dice che per 50 giorni, si sono consumati tra gli 0 e i 99 kw nel comune. Per 85 giorni si sono consumati tra i 100 e i 199 kw, e così via.
Dal momento che abbiamo davanti una distribuzione di frequenze, è utile calcolare le frequenze cumulate, perché questo ci aiuterà a identificare la classe mediana.
Consumo giornaliero (in kw) | Giorni (frequenza assoluta) | Frequenza cumulata |
0 – 99 | 50 | 50 |
100 – 199 | 85 | 135 |
200 – 399 | 65 | 200 |
400 – 599 | 55 | 255 |
600 – 1000 | 45 | 300 |
TOTALE(n) | 300 |
Adesso che abbiamo ordinato i dati e calcolato le frequenze cumulate, dobbiamo dividere n per due.
Sappiamo che n=300.
n/2 = 300/2 = 150
La classe mediana è quella in posizione 150
Come vediamo dalle frequenze cumulate, la classe in posizione 150 è la classe 200-399.
Adesso che abbiamo trovato la classe mediana, come facciamo a trovare la mediana?
Con un semplice metodo (detto metodo dell’interpolazione), che consiste nell’applicare questa formula:
Dove:
Linf è il limite inferiore della classe mediana.
fm è la frequenza assoluta della classe mediana.
n è il numero di osservazioni totali.
Finf è la frequenza cumulata della classe precedente a quella mediana (ovvero la somma delle frequenze assolute delle classi precedenti a quella mediana).
w è l’ampiezza della classe mediana.
Nel nostro esempio, il limite inferiore della classe mediana è 200 (ricordiamo che la classe mediana è 200-399). La frequenza assoluta della classe mediana è 65. Il numero di osservazioni totali (n)è 300, e la frequenza cumulata della classe precedente a quella mediana è 135.
L’ampiezza della classe mediana (w)è 199 (399 – 200 = 199).
Applicando la formula con questi dati, otteniamo:
La mediana, quindi, è uguale a 245,92.
Domande e risposte
La mediana è un indice statistico che ci permette di sintetizzare il valore centrale di un carattere osservato. È quel valore che divide esattamente in due una distribuzione di frequenze.
La mediana può essere calcolata per caratteri quantitativi e anche per caratteri qualitativi ordinali (al contrario della media aritmetica, che può essere calcolata esclusivamente per caratteri quantitativi).