Riflessioni sulle Scienze
di Alberto Viotto indice articoli
La conoscenza è statistica
Dicembre 2010
-
Semplificazioni
-
La ricchezza dei popoli
-
Numeri a caso
-
Allergia per i numeri
-
I numeri che servono
-
Un po’ di matematica
…da li conti che se fanno
seconno le statistiche d'adesso
risurta che te tocca un pollo all'anno:
e, se nun entra nelle spese tue,
t'entra ne la statistica lo stesso
perch'è c'è un antro che ne magna due
Trilussa, La Statistica
La percezione comune della statistica è di qualcosa di fumoso ed impreciso, spesso utilizzato per confondere le idee di chi ascolta. La famosissima storia del pollo mangiato da una sola persona che fa attribuire mezzo pollo anche a chi digiuna è diventata paradigmatica. In realtà questa sfiducia nelle statistiche è in gran parte frutto di ignoranza.
Semplificazioni
Le statistiche semplificano l’informazione, fornendo soltanto il livello di conoscenza che ci serve. Se si fa una statistica sull’altezza delle persone di una nazione, ad esempio, si riduce l’informazione puntuale sulla statura di ogni singolo cittadino della nazione, che non riusciremmo a maneggiare, ad un dato molto più semplice, la media. Ma, se si vuole, ci sono strumenti per ricavare molto altro da una base di dati. Il più semplice è la suddivisione del campione dei dati in diverse fasce.
In una nazione, ad esempio, ci possono essere due ceppi razziali, uno di persone molto alte, l’altro di persone molto basse, una situazione ben diversa da quella di una nazione in cui quasi tutte le persone hanno un’altezza simile. Questa informazione non viene persa inevitabilmente con la semplificazione statistica: si può suddividere il campione di dati in fasce e considerare la media di ogni fascia. In questo caso si vedrà che il cinquanta per cento superiore è decisamente più alto della media, il cinquanta per cento inferiore decisamente più basso.
Lo strumento statistico più appropriato per capire in che modo i dati variano è il cosiddetto “scarto quadratico medio” (1), e cioè la radice della media dei quadrati degli scostamenti dalla media. Il motivo per cui non si può usare la semplice media degli scostamenti è che questa per definizione è uguale a zero, mentre elevando al quadrato questi valori si ottiene sempre un numero positivo, che può essere usato per ottenere a sua volta una media significativa. Nell’esempio che abbiamo fatto, nella nazione con una popolazione non omogenea lo scarto quadratico medio sarà decisamente più alto che nell’altra nazione.
La ricchezza dei popoli
Se metà della popolazione mangia un pollo intero e l’altra metà nessun pollo la statistica lo può facilmente rilevare, ma non sono a conoscenza di ricerche su una cosa tanto insignificante. Un dato molto interessante, invece, è quello che riguarda la ricchezza delle persone. Il dato statistico più utilizzato è il PIL (Prodotto interno lordo) pro capite, cioè l’indicazione di quanti soldi sono in media disponibili ad una persona di una nazione. Nel 2008 questa statistica era guidata dal Lussemburgo, con un reddito medio pro capite di 113.000 dollari. Negli Stati Uniti il reddito medio era di 47.000 dollari circa, in Francia di 46.000, in Italia di 39.000, in Brasile di 8.000, in Cina di 3.300, fino al Burundi con un reddito medio di 138 dollari. (2)
E’ chiaro, però, che questa informazione non è sufficiente; ci sono Paesi in cui la ricchezza è detenuta da poche persone, altri in cui è distribuita in modo molto più omogeneo. Per descrivere le diseguaglianze all’interno di una nazione non si usa lo scarto quadratico medio, ma una grandezza appositamente definita, il coefficiente di Gini (3), così chiamato dal nome dello statistico italiano Corrado Gini.
Questo coefficiente può variare da zero (uguaglianza totale, tutte le persone hanno lo stesso reddito) a uno (massima disuguaglianza, tutta la ricchezza in mano ad una sola persona). Se in un grafico si traccia una linea che descrive i dati statistici che rappresentano la ricchezza delle varie fasce di popolazione (curva di Lorenz) e la linea di perfetta uguaglianza (che corrisponderebbe ad una ricchezza distribuita in modo uniforme), il coefficiente di Gini è definito come il rapporto fra:
-
l’area compresa tra la linea di perfetta uguaglianza e la curva dei dati statistici che rappresentano la ricchezza delle varie fasce di popolazione
-
l’area totale sotto la linea di perfetta uguaglianza
Il coefficiente di Gini è un indicatore semplice ed immediato del livello di disuguaglianza economica all’interno di una nazione. Se ad esempio il reddito medio aumenta, ma assieme ad esso aumenta anche il coefficiente di Gini, lo stato di povertà non sta cambiando per la maggioranza della popolazione.
Il coefficiente di Gini dei paesi europei è tra 0.25 e 0.35 (in Norvegia 0.25, in Italia 0.28). Negli Stati Uniti è di circa 0.47 e indica una maggiore disparità nella distribuzione del reddito. In Sudafrica, in cui vi sono disuguaglianze ancora maggiori, il coefficiente di Gini è 0.58.
Numeri a caso
Nei libri e negli articoli si citano pochissimi numeri, spesso messi più o meno a caso, con dettagli ininfluenti e senza fornire le informazioni necessarie. Dovendo documentarmi sul costo medio dell’assicurazione in Italia, ad esempio, avevo trovato un articolo che sembrava facesse al caso mio (4) e che è assolutamente paradigmatico per quanto riguarda il trattamento dei numeri. Di numeri ce ne sono, ma scorrelati tra loro e senza informazioni essenziali. Si dice, ad esempio, che la raccolta dei premi RC auto è aumentata del 2.5%. Ma qual è il suo valore? Quanto si paga in media per assicurarsi? Un altro dato presente nell’articolo sembrerebbe aiutarci (la raccolta totale ha raggiunto 69.5 miliardi di euro), ma poi si scopre che questa cifra comprende anche i rami danni e vita, che non si dice in quale percentuale contribuiscano. Molti altri articoli usano i numeri in modo simile, ad esempio parlando di aumento o diminuzione senza specificare le cifre in gioco.
Dopo un po’ di ricerche sono comunque riuscito a trovare le cifre che mi servivano. Nel 2009 le assicurazioni hanno incassato 18.3 miliardi di euro dal settore RC auto (407€ in media da ognuno dei 45 milioni di assicurati) ed hanno pagato 15 miliardi di euro in risarcimenti, 330€ per ogni assicurato. La differenza tra i due valori è il loro guadagno.
Allergia per i numeri
L’utilizzo insufficiente ed improprio dei numeri in libri ed articoli è dovuto da una parte alla scarsa dimestichezza con l’aritmetica degli autori, dall’altra alla convinzione che ai lettori non piacciano articoli con molti numeri, come se pensassero che con i numeri si possano portare le persone a credere quello che si vuole, come nella citazione di Trilussa.
E’ chiaro che numeri e statistiche si possono usare in modo tendenzioso, ma è abbastanza facile accorgersene. Tra i trucchi più comuni, si può fare implicitamente credere che i valori massimi siano valori medi, oppure utilizzare l’espressione “fino al” per introdurre cifre praticamente senza senso. (5) Però è facile capire se un articolo riporta dei numeri più o meno a caso o sta cercando di informare correttamente. (6)
Un campo in cui i tentativi di piegare i numeri alle proprie tesi sono particolarmente frequenti è rappresentato dai commenti alle competizioni elettorali, quando ognuno sostiene di aver vinto e perlomeno di avere ottenuto un risultato lusinghiero (7). Per farlo i trucchi sono innumerevoli, ci si può riferire al numero assoluto dei votanti e non alle percentuali, per cui si può dire che anche chi ha perso ha guadagnato voti, si può scegliere se confrontarsi con le elezioni politiche, amministrative o europee per fare apparire più vantaggioso il proprio risultato.
In linea di massima, se si indica a che cosa un numero o una statistica si riferisce, ci si può fare un’opinione in modo indipendente dalle tesi dell’articolo. Se numeri ed informazioni essenziali mancano, allo stesso modo, si capisce che l’articolo ha un’impostazione scorretta. Se invece numeri e statistiche sono semplicemente falsi, ovviamente, non si può evitare di essere tratti in inganno, ma è una cosa piuttosto rara perché, se scoperta, totalmente squalificante. E’ molto più conveniente omettere i dati che non confortano le nostre tesi.
I numeri che servono
In un testo ci dovrebbero essere i dati utili ad inquadrare il problema, i dettagli che servono, e non di più. Troppi dettagli possono rendere molto più difficile la comprensione.
È importante basarsi sui numeri quando è possibile. Nel poco che possiamo sapere del mondo che ci circonda, i numeri, in particolare quelli che si possono ricavare dalle statistiche, sono la migliore porta verso la conoscenza.
Un po' di matematica
I numeri possono aiutarci in molti aspetti della nostra vita. Se si conoscesse ed applicasse un minimo la matematica più elementare, si potrebbe evitare di farsi turlupinare dalle banche (8) e dai venditori, non si indulgerebbe al gioco d’azzardo (9) (la cui utilità media è sempre negativa), si dedicherebbero le proprie risorse alle cose effettivamente utili. In breve, si potrebbe vivere meglio.
Alberto Viotto
Se qualche lettore trovasse questo articolo interessante o ne volesse discutere, all'autore farebbe piacere ricevere delle e-mail all'indirizzo: alberto_viotto@hotmail.com
NOTE
1) http://it.wikipedia.org/wiki/Deviazione_standard
2) http://it.wikipedia.org/wiki/Lista_di_stati_per_PIL_(nominale)_pro_capite
3) http://it.wikipedia.org/wiki/Coefficiente_di_Gini
4) http://beassicuratore.it/2272/lisvap-ha-registrato-un-aumento-nella-raccolta-dei-premi-rc-auto-nel-primo-semestre-del-2010/
5) http://autonovita.blogspot.com/2010/02/assicurazioni-auto-aumenti-in-arrivo.html
6) http://banca-del-risparmio.blogspot.com/2010/01/aumento-polizza-rc-auto-nel-2010.html
7) http://www.giornalettismo.com/archives/58735/vinto-davvero-elezioni-regionali/
8) www.riflessioni.it/scienze/teoria-mercati-finanziari-1.htm
9) www.riflessioni.it/scienze/paradosso-san-pietroburgo.htm
Altri articoli di Alberto Viotto
Alberto Viotto offre gratuitamente due suoi Ebook:
Come ti fregano
Analisi dei meccanismi del marketing ed altri trucchi
"Da mattina a sera, sui giornali, sulle televisioni, sul web, siamo sommersi da messaggi pubblicitari che sembrano pensati per un pubblico di semideficienti. Naturalmente il circo del marketing ha un costo, che ricade sull’ambiente ma anche su di noi, costretti a pagare di più i prodotti che ci servono (circa 400€ in più in media su ogni auto nuova).
Di chi la colpa? Ahimè, è nostra, perché compriamo i prodotti pubblicizzati; se la pubblicità non facesse aumentare le vendite i produttori smetterebbero di tormentarci. Un rapido esame dei meccanismi del marketing ci può aiutare ad immunizzarci."
Achille e la tartaruga e altri paradossi
"Una nuova e più elegante soluzione al paradosso più famoso. Altri celebri enigmi (il sorite, il cretese mentitore, il gatto quantistico, la stanza cinese) affrontati da un punto di vista non convenzionale".
Libri pubblicati da Riflessioni.it
RIFLESSIONI SUL SENSO DELLA VITA 365 MOTIVI PER VIVERE |
|