Esistono davvero le “scans-squadre”?

Terza parte

In statistica, la varianza è un indice di variabilità. Data una distribuzione di un carattere quantitativo X su una popolazione di n elementi, la varianza è la media aritmetica del quadrato delle distanze dei valori dalla loro media. Nel nostro caso, n=6 se prendo in esame JRNIML e n=3 se prendo JRN o IML, mentre X è il numero di punti che la squadra avversari fa o il numero di punti che JRNIML fanno contro l’avversaria (calcolo due varianze).

Ecco la formula, per chi avesse curiosità:

Chi la conosce, nessun problema, chi non la conosce e vuole approfondire un minimo, cerca “varianza” su google e si fa una idea. Ma se non la conoscete e non avete voglia di leggervela, nessun problema, seguitemi che vi sarà chiarissimo il concetto.

 

La formula, piuttosto semplice, per calcolare la varianza, che ho utilizzato sul foglio excel è:

(POTENZA(B3-N3;2)+POTENZA(D3-N3;2)+POTENZA(F3-N3;2)+POTENZA(H3-N3;2)+POTENZA(J3-N3;2)+POTENZA(L3-N3;2))/6

Dove B3, D3, F3, H3, J3 ed L3 sono i valori xi, N3 è la media aritmetica e 6 è “n”

Dividiamo adesso il grafico in due, secondo il raggruppamento delle squadre ed ordiniamolo dalla varianza più alta alla più bassa, lasciano in fondo gli scontri diretti (prendo la Vp_fatti): avrete delle sorprese!

Primo gruppo JRN

Notato nulla? Innanzitutto, vedete bene che la varianza di Inter, Napoli, Genoa e moltissime altre si è notevolmente abbassata. Straordinario vero? Il Napoli è passato da una varianza di 50,16  e 61,44 ad una varianza di 6,25 e 4 !!! Il Genoa da 61,89 e 60,47 addirittura a 1,56 e 2,89.

Perché? Semplice: perché adesso le squadre sono davvero omogenee (Juve Roma e Napoli) ed i risultati che una squadra “X” fa contro di esse sono, mediamente, gli stessi, soprattutto nel lungo termine. Contro il Genoa, la Juve ha fatto 30 punti, la Roma 34 ed il Napoli 33 (sono molto omogenei fra loro). Notate che la varianza della Juve è ZERO: ha fatto gli stessi punti contro il Napoli e la Roma, in 7 anni: 27 punti. E la Roma ed il Napoli hanno ottenuto gli stessi puti contro la Juve (non era scontato… vedi mio esempio all’inizio): 12.

 

Vi faccio notare che la Juve ha fatto, contro di noi, poveri derelitti, un solo punto in più: 28. E sarebbero stati 25, quindi 2 in meno rispetto al duo delle meraviglie Roma e Napoli che sono molto superiori all’Inter (a detta di tutti e come evidenziano i punti fatti). Vi sto dicendo che l’Inter derelitta di questi ultimi 7 campionati, ha realizzato contro la Juve 10 punti, solo Roma e Napoli hanno fatto meglio: 12. E se non fosse stato per gli errori fatti in Inter Juve di quest’anno (l’ho già detto?), saremmo la squadra che contro la Juve ha realizzato più punti di tutte. Chi l’avrebbe mai detto eh?

Come dite? La varianza dell’Atalanta era già alta, ma è aumentata a dismisura? Opppssss! Bravi! Ci arriviamo, ma ci sono altre anomalie, poco spiegabili.

Adesso dovrete sudare un minimo. Vi debbo introdurre l’applicazione della varianza, quindi dopo Fibonacci… vi parlerò dei polli.

A detta di molti, la statistica è “quella scienza per cui se uno mangia due polli ed un altro ne mangia zero, hanno mangiato un pollo a testa”. E’ un modo di dire che contiene un fondo di verità, ma è ampiamente ingeneroso, nei confronti di una Scienza che viene impiegata in moltissimi campi; in medicina, nella produzione industriale, nei processi di controllo qualità, in ambito militare, in ambito politico (quando si fanno “indagini sul voto”, si usa la statistica, negli exit pool si fa la stessa cosa) ecc.

 

Ma prendiamo proprio il caso dei polli.

Va da sé che nessun statistico, si limiterebbe a fare un esame fra due sole persone, prendendo due soli polli: il campione non avrebbe alcuna validità. Ma andando agli estremi, nel caso mangiassero un pollo a testa, la media sarebbe 1 e la varianza ZERO, mentre se una persona mangia due polli e l’altra nessun pollo, la varianza sarebbe 1. Chi facesse quella statistica, seppure priva di valore, rileverebbe facilmente una anomalia (elevata, non vi sto a spiegare perché, troppo lungo e noioso).

Continuiamo adesso il caso dei polli, ma stavolta distribuiamo 3 polli a tre persone: Tizio, Caio e Sempronio.

La media dei polli a testa è banalmente 1. Se tutti e tre ricevessero un pollo, la varianza sarebbe zero. Se una persona (es: Tizio) ricevesse 3 polli e Caio e Sempronio nessun pollo, la media sarebbe sempre di un pollo a testa, ma la varianza sarebbe ((3-1)2 + (0-1)2 + (0-1)2)/3 = (22 + (-1)2 + (-1)2)/3 = (4 + 1 +1)/3 = 6/3 = 2

 La varianza sarebbe di nuovo elevata.

 

Vi calcolo un ultima varianza, così vi sarà chiaro il significato.

Supponiamo che Tizio prenda 2 polli, Caio 1 e Sempronio zero. La media è sempre 1. La varianza è:

((2-1)2 + (1-1)2 + (0-1)2)/3 = (12 + 02 + (-1)2)/3 = (1 + 0 + 1)/3 = 2/3 = 0,6 (periodico…)

Visto? La varianza è diminuita. Perché? Semplice, i polli sono distribuiti più equamente. Se Tizio prendesse 1 pollo e mezzo, Caio 1 pollo e Sempronio mezzo pollo, la media sarebbe sempre di un pollo a testa e la varianza ancora più bassa.

Quindi, in pratica, la varianza, mi dice quanto i dati presi in considerazioni siano omogeni fra di loro. E se prendo dati che dovrebbero essere omogenei (come i risultati della stessa squadra “X” contro squadre di pari livello), mi aspetto varianze basse, per cui una varianza alta, o particolarmente alta, mi fa andare a vedere cosa sia successo, è un campanello di allarme. E questo “campanello di allarme” è tanto più grosso, quanto più è alta la varianza.

Tutto chiaro?

 

Se la risposta è sì, siete pronti per fare un esercizio. Vorrei che, istintivamente (ricordate l’esempio dei numeri?), mi indicaste quale colonna inserireste nel seguente grafico, come valore nella colonna X ?

Istintivamente, nella casella X, che valore inserireste? 40? 45? Cosa vi aspettereste?

Ecco cosa c’è. (ho dovuto allargare la scala… non ci stava !!!)

Dite la verità, siate sinceri. Siete stupefatti?

Quella colonna è l’Atalanta.

In non sono stupefatto: sono spaventato.

 

Indice

Loading Disqus Comments ...