Esistono davvero le “scans-squadre”?

Parte seconda

Perché vi dico ciò? Perché ognuno di Voi ha tutti gli strumenti (anche se forse non lo sa) per capire questo articolo, pur se dovrò parlare di varianza e calcolo delle probabilità.

Volete un esempio?

Se vi dicessi di introdurre un numero dopo i seguenti numeri 1, 2, 3, 4, 5 cosa introdurresti?

Sono sicuro che tutti direste 6.

Complichiamo un attimo?

1, 4, 7, 10, 13 cosa introdurresti?

Qui magari ci dovrete pensare un attimo, ma vi accorgerete, più o meno velocemente, che ogni numero è il precedente +3, quindi si dovrà introdurre 13 + 3 = 16.

Ora l’ultimo passo, poi iniziamo ad introdurre tabelle e grafici.

0, 1, 1, 2, 3, 5, 8, 13, 21 … cosa introdurreste?

Questa è la serie di numeri più famosa al mondo: la serie di Fibonacci. Si scrive così:

Significa che il primo numero della serie è 0, il secondo è 1, i successivi sono dati dalla somma dei due precedenti, quindi il numero da introdurre è 13 + 21 = 34

 

Questa era più difficile, ma l’ho scritta per darvi un input: non importa che ci arriviate da soli, se vi viene data la chiave di lettura, chiunque di Voi è in grado di capire anche formule all’apparenza complesse.

Ecco la tabella riassuntiva dei dati di 7 campionati. Vi chiedo un favore: analizzatela per 1 minuto. Un solo minuto, ma analizzatela. Non limitatevi a guardarla: analizzatela, cercando di cogliere qualche dato. Poi proseguite pure. E’ “un gioco” con voi stessi. Dopo vi farò una domanda, quindi non barate (sono certo che non lo farete).

Legenda:

P.avv. = Punti avversaria (sono i punti che le avversarie, il cui nome è a sinistra nella riga, hanno fatto contro la squadra in alto nella colonna)

Media Avv. = Punti medi che l’avversaria, il cui nome è a sinistra della riga, ha fatto contro le 6 squadre prese in esame (JRNIML), nel caso l’avversaria sia una della squadre prese in esame (scontri diretti), la media ne terrà debitamente conto (banalmente: dividendo la somma dei punti fatti per 5 anziché per 6).

Vp_Avv. = Varianza punti avversaria (ne parleremo).

Media_fatti = media dei punti fatti dalle squadre prese in esame (JRNIML) contro le avversarie.

Vp_fatti = Varianza punti fatti (vedi sopra… ne parleremo).

 

Ecco la tabella generale, le squadre sono per ordine alfabetico: guardare per un minuto, grazie.

Giusto per capire la tabella, andate alla riga dell’Inter che vi ho evidenziato (tanto è quella che siete curiosi di vedere).

Contro la Juve, in 7 campionati ha realizzato 10 punti (sarebbero stati 13, a mio avviso, non fosse stato per gli errori di Orsato), la Juve, ne ha realizzati 28 contro di noi (25 sul campo). Abbiamo fatto 14 punti contro la Roma, 11 contro il Napoli, 24 contro il Milan (il doppio esatto dei punti che il Milan ha fatto contro di noi) e ci siamo divisi la posta con la Lazio: 20 punti a testa. Notate le varianza dell’Inter? E’ piuttosto alta, non altissima, ma abbastanza. Mettete da parte questa informazione.

Da questa mole di dati (ci sono riportate TUTTE le squadre che hanno disputato almeno un campionato di Serie A degli ultimi 7 campionati), troveremo tutto ciò che ci occorre, basta saperli analizzare, metterli in ordine e raggruppare correttamente e tutto ci verrà svelato (statisticamente parlando).

 

Notiamo, per completezza dei risultati e per onestà didattica, che i dati non sono omogenei, perché non tutte le squadre hanno disputato (ovvio) lo stesso numero di partite in Serie A nei campionati presi in esame. Le squadre sempre presenti sono, oltre alle sei in esame (JRNIML), l’Atalanta, il Chievo, la Fiorentina, il Genoa e l’Udinese.

Quindi: la varianza e la media di queste squadre è ben più significativa che non la varianza e la media del Livorno o del Novara che hanno disputato un solo campionato. E’ naturale, ma lo devo dire.

Spiego anche perché ho analizzato i risultati di “tutte le altre” contro le 6 JRNIML: sono le sei squadre più forti degli ultimi 7 anni, quelle che hanno realizzato più punti e che sono spesso arrivate nelle prime 6. Più di tutte le altre.

Il principio guida è il seguente: la squadra X, chiunque essa sia, contro avversarie dello stesso livello farà, tendenzialmente, gli stessi risultati soprattutto se si guarda un lungo periodo (e 7 anni = 14 partite sono un lungo periodo). Risultati “a sorpresa”, “la casualità”, i “colpi di fortuna / sfortuna” ecc. nel lungo periodo, tendono a distribuirsi equamente. Le famose “bestie nere”, costituiranno anomalie che possono essere analizzate e studiate.

 

Vediamo i punti realizzati da JRNIML in 7 campionati:

Juventus 637 punti, Roma 517, Napoli 539, Inter 428, Milan 445, Lazio 444.

Per questo motivo, ho spaccato la tabella in due, per rendere omogenei il più possibile i valori delle squadre.

In una tabella Juve, Roma e Napoli, nell’altra Inter Milan e Lazio, squadre troppo inferiori, MEDIAMENTE, in questi 7 anni, alle altre tre. Ma prima di passare alle tabelle successive, diamo un ultimo sguardo alla tabella precedente; avete notato che la varianza del Napoli, dell’Atalanta e del Genoa sono altissime in entrambe le colonne? Questa era la domanda che vi avrei voluto fare. Ognuno di voi sa se l’ha notato oppure no.

Infine la varianza, fornisco la definizione della Treccani del concetto di varianza in statistica: In statistica, per un campione di valori di una variabile aleatoria, si dice varianza la media aritmetica dei quadrati degli scarti dei valori dalla loro media aritmetica; la sua radice quadrata, presa con segno positivo, è lo scarto quadratico medio (detto anche deviazione standard). Analisi della v., tecnica statistica per analizzare osservazioni campionarie di fenomeni dipendenti da uno o più fattori, al fine di decidere quali fattori sono rilevanti e di stimarne gli effetti.

 

Dovrei introdurre, per tacitare i puristi che altrimenti avrebbero da obiettare, anche il concetto di variabile aleatoria (nel nostro caso, banalmente, è il risultato della partita o meglio i punti che ogni squadra fa in ogni partita) di variabili dipendenti ed indipendenti e dirvi che la formula del calcolo della varianza, prevede anche l’introduzione della probabilità che tale valore si verifichi.

Ma non temete, la formula sembra complicata, ma non lo è, inoltre, nel nostro caso, la sua applicazione è semplicissima dovendomi limitare a dividere i “quadrati degli scarti medi” per il numero dei casi presi in esame (6 se ci sono JRNIML, 3 se prendo JRN o IML). Infine: non fatevi suggestionare dalla frase “quadrato dello scarto medio” è semplicemente la differenza, elevata al quadrato, fra il singolo valore e la media dei valori presi in considerazione.

 

 

Indice

Loading Disqus Comments ...