La recente vicenda agostana degli algoritmi per il calcolo del voto finale scolastico in Gran Bretagna è stata molto istruttiva. E induce a qualche considerazione che va molto oltre il fatto di cronaca, sul nostro ancora molto fallace rapporto con l’analisi automatizzata di dati. Un problema da cui derivano conseguenze importanti per tutti noi.
L’algoritmo e l’esame scolastico nel Regno Unito: che è successo
Una sintesi per chi avesse perduto le notizie: in mancanza di un esame finale a causa dell’emergenza sanitaria, le autorità scolastiche della Gran Bretagna hanno deciso di far ricorso ad un algoritmo per calcolare il voto finale, in maniera diversa da quella che pareva troppo banale di prendere in considerazione le votazioni finali dell’anno.
Quando queste valutazioni sono state partorite, vi è stata una comprensibile rivolta: circa il 40% degli studenti si è ritrovata una qualifica inferiore a quella reale, ciò che spesso avrebbe loro precluso l’accesso all’Università.
Perché l’algoritmo era classista
Dopo vibranti proteste, il sistema è stato quindi praticamente ritirato a furor di popolo (anzi, a furor di studenti). L’aspetto ancora più inquietante della vicenda è che i voti abbassati mostravano quello che appariva un pregiudizio sociale: sostanzialmente, rispetto a coloro che avevano avute sempre votazioni alte venivano puniti coloro che erano partiti da votazioni più basse: il che appunto spesso avviene non solo in chi dopo mesi di bella vita finalmente si sveglia, ma anche in chi proviene da una situazione svantaggiata e poi, con impegno maggiore degli altri, recupera il terreno. Abbasso l’algoritmo classista, insomma.
Algoritmi razzisti, ecco le cause del problema e le soluzioni in campo
Successe anche in Italia
A leggere la storia si prova anzitutto un duplice sentimento di soddisfazione. Il primo è universale e consiste nel costatare che protestare vibratamente in piazza qualche effetto a volte lo ottiene, almeno nei nostri regimi più o meno democratici (forse oggi basterebbe anche protestare sui social, chissà).
Il secondo è tutto nostrano e consiste nel costatare che la vicenda è stata quasi la fotocopia di ciò che accadde in Italia nell’estate del 2013 (qualcuno lo ricorda ancora?). Non c’era nessuna emergenza sanitaria, ma ugualmente era in ballo la questione della valutazione finale scolastica e dell’ammissione all’Università, per la quale si pensò di far valere anche il voto di maturità. Terribile problema agli occhi dei politici di allora: a quanto pare nel sud d’Italia le commissioni sono più generose e i risultati finali sono mediamente più alti. Soluzione? Affidiamoci ad un algoritmo! I risultati furono disastrosi come oggi in Gran Bretagna. Ma gli italiani, si sa, sono più tenaci, e dopo il disastro il Ministero non demorse e decise di far elaborare un secondo algoritmo da una seconda squadra di grandi esperti. Solo dopo il secondo disastro finalmente desistette. Non bisogna certo godere della sventure altrui, ma una volta tanto dà una certa soddisfazione vedere che l’errore madornale oggi commesso dalla Gran Bretagna noi italiani lo avevamo già commesso quasi identico sette anni fa.
La causa del problema
Non è sempre ovvio però che dagli errori si impari, e allora conviene capire esattamente dove esso sia. Riduciamo il problema alla sua forma elementare nella forma italiana: «Marco e Luca (o Mark e Luke se preferiamo), che hanno professori diversi, hanno preso entrambi 7 alla prova di matematica: in un caso il voto è giusto, nell’altro il voto giusto sarebbe stato 6, ma il professore era generoso. Chi dei due meritava 6?». La soluzione giusta è evidentemente: «Alla domanda è impossibile rispondere: bisognerebbe quanto meno conoscere i professori, o meglio ancora vedere i due compiti e confrontarli».
Si tratta insomma di un classico problema irresolubile per insufficienza di dati, così come lo è distinguere dai soli numeri chi parte da voti bassi per colpa propria e chi invece per responsabilità altrui. Non credo che sarebbe male se nella pratica scolastica fosse più comune assegnare, nella varie materie, esercizi di questo tipo: essi aiuterebbero a far comprendere che, prim’ancora di cercare una soluzione, bisogna verificare se si hanno a disposizione i dati necessari.
Quando questi mancano, la risposta è semplicemente impossibile. Certo: nella vita quotidiana innumerevoli volte dobbiamo prendere piccole e grandi decisioni sulla base di dati frammentari: ma altro è esservi costretti (ed essere sempre pronti a correggersi), altro farlo senza necessità e cristallizzarlo in un algoritmo che si presenta come oggettivo e indiscutibile (e in effetti lo è, perché contro di esso non si può far ricorso!).
Ma non è un algoritmo
Ma un attimo: è sicuro che si tratta di «algoritmi»? Secondo tutte le definizioni comunemente accettate di algoritmo, questi (quello britannico di oggi e quello italico di sette anni fa) non lo erano. Un algoritmo è (più o meno) una sequenza finita di istruzioni non ambigue in grado di risolvere una classe di problemi.
Quelli elaborati in queste circostanze erano sì sequenze finite di istruzioni, ma non erano affatto in grado di risolvere il problema assegnato! Prendere una quantità di dati, shakerarli con qualche formula (seppur costituita da passi ben definiti) per tirare fuori un risultato non è un algoritmo. Se nel problema precedente si calcolasse lo hash SHA-1 dei nomi dei due studenti e a seconda di quello che precede in ordine numerico si decidesse chi merita 7 e chi merita 6, si sarebbe sì stabilita una procedura di calcolo (che descritta nei suoi minimi passi ispirerebbe grande riverenza), ma questa non sarebbe un algoritmo: il risultato sarebbe affidabile tanto quanto tirare a sorte.
Questi non sono in realtà problemi nuovi, e non nascono con il prestigio che la nozione di algoritmo ha ricevuto dall’odierna pervasività dell’informatica. Nella storia c’è un grande, illustre esempio di una pseudo-scienza che ha proceduto con questi shakeramenti: l’astrologia. Essa ha potuto godere di grande stima proprio perché il suo correttissimo e complesso impianto matematico faceva dimenticare il punto fondamentale (credo anche agli occhi di chi la studiava sinceramente): che essa non risolveva minimamente il problema assegnato, che era quello di comprendere e prevedere le questioni umane.
L’abilità matematica richiesta per l’astrologia era sì di buon uso per la scienza vera, che era l’astronomia, ma non aveva appunto il minimo rapporto con i problemi posti, i cui dati erano clamorosamente insufficienti per qualsiasi risposta: e da questo punto di vista l’astrologia non solo non ha fornito risposte giuste, ma ha ritardato risposte o anche solo azioni utili (è un caso che la scienza moderna sia nata laddove l’astrologia godeva di cattiva fama?). Anche se non prendevano in considerazione moti astrali, sia lo pseudo-algoritmo britannico sia quello italico erano in fondo calcoli astrologici, non algoritmi. E purtroppo l’astrologia con il suo metodo pseudo-scientifico continua ad esercitare la sua attrazione, che non sempre (ahimè) suscita sufficienti proteste come quelle dei ragazzi imbufaliti sudditi di Sua Maestà. Chi vive nel mondo dell’Università e della ricerca ha tutti i giorni a che fare con calcoli astrologici e astrologi di corte e con la rassegnazione che li circonda: questo sarebbe un altro tema.
Ma come morale della nostra storia abbiamo almeno un ulteriore ottimo motivo per studiare informatica: ricevere gli anticorpi giusti per non accettare mai più che qualsiasi sequenza di calcoli a casaccio, o anche pensata per certi scopi e applicata per finalità diverse (l’effetto è lo stesso), venga chiamata «algoritmo», quando in realtà è solo astrologia.