gestione illegale dei rifiuti

Come ti scovo la discarica abusiva con l’intelligenza artificiale: il progetto Savager

Grazie all’uso dell’intelligenza artificiale nel progetto Savager è possibile analizzare automaticamente il territorio di un’intera provincia lombarda in poche ore, un compito che se svolto manualmente richiede settimane di lavoro. Ecco come verranno individuate depositi incontrollati di rifiuti o discariche abusive

Pubblicato il 31 Mag 2021

Piero Fraternali

Politecnico di Milano - Dipartimento di Elettonica Informazione e Bioingengeria

Rocio Nahime Torres

Politecnico di Milano - Dipartimento di Elettonica Informazione e Bioingengeria

L’utilizzo delle tecnologie di Geospatial Intelligence e dell’Osservazione della Terra da satellite, aereo e drone, unite a tecnologie di intelligenza artificiale e visione computerizzata può contribuire al contrasto della gestione illegale dei rifiuti. Va in questa direzione il progetto Savager (Sorveglianza Avanzata Gestione Rifiuti), sviluppato da ARPA Lombardia e finanziato dalla Regione Lombardia. Vediamo come funziona.

Indice degli argomenti

L’impatto della gestione dei rifiuti su ambiente, società, economia

La gestione dei rifiuti è un problema critico da un punto di vista ambientale, sociale ed economico. Studi su scala globale prevedono che nel 2025 il costo della gestione dei rifiuti solidi toccherà 375,5 miliardi di dollari all’anno [1]. Dagli anni ’80 in poi si è registrato un aumento significativo dei costi di smaltimento dei rifiuti e di conseguenza una maggiore incidenza delle pratiche illegali gestite per lo più dalla criminalità organizzata. Secondo un rapporto del 2015 [2], il numero delle discariche illegali in Europa è 12.628 per un totale di 2.871.186 tonnellate di rifiuti. Il problema riguarda la stragrande maggioranza dei paesi dell’UE e l’Italia, insieme a Polonia e Germania, è uno dei paesi con la maggiore quantità di rifiuti illegali.

Europol segnala il traffico illegale di rifiuti come l’area di maggiore crescita dei gruppi di criminalità organizzata, con ricavi di miliardi di euro all’anno [3]. In Italia la diffusione delle discariche illegali è legata all’espansione di criminalità organizzata. Secondo l’ultimo rapporto di Legambiente sull’ecomafia [4], in Solo nel 2019 2,4 milioni di tonnellate gestite illegalmente sono state sequestrate in Italia. Per quanto riguarda la sola regione Lombardia, tra il 2017 e il 2019, 56 depositi illegali di rifiuti sono stati dati alle fiamme. Negli ultimi anni la Regione ha speso 25,9 milioni di euro per bonificare 16 discariche illegali [5].

Il progetto Savager e la geospatial intelligence

Il progetto Savager mira all’introduzione delle tecnologie della Geospatial Intelligence e dell’Osservazione della Terra da satellite, aereo e drone per contrastare la gestione illegale dei rifiuti in Lombardia attraverso una identificazione più efficace delle situazioni di potenziale non conformità alle normative ambientali.

Attraverso la Geospatial Intelligence in Savager si acquisiscono indizi di violazione delle normative ambientali negli impianti di trattamento rifiuti autorizzati e si individuano anche situazioni totalmente illegali quali quelle dei depositi incontrollati di rifiuti o delle discariche abusive. Savager utilizza una strategia di controlli a due livelli che supera la logica tradizionale che aveva come bersaglio essenzialmente gli operatori già noti.

Con il primo livello di sorveglianza si effettua una mappatura periodica “a tappeto” di aree vaste del territorio regionale per mezzo dell’Osservazione della Terra da satellite e aereo, della Geospatial Intelligence e dell’Intelligenza Artificiale. Il risultato del primo livello è costituito da elenchi di siti potenzialmente critici. Questi sono valutati dai Nuclei Ambiente delle Prefetture costituiti da rappresentanze di ARPA Lombardia, delle Forze dell’Ordine, delle Polizie Locali, delle Province e di altre istituzioni, per selezionare i siti da sottoporre a controllo. Durante i controlli, i droni forniscono la mappatura delle tipologie dei rifiuti e una valutazione dei quantitativi.

La metodologia del progetto Savager si basa su due livelli: 1) sorveglianza “a tappeto” su aree vaste del territorio regionale mediante la Geospatial Intelligence per la identificazione dei siti critici; 2) controlli mirati sui siti critici a rischio ambientale elevato. Nei controlli vengono frequentemente utilizzati i droni.

I fenomeni di gestione illegale dei rifiuti hanno delle dinamiche molto rapide, quindi, per riuscire ad individuarli tempestivamente è necessario rendere più efficiente il processo di Geospatial Intelligence intervenendo sui due principali fattori: lo stato obsoleto delle immagini disponibili sui geo-portali e i tempi lunghi che sono necessari agli esperti umani per fotointerpretare le immagini. Per superare il primo limite, ARPA Lombardia ha attivato l’acquisizione “on-demand” di immagini satellitari con la risoluzione di 30 cm che consente di ottenere immagini ad altissima risoluzione nell’arco di una settimana sulle zone di interesse. Per superare il secondo limite, ARPA Lombardia ha stipulato un accordo di collaborazione con il Dipartimento di Elettronica, Informazione e Bioingegneria (DEIB) del Politecnico di Milano per applicare le tecnologie di Intelligenza Artificiale all’identificazione automatica di siti critici nelle immagini satellitari ed aeree.

AI e geospatial intelligence per l’identificazione di discariche illegali

L’analisi automatica delle immagini è un settore dell’informatica che applica algoritmi di visione computerizzata alla risoluzione di molti problemi: dalla robotica industriale alla guida autonoma alla sorveglianza ambientale. In tempi recenti, i metodi tradizionali di analisi delle immagini, che richiedevano procedimenti ad hoc per l’estrazione delle caratteristiche utili su cui fondare l’analisi, sono stati sostituiti da approcci basati sull’apprendimento automatico (machine learning). In particolare, le tecniche basate sull’apprendimento profondo (Deep Learning) hanno dimostrato prestazioni impressionanti in molti problemi di analisi dei dati e specialmente nell’analisi delle immagini. In quest’ultimo settore, una svolta è rappresentata dall’avvento delle reti neurali convolutive (Convolutional Neural Network, CNN).

Una CNN è un’architettura di processamento dei dati che si basa sull’operazione di convoluzione per condensare l’informazione di input in modo da produrne una versione compatta che contiene solo l’informazione necessaria per il computo dell’output desiderato. In particolare, le CNN offrono molti vantaggi per l’analisi delle immagini: si possono usare su immagini di qualsiasi dimensione, permettono di applicare l’operatore di convoluzione a cascata in modo da estrarre informazione significativa a livelli di dettaglio via via più astratti e preservano le relazioni spaziali presenti all’interno dell’immagine di input anche nei gradi successivi di estrazione.

Le CNN sono usate principalmente per tre compiti:

la classificazione richiede di predire quali tipi di oggetti compaiono in un’immagine (ad esempio, persone, automobili, animali o oggetti specifici);
la localizzazione richiede di determinare la regione rettangolare dell’immagine all’interno della quale compare un determinato tipo di oggetto;
la segmentazione richiede di definire per ogni pixel se questo corrisponde al generico sfondo o fa parte della regione che contiene un particolare oggetto.

Una tipica CNN per la classificazione di immagini ha la struttura mostrata nella figura 2.

Figura 2: Architettura di una rete convolutiva per la classificazione del contenuto di immagini. [8]

L’immagine di input è assoggettata a N passi di convoluzione (livelli Conv1 … ConvN). Ciascun livello produce una mappa delle caratteristiche (Feature Map) che rappresenta l’informazione condensata. Questi livelli possono essere seguiti da un’operazione che permette di ridurre la dimensione della mappa (Pooling). L’ultima mappa è processata da un livello composto da neuroni completamente connessi (Fully Connected, FC) che agisce da classificatore. Infine, l’ultimo livello dell’architettura produce l’effettivo output tramite un operatore (Softmax) che assegna a ogni tipo di oggetto la probabilità di apparire all’interno dell’immagine data in input alla rete convolutiva.

L’operatore di convoluzione che estrae informazione a livelli crescenti di astrazione può essere visto come un filtro digitale. L’aspetto fondamentale delle CNN è che i filtri applicati nel processo di estrazione non sono fissati a priori ma i loro parametri sono “appresi” mediante una fase preliminare di “addestramento” della rete. Quindi una CNN, come tutte le architetture di machine learning supervisionato, deve essere addestrata per il compito di analisi a cui deve applicarsi. L’addestramento sfrutta dati di esempio per cui è nota la predizione (ad esempio, immagini aeree di discariche abusive conosciute) e definisce con un procedimento iterativo i parametri interni della rete in modo che questa non solo riproduca la predizione corretta sugli esempi usati per l’addestramento ma “impari” a classificare correttamente anche immagini mai viste prima.

L’evento che ha reso le CNN lo standard di fatto per l’analisi delle immagini è stata la creazione di CNN profonde, cioè dotate di un numero elevato di livelli interni. La disponibilità di risorse di calcolo sempre più potenti e di tecniche di addestramento sempre più raffinate ha permesso di realizzare reti con centinaia di livelli e diecine di milioni di parametri. Queste architetture hanno dimostrato prestazioni eccezionali in tutti i campi, superando perfino le prestazioni degli esseri umani nella classificazione del contenuto di immagini complesse.

I ricercatori del DEIB hanno applicato le CNN all’analisi delle immagini satellitari per automatizzare l’identificazione delle situazioni di potenziale non conformità alle normative ambientali sui rifiuti. La scelta della CNN è ricaduta sull’architettura ResNet50 [9], una CNN a 50 livelli che fornisce un ottimo compromesso tra accuratezza di classificazione e potenza di calcolo richiesta per l’addestramento. A ResNet50 è stato applicato un procedimento di trasferimento della conoscenza (Transfer Learning), che consiste nel sottoporre una rete addestrata alla classificazione di immagini generiche a un riaddestramento parziale con immagini aeree. In questo modo si accelera il processo di addestramento e bastano poche centinaia di immagini satellitari classificate dagli esperti di ARPA Lombardia per raggiungere una precisione elevata.

Oltre al trasferimento di conoscenza, ResNet50 è stata potenziata con componenti tipici delle reti di caratteristiche piramidali (Feature Pyramid Network, FPN [10]). Questa aggiunta mira a risolvere il problema della scala variabile a cui le potenziali discariche illegali possono comparire nelle immagini. La rete deve essere in grado di identificare sia pochi rifiuti sparsi sia intere discariche abusive o aree industriali adibite allo stoccaggio di rifiuti. Le FPN aggiungono alle CNN standard la capacità di effettuare la classificazione finale non solo in base alle caratteristiche estratte dal livello più profondo e quindi più astratto della rete ma in base a una combinazione intelligente delle mappe estratte a diversi livelli di profondità. In questo modo anche oggetti di dimensioni molto diverse non sfuggono al classificatore.

Il risultato delle ricerche del Politecnico ha condotto alla costruzione di una CNN in grado di identificare nelle immagini satellitari, sia in quelle ad alta risoluzione sia in quelle di bassa qualità disponibili pubblicamente sul Web, siti di potenziale interesse con una accuratezza del 92%. La figura 3 mostra due esempi di immagini classificate positivamente dalla rete realizzata.

Figura 3 Esempi di identificazione automatica di siti potenzialmente critici mediante l’architettura RestNet-50 + FPN. A sinistra le immagini originali. A destra le “Class Activation Maps”: rappresentano le aree sulle quali l’algoritmo focalizza la ricerca di indizi per la classificazione del sito come critico.

Conclusioni

Grazie all’uso dell’Intelligenza Artificiale nel progetto Savager è oggi possibile analizzare automaticamente il territorio di un’intera provincia lombarda in poche ore, un compito che se svolto manualmente richiede settimane di lavoro. Gli elenchi di località prodotti automaticamente sono ordinati in base alla probabilità che sia presente un sito non conforme alle normative ambientali in modo che gli operatori di ARPA Lombardia possano concentrarsi sui siti più “promettenti” per prima cosa.

L’attività di ricerca non si esaurisce ai risultati raggiunti fino ad ora. Il lavoro in corso si concentra sulla caratterizzazione del tipo di rifiuti presenti nell’immagine in modo da stimare anche la pericolosità del sito e prioritizzare meglio gli elenchi di località prodotti automaticamente. Inoltre, si prevede di applicare l’Intelligenza Artificiale anche al secondo livello di controllo, montando componenti di visione computerizzata a bordo dei droni che effettuano le missioni di ricognizione del sito per guidarne le operazioni e migliorare la raccolta delle evidenze di fenomeni illegali.

Bibliografia

[1] Dan Hoornweg and Perinaz Bhada-Tata. “What a waste: a global review of solid waste management”. In: Urban development series knowledge papers 15 (Jan. 2012), pp. 87–88. url: https://openknowledge. worldbank.org/handle/10986/17388.

[2] Emma Watkins. “A case study on illegal localised pollution incidents in the EU.
A study compiled as part of the EFFACE project”. London: IEEP (2015) https://efface.eu/sites/default/files/EFFACE_Illegal%20localised%20pollution%20incidents%20in%20the%20EU.pdf

[3] Europol. Trash worth millions of euros. 2019.
https://www. europol.europa.eu/newsroom/news/trash-worth-millions-of- euros

[4] Osservatorio nazionale ambiente e legalità. Ecomafia 2020. Le storie e i numeri della criminalità ambientale in Italia. Saggistica ambientale. Edizioni Ambiente, 2020. isbn: 9788866272878. Una sintesi all’indirizzo: https://www.legambiente.it/comunicati-stampa/i-dati-del-rapporto-ecomafia-2020-nel-2019-in-aumento-i-reati-contro-lambiente/

[5] Affinito, Domenico. “Lombardia, i furbetti dei rifiuti «pizzicati» dal cielo con il satellite spia”. In: Corriere della Sera – DataRoom (Mar. 2021). url: https://www.corriere.it/dataroom-milena-gabanelli/ lombardia-furbetti-rifiuti-pizzicati-cielo-il-satellite- spia/6f6827b8-8698-11eb-90f0-a248214a3d06-va.shtml

[6] Alice Limoli et al. “Illegal landfill in Italy (EU)—a multidisciplinary approach”. In: Environmental Forensics 20 (Feb. 2019), pp. 1–13. doi: 10.1080/15275922.2019.1566291.

[7] ARPA. IA nel progetto Savager, collaborazione tra ARPA Lombardia e Politecnico Di Milano. 2020. url: https://www.arpalombardia. it/Pages/IA-nel-progetto-Savager,-collaborazione-tra-Arpa- Lombardia-e-Politecnico-di-Milano.aspx (visited on 04/01/2021).

[8] HIDAKA, Akinori; KURITA, Takio. Consecutive dimensionality reduction by canonical correlation analysis for visualization of convolutional neural networks. In: Proceedings of the ISCIE international symposium on stochastic systems theory and its applications. The ISCIE Symposium on Stochastic Systems Theory and Its Applications, 2017. p. 160-167.

[9] HE, Kaiming, et al. “Deep residual learning for image recognition”. In: Proceedings of the IEEE conference on computer vision and pattern recognition. 2016. p. 770-778.

[10] LIN, Tsung-Yi, et al. “Feature pyramid networks for object detection”. In: Proceedings of the IEEE conference on computer vision and pattern recognition. 2017. p. 2117-2125.