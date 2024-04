Parlare di robotica oggi vuol dire fare riferimento a una tecnologia di grande diffusione in industria (e non solo).

I robot sono utilizzati in una varietà apparentemente illimitata di applicazioni, che spaziano da quelle più tradizionali (movimentazione pezzi, asservimento macchine, saldatura, assemblaggio, verniciatura, pallettizzazione) ad applicazioni nuove, in particolare nel settore biomedicale (preparazione farmaci, operazioni in ambienti sterili, ecc.).

La robotica oggi: definizioni e applicazioni

Come è noto, è la combinazione di autonomia (il robot è in grado di operare da solo, una volta programmato) e versatilità (il robot può eseguire innumerevoli compiti, grazie alla sua possibilità di articolare movimenti nello spazio) che fa del robot lo strumento di eccellenza per l’automazione flessibile. E i dati di vendita, diffusi dall’IFR (International Federation of Robotics [1]), non fanno che confermare il buono stato di salute della robotica, con trend di crescita inarrestabili per la robotica industriale, mentre analoghe se non maggiori prospettive di espansione si registrano per i robot di servizio per uso professionale.

Detto questo, la robotica evolve e si tiene al passo con le nuove tecnologie: l’apertura delle macchine a internet attraverso i protocolli della Internet of Things ha consentito importanti sviluppi che vanno dall’asset management, allo sviluppo di digital twin del robot o dell’intero processo di produzione, alla manutenzione predittiva. Il robot può anche scambiare informazioni con altri robot dislocati ovunque nel mondo per condivisione di programmi e miglioramento dell’esecuzione di operazioni.

Il trend di sviluppo più significativo negli ultimi anni è però certamente quello della robotica collaborativa [2]: si tratta come è noto dei robot destinati a operare in sicurezza fianco a fianco dell’uomo, grazie alla loro sofisticata meccanica ed elettronica di controllo. I robot collaborativi stanno cambiando lo scenario con cui la robotica entra nelle aziende produttive. Più facili da installare, privi di barriere fisiche di protezione e anche facili da programmare, i cobot costituiscono una soluzione di automazione potenzialmente ideale per la piccola e media impresa. Tant’è che le applicazioni di robotica collaborativa, sempre secondo il report dell’IFR, hanno raggiunto nel 2022 (ultimo dato disponibile) il 10% delle installazioni annuali a livello mondiale.

Il livello di interazione del robot industriale

Fig. 1 – Il robot collaborativo (fonte Universal Robots)

Ma qual è oggi il livello di interazione del robot industriale, o del cobot, con l’ambiente in cui opera? Il robot può “vedere” gli oggetti grazie a telecamere montate sul robot stesso o fisse nell’ambiente. Può “toccare” l’ambiente e percepire, se dotato degli appositi sensori, le forze che scambia con l’ambiente stesso. In particolare può riconoscere una collisione, con l’ambiente o con l’uomo, e arrestare conseguentemente il moto. Il robot può anche “sentire”, in alcuni casi, l’essere umano e tradurre comandi impartiti in linguaggio naturale. Il robot è anche capace di manipolare in modo complesso gli oggetti con cui interagisce, sia con le pinze di cui sono dotati i robot tradizionali, sia con le mani robotiche di ultima generazione.

Vede, tocca, sente, manipola oggetti: il robot, e non stiamo parlando dei robot umanoidi di nuova generazione, si sta sempre più avvicinando a comportamenti umani. Resta però un ultimo scoglio: l’emulazione dell’intelligenza umana. Vedremo in queste pagine a che punto siamo su questo fronte e che prospettive ci può riservare il futuro.

L’intelligenza dei robot: progressi e limiti

I progressi dell’intelligenza artificiale sono sotto gli occhi di tutti. Senza arrivare all’ultima frontiera dell’AI (Artificial Intelligence) generativa, a cui accenneremo più avanti, le potenzialità dell’intelligenza artificiale nella soluzione di problemi complessi sono oggi enormi. Agenti dotati di AI sono in grado di riconoscere con elevata affidabilità il linguaggio naturale, sia scritto sia parlato, dandogli significato e quindi ingaggiando dialoghi con l’uomo. Il riconoscimento di immagini, la classificazione di oggetti, la soluzione di problemi complessi, sono risultati oggi ampiamente raggiunti dall’intelligenza artificiale. E tuttavia stentiamo a riconoscere un corrispondente progresso nelle capacità dei robot di interagire in modo “intelligente” con l’ambiente. Il paradosso di Moravec [3] descrive la situazione: oggi è possibile attribuire all’AI capacità umane, o sovrumane, tanto che l’AI può sconfiggere il miglior giocatore di scacchi al mondo e tuttavia il robot si trova in difficoltà a eseguire un compito di manipolazione che richieda una destrezza alla portata di un bambino di tre anni.

Fig. 2 – Operazioni alla portata di un bambino sono complesse per il robot

Il punto è che quando l’AI deve fare i conti con la realtà fisica, il gap che la tecnologia mostra rispetto alle capacità umane è ancora significativo. L’interazione non pre-programmata con l’ambiente destrutturato richiede capacità di dare significato agli oggetti che il robot manipola e alle azioni che il robot compie, cognizione dei rapporti di causa ed effetto tra le azioni compiute e il risultato che esse hanno con l’ambiente, capacità di percezione avanzate, oltre che di manipolazione sempre più spinte. Soprattutto è richiesto un processo di incorporazione o “embodiment” dell’intelligenza artificiale, che consiste nel dare un correlato fisico all’agente autonomo. Per noi umani, operazioni come prendere dalla nostra credenza un pacco di pasta, riconoscendolo visivamente, spostando gli altri oggetti (barattoli, lattine, ecc.) che si frappongono, e facendo attenzione a non colpire altri oggetti, sono alla portata di un bambino, per il robot sono al limite, e in molti casi oltre, le capacità dell’attuale progresso scientifico e tecnologico.

Per non parlare poi di operazioni domestiche quotidiane, per noi del tutto naturali, per il robot molto complesse. Ha fatto molto scalpore recentemente il video del robot Optimus di Tesla [4] che piegava in maniera estremamente naturale una maglietta, salvo poi appurare che in realtà il robot era teleguidato da un operatore nei suoi movimenti. Questo non vuol dire che Optimus non arriverà a eseguire in autonomia il task, ma che la strada da percorrere è ancora significativa.

Fig. 3 – Il robot Optimus di Tesla piega una maglietta

Anche per i robot che interagiscono con l’uomo le cose non vanno meglio. Far comprendere al robot il significato delle azioni compiute dall’uomo per prevederne le azioni future (se l’uomo afferra un cacciavite, posso presumere quale sarà la sua futura azione) e quindi agire di conseguenza è una capacità che nei laboratori di robotica si sta affinando, ma non è ancora pronta per essere trasferita all’industria.

Questo gap tra le potenzialità virtualmente illimitate dell’intelligenza artificiale e la capacità del robot di interagire naturalmente con l’ambiente sta costituendo un freno alla diffusione ancora più capillare dei robot e all’impatto economico che i robot potrebbero avere. La domanda che ci possiamo porre oggi è quindi se i recenti sviluppi dell’intelligenza artificiale possano aiutare a colmare questo gap.

Una nuova era per la robotica intelligente? Segnali di una svolta Ci sono elementi di svolta che fanno pensare a un momento di svolta per la robotica con l’IA (generativa e non). Al posto di metodi tradizionali di addestramento, minuziosi e passo passo, i robot hanno iniziato a utilizzare l’apprendimento profondo e le reti neurali per creare sistemi che imparano dall’ambiente circostante e regolano il loro comportamento di conseguenza. Al punto da riuscire a funzionare anche in ambienti sconosciuti. Rt-2 La scorsa estate, Google ha lanciato un modello di visione-linguaggio-azione chiamato RT-2. Questo modello ricava la sua comprensione generale del mondo dai testi e dalle immagini online su cui è stato addestrato, oltre che dalle sue stesse interazioni nel mondo fisico. Traduce questi dati in azioni robotiche. Imitazione I ricercatori del Toyota Research Institute, della Columbia University e del MIT sono riusciti a insegnare rapidamente ai robot a svolgere molti nuovi compiti con l’aiuto di una tecnica di apprendimento dell’IA chiamata apprendimento per imitazione, oltre che con l’IA generativa. Ritengono di aver trovato un modo per estendere la tecnologia che spinge l’IA generativa dal regno del testo, delle immagini e dei video al dominio dei movimenti dei robot. Si inizia con un umano che controlla manualmente il robot per dimostrare comportamenti come sbattere le uova o raccogliere i piatti. I ricercatori hanno insegnato così ai robot più di 200 abilità, come sbucciare le verdure e versare i liquidi e ora mirano a insegnare mille abilità entro la fine dell’anno. In una dimostrazione analoga, all’inizio di quest’anno un team di Stanford è riuscito a utilizzare un robot di serie relativamente economico, del costo di 32.000 dollari, per svolgere compiti di manipolazione complessi come cucinare gamberi e pulire le macchie. Il robot ha imparato rapidamente queste nuove abilità grazie all’intelligenza artificiale. Chiamato Mobile ALOHA (acronimo di “sistema di teleoperazione hardware open-source a basso costo”), il robot ha imparato a cucinare i gamberi con l’aiuto di sole 20 dimostrazioni umane e di dati provenienti da altri compiti, come strappare un tovagliolo di carta o un pezzo di nastro adesivo. I ricercatori di Stanford hanno scoperto che l’intelligenza artificiale può aiutare i robot ad acquisire competenze trasferibili: l’addestramento su un compito può migliorare le prestazioni per altri. Sim to real Un’altra tecnica è la sim-to-real reinforcement learning. Gli algoritmi del robot si esercitano, con tentativi ed errori, in una realtà simulata, miliardi di volte, prima di passare a quella fisica. Così funziona il robot umanoide Digit. Ne parla un paper pubblicato qualche giorno fa su Science Robotics e frutto di una collaborazione tra università dell’Oregon e della California, Berkeley. Digit ora sa camminare e portare oggetti – a mo’ di cameriere – anche in ambienti variabili, mai conosciuti prima. IA per interagire Anche molti altri hanno sfruttato l’IA generativa, ma come strumento di interazione con il robot. Covariant, una startup di robotica nata dall’unità di ricerca sulla robotica di OpenAI, ora chiusa, ha costruito un modello multimodale chiamato RFM-1. Può accettare richieste sotto forma di testo, immagini, video, istruzioni del robot o misurazioni. L’intelligenza artificiale generativa consente al robot di comprendere le istruzioni e di generare immagini o video relativi a tali compiti. Contribuisce il fatto che arrivano nuove fonti di dati per la robotica intelligence.

I robot si addestrano con più difficoltà rispetto a chatgpt e simili che utilizzano i dati di internet; hanno bisogno di dati raccolti specificamente per i robot. Di dimostrazioni fisiche di come si aprono lavatrici e frigoriferi, si raccolgono piatti o si piega il bucato. Al momento questi dati sono molto scarsi e richiedono molto tempo per essere raccolti dagli esseri umani. RT-X Di qui una nuova iniziativa avviata da Google DeepMind, chiamata Open X-Embodiment Collaboration. L’anno scorso l’azienda ha collaborato con 34 laboratori di ricerca e circa 150 ricercatori per raccogliere dati da 22 diversi robot, tra cui Stretch di Hello Robot. Il set di dati risultante, pubblicato nell’ottobre 2023, consiste in robot che dimostrano 527 abilità, come raccogliere, spingere e muoversi. I primi segnali indicano che un maggior numero di dati sta portando a robot più intelligenti. I ricercatori hanno costruito due versioni di un modello per i robot, chiamato RT-X, che poteva essere eseguito localmente sui computer dei singoli laboratori o consultato via web. Il modello più grande, accessibile via web, è stato preaddestrato con i dati di Internet per sviluppare un “senso comune visivo”, o una comprensione di base del mondo, a partire dai modelli di linguaggio e di immagini. Quando i ricercatori hanno utilizzato il modello RT-X su molti robot diversi, hanno scoperto che i robot erano in grado di apprendere le abilità con il 50% di successo in più rispetto ai sistemi sviluppati da ogni singolo laboratorio. Costi Infine si abbassano i costi dell’hardware. Il robot Stretch, sviluppato dalla startup Hello Robot, è stato lanciato durante la pandemia con un prezzo di circa 18.000 dollari – un decimo rispetto alla media dei robot di questo tipo – e un peso di 30 chili. Ha una piccola base mobile, un bastone con una telecamera che penzola, un braccio regolabile dotato di una pinza con ventose alle estremità e può essere controllato con un controller per console. Nel frattempo, un team di Stanford ha costruito un sistema chiamato Mobile ALOHA (un acronimo libero per “un sistema di teleoperazione hardware open-source a basso costo”), che ha imparato a cucinare i gamberi con l’aiuto di sole 20 dimostrazioni umane e dati provenienti da altre attività. I ricercatori hanno utilizzato componenti di serie per mettere insieme robot dal prezzo più ragionevole, nell’ordine delle decine e non delle centinaia di migliaia di euro. Redazione

AI generativa in industria: oltre la produzione di testi

Da qualche tempo i media parlano diffusamente della “AI generativa”, per lo più spinti dal grande successo popolare di software come ChatGPT [5]. L’AI generativa è un nuovo modello di intelligenza artificiale in grado di produrre nuovi contenuti, sulla base dell’addestramento eseguito su grandi quantità di dati. Si tratta di un salto di qualità rilevante nell’intelligenza artificiale, che non è più in grado solamente (si fa per dire) di eseguire classificazioni di immagini o predizione di andamenti di variabili, o di interagire con input dato in linguaggio naturale selezionando la risposta più appropriata contestualizzando e interpretando la richiesta, ma anche di generare ex-novo dei contenuti. Stiamo parlando di produzione di testi, immagini, audio o video, preparazione di report, concezione di nuovi prodotti, ideazione di campagne di marketing e quant’altro.

Gli strumenti tecnici su cui si basano i modelli di AI generativa si riconducono generalmente al deep learning, ovvero a reti neurali che imitano il funzionamento del nostro cervello, apprendendo modelli complessi da grandi, o gigantesche, quantità di dati. Le conseguenze di questo processo sono potenzialmente enormi, e stanno già modificando le abitudini lavorative di molti di noi. Rivedere un testo chiedendo al software di AI generativa un aiuto, o anche produrre un testo ex-novo sulla base di alcuni input forniti in linguaggio naturale, sta diventando pratica quotidiana.

D’altra parte anche l’industria e i servizi non si stanno lasciando sfuggire le opportunità di utilizzo dell’AI generativa, peraltro ancora ai suoi albori. Le applicazioni sono potenzialmente sterminate: si va dalla produzione di report, all’elaborazione di scenari di utilizzo di prodotti, al supporto decisionale, alla preparazione di campagne pubblicitarie, all’invenzione di nuovi farmaci, al supporto al medico nella diagnosi fino ad arrivare alla guida autonoma dei veicoli. Le prospettive di crescita del settore dell’intelligenza artificiale sono vertiginose e gli analisti concordano nel predire tassi di crescita (CAGR) intorno al 40% nei prossimi anni [6].

Detto questo, non bisogna neanche cadere nell’ingenuità di pensare che l’AI generativa sarà la panacea di tutti i mali della nostra industria. Come già sottolineato, i modelli di AI generativa richiedono enormi quantità di dati, che possono essere a disposizione dei big player (Google, Tesla, OpenAI) ma non certo della piccola o media impresa. Un tema rilevante nel futuro sarà infatti anche quello di rendere fruibili questi nuovi strumenti alle PMI (che come è noto costituiscono l’ossatura del nostro sistema imprenditoriale).

È uno scenario comunque esplosivo quello dell’AI generativa, cui si accompagnano problemi di natura etica, da un lato, e preoccupazioni sui livelli occupazionali, dall’altro. Entrambe le questioni devono necessariamente essere all’attenzione del decisore politico, il cui non semplice compito sta nel trovare un compromesso tra l’esigenza di un uso etico e responsabile di questi strumenti e la necessità di non mettere freni allo sviluppo tecnologico, in particolare in Europa dove il rischio di perdere terreno rispetto all’America e all’Asia è significativo. Il supporto all’occupazione in questi scenari futuri, in cui l’ingombrante agente intelligente prenderà inevitabilmente il posto di molti lavoratori, è un altrettanto complesso, per quanto ineludibile, compito della politica.

Un robot super intelligente? Il caso di Figure 01

È quindi possibile applicare le ultime tecnologie dell’intelligenza artificiale alla robotica? Certamente sì, anzi, è già stato fatto. Ne è dimostrazione il video di OpenAI pubblicato a inizio marzo 2024 che mostra le avanzate capacità di interazione vocale del robot Figure 01 [7].

Fig. 4 – Figure 01, il robot di OpenAI

Di notevole interesse la fase nella quale viene chiesto al robot “Can I have something to eat?” (“Posso avere qualcosa da mangiare?”). Il robot non esita un momento e afferra una mela collocata proprio davanti a lui.

Che c’è di strano? Non tanto che il robot abbia associato “qualcosa da mangiare” a “mela” ma che sia stato in grado di trasformare una richiesta in un sofisticato movimento per afferrare la mela e porgerla all’interlocutore. Questa dimostrazione va oltre un “banale” chatbot (come ChatGPT) che riesce a rispondere in maniera naturale ad un interlocutore umano. Quello che impressiona è la capacità di interpretare comandi vocali e tradurli in movimento.

Quanto l’interazione sia effettivamente spontanea e quanto il movimento sia stato pre-programmato o dimostrato non lo sappiamo. Nasce però il dubbio: se al posto della mela ci fosse stata una banana? Il robot sarebbe stato in grado di rispondere altrettanto correttamente alla richiesta? Anche se fosse stato addestrato solo ad afferrare mele?

Che “capisca” che la banana è anch’essa un frutto e quindi “qualcosa da mangiare” probabilmente non stupirebbe. Se con la stessa naturalezza fosse però in grado di afferrare un frutto mai visto (e, come la banana, di ben altra forma rispetto alla mela) e a porgerla all’interlocutore sarebbe davvero stupefacente. Tutto è possibile a patto di avere tempo e dati a sufficienza. Ma la sfida alla generalizzazione è ancora tutta da vincere.

Le tecnologie Covariant per la gestione dei magazzini

Altro caso di interesse è quello di Covariant [8], startup americana fondata da ricercatori dell’Università di California a Berkeley.

Fig. 5 – Robot di Covariant

Covariant sta sviluppando, per la gestione dei magazzini, robot intelligenti alimentati da una quantità enorme di dati raccolti con sensori di varia natura. I dati, elaborati dai modelli di intelligenza artificiale, consentono al robot di trovare il comportamento corretto a fronte di situazioni ignote a priori. Il robot sarà quindi in grado di afferrare un determinato oggetto anche se non lo ha mai visto prima né, ed è questo il nodo, è stato programmato specificatamente per prendere tale oggetto. Probabilmente l’utilizzo di questa tecnologia in operazioni di magazzino, dove non sono richieste precisioni eccessive, è meno complessa rispetto a operazioni nella produzione manifatturiera, ma le potenzialità e l’impatto sono comunque notevolissimi, tanto è vero che l’azienda ha già raccolto fondi per più di 200 milioni di euro [9].

Dietro tutti questi sviluppi ci sono strumenti tecnici sempre più sofisticati per accrescere l’intelligenza degli agenti autonomi, e in particolare dei robot. Al “reinforcement learning”, ossia la tecnica per cui il robot impara attraverso la propria esperienza (ossia mediante “trial and error”) si affianca l’“imitation learning”, vale a dire la possibilità di istruire il robot mediante dimostrazione da parte dell’operatore, per teleoperazione o mediante apprendimento basato sulla visione. Del resto, non stiamo facendo altro che riprodurre sugli agenti autonomi il modo in cui tutti noi abbiamo imparato quanto sappiamo.

Che futuro ci attende?

La convergenza dei progressi dell’intelligenza artificiale e della robotica sta preparando il terreno al salto tecnologico atteso da tanti anni. Dare corpo all’intelligenza artificiale, non a caso il claim di I-RIM, l’Istituto di Robotica e Macchine Intelligenti [10] che da alcuni anni riunisce tutti i portatori di interessi sulla robotica in Italia, è la sfida del futuro. Questa sfida ci porterà finalmente ad avere il robot intelligente, che sa prendere decisioni autonomamente, in due parole sa “cavarsela da solo”, senza il papà programmatore che lo istruisca per ogni eventualità.

E allora non sarà più vero che il robot non è in grado di eseguire compiti alla portata del bambino di 3 anni. Il futuro è ancora tutto da scrivere.

Riferimenti

