la nostra prova

Suna in azione: come funziona l’AI che va sul web al posto nostro



Indirizzo copiato

Gli agenti AI stanno cambiando l’automazione web. Suna di Kortix si distingue per la sua capacità di operare in modo simile a un operatore umano, affrontando compiti complessi come la compilazione di form online e l’analisi di dati

Pubblicato il 8 lug 2025

Antonio Cisternino

Università di Pisa



agenti autonomi AI evoluzione dell'intelligenza artificiale AI ERP; AI trend memoria degli agenti ai etica dell'IA agentica AI agentless intelligenza artificiale agentica

Gli agenti AI stanno rapidamente evolvendo, trasformandosi in strumenti autonomi capaci di eseguire compiti complessi senza l’intervento umano diretto. Un esempio significativo è Suna, sviluppato dalla startup Kortix, che offre un agente AI versatile e open source, capace di operare sia online che localmente per completare azioni ripetitive sul web.

L’evoluzione degli agenti AI

In soli sei mesi gli agenti AI che operano per nostro conto si sono moltiplicati come raramente accade nel frenetico mondo dell’IT. L’AI si sta rapidamente trasformando in un’attività che si orchestra autonomamente sostituendo il paradigma che ne ha contrassegnato gli ultimi anni in cui è l’utente a dirigere l’orchestra.

A inizio 2025 si sono visti i primi agenti, come ad esempio Operator di OpenAI, un agente capace di navigare in rete per nostro conto riempiendo form e automatizzando compiti che consistono nel cliccare in un Web browser per nostro conto.

Suna: caratteristiche operative

In questo panorama è molto interessante l’arrivo dell’agente Suna generalista della startup Kortix, un sistema rilasciato anche secondo il modello Open Source e che include una funzione analoga a Operator di OpenAI che può essere eseguita anche localmente al proprio sistema oltre che nel cloud della startup.

Suna è disponibile sia come servizio online che come progetto Open Source su GitHub. Si tratta di un’interfaccia che consente di usare vari modelli AI (inclusi quelli di OpenAI, Anthropic, Deepseek) per il proprio funzionamento ed eseguire strumenti che svolgono azioni come navigare la rete con un Web Browser o eseguire comandi in un prompt confinato in un ambiente virtuale.

Interazione con Suna: ecco come funziona

Una volta autenticati è possibile interagire con l’agente con un’interfaccia che ci è ormai familiare. Quando si pone una richiesta l’interfaccia apre un pannello a destra che mostra degli screenshot del sistema virtuale in cui vengono eseguiti gli strumenti. Gli strumenti che l’agente decide di utilizzare per svolgere il compito richiesto sono a sua discrezione ma se si usano prompt espliciti come, ad esempio, “riempi questo form online” è possibile forzare la richiesta di utilizzare l’operatore Web.

È importante osservare che alcuni modelli si rifiutano di interagire con l’operatore, è il caso di Gemini 2.5 Flash che informa che non può procedere per motivi di privacy (nella versione gratuita solo Deepseek sembra in grado di usare correttamente l’operator Web). Immagine che contiene testo, schermata, Carattere, designIl contenuto generato dall'IA potrebbe non essere corretto.

Suna e l’automazione sul web: come se la cava con form e analisi dati in formato CSV

Ho provato a chiedere di compilare un form con un test su limiti  tipici di un corso di Analisi I universitario e l’operatore riesce a muoversi e inserisce campi nella form ma spesso sbaglia la sottomissione (contrariamente all’Operator di OpenAI che raggiunge nove risposte corrette su dieci). Sono sicuro che l’uso dei modelli a pagamento renda decisamente più efficace il funzionamento dell’agente, ma il contributo della startup sembra essere non tanto sugli aspetti di modello bensì sulla realizzazione di una piattaforma in cui l’AI possa svolgere compiti che non si limitino a rispondere a questioni specifiche, agendo come potrebbe fare un operatore umano.

Ecco che anche la richiesta di analizzare dati in formato CSV non si limita ad eseguire codice Python come accade nel caso di OpenAI ma si possono osservare varie esecuzioni di comandi di shell come fa Codex di OpenAI.

L’impressione che si ha utilizzando Suna è di una piattaforma ben fatta che affronta il problema di fornire strumenti ad una AI per svolgere compiti complessi di natura aziendale.

Una piattaforma Open Source: esecuzione locale e controllo di Suna

Un tratto interessante della piattaforma Suna è la possibilità di eseguirla localmente data la natura open source del progetto. La messa in esecuzione non è semplice e la complessità del progetto richiede varie conoscenze per poter semplicemente avviare il sistema sul proprio PC. Bisogna conoscere la piattaforma Docker (e il compose) a meno di non volersi lanciare in un’esecuzione del sistema Python direttamente. Il sistema fa uso di vari sistemi esterni, oltre ovviamente alle varie API per invocare modelli AI necessari al funzionamento. Degno di nota è l’uso di Daytona un servizio cloud in cui vengono eseguiti container che eseguiranno i vari strumenti in sicurezza.

Ho apprezzato che con un po’ di sforzo si riesca effettivamente ad avere una versione funzionante del sistema in locale, aprendo le porte a scenari in cui l’operatore sia eseguito con strumenti locali e sotto controllo dell’utente stesso. Suna è inoltre uno dei primi sistemi focalizzati sullo svolgimento di compiti basati su strumenti, con particolare enfasi sulla navigazione Web cliccando sul Web browser. Contrariamente a Operator di OpenAI il sistema a volte combina l’analisi dei sorgenti di una pagina Web all’interazione grafica basata sull’interfaccia grafica, offrendo un interessante approccio che combina la conoscenza della macchina all’interazione più simile a quella di un operatore umano.

Vantaggi e limiti della piattaforma open source

Suna sembra essere un sistema da tenere d’occhio, nonostante si affacci in un mercato saturo di agenti AI e sistemi. Con un po’ di buona volontà e sforzo consente l’esecuzione locale e soprattutto consente di avere un operatore Web che possa svolgere compiti ripetitivi su pagine Web. L’interfaccia e la user experience è meno sofisticata dell’operator di OpenAI (in particolare non consente l’interazione dell’utente con la pagina Web durante l’esecuzione) ma si tratta di un progetto sicuramente molto interessante. L’abilità di riempire delle form apre nuovi scenari, soprattutto in ambiti come la didattica che fa uso di test online per le verifiche: è sempre più facile chiedere all’AI di svolgere il proprio compito.

guest

0 Commenti
Più recenti
Più votati
Inline Feedback
Vedi tutti i commenti

Articoli correlati