vulnerabilità software

Mythos Preview, perché la BCE teme l’escalation del rischio cyber

La BCE ha riunito le banche dell’area euro per valutare i rischi legati a Mythos Preview, modello di Anthropic capace di individuare vulnerabilità software. Il caso apre interrogativi su cybersecurity bancaria, accesso alla tecnologia, falsi positivi, patch e governance dei modelli di frontiera

Pubblicato il 27 mag 2026

Aggiungi tra i preferiti su Google

Sara Frizziero

Senior Manager ICT Consulting

Marco Lentini

Senior Manager ICT Consulting

Edoardo Meraviglia

Senior Consultant ICT Consulting

Chiedi all'AI

Riassumi questo articolo

Approfondisci con altre fonti

La Banca Centrale Europea ha convocato per martedì 26 maggio una riunione con i responsabili degli istituti di credito dell’area euro per approfondire i possibili rischi sistemici legati alla diffusione di Mythos Preview, il nuovo modello di frontiera presentato da Anthropic e descritto come capace di individuare vulnerabilità software e contribuire alla generazione di exploit.

Claude Mythos Preview, perché la super-AI cyber riaccende la sfida globale

L’iniziativa nasce dalla preoccupazione che strumenti di questo tipo possano accelerare l’identificazione di falle nei sistemi informatici, inclusi quelli del settore finanziario, con possibili implicazioni sia difensive sia offensive.

Un ulteriore profilo di attenzione riguarda poi l’accesso diseguale alla tecnologia: Mythos Preview non è attualmente disponibile per il testing da parte delle banche europee, mentre alcune banche statunitensi sarebbero coinvolte nelle attività di sperimentazione nell’ambito del Project Glasswing [2].

Indice degli argomenti

Mythos Preview e Project Glasswing

Project Glasswing è un’iniziativa collaborativa guidata da Anthropic con l’obiettivo di rafforzare la sicurezza del software critico su scala globale. Il progetto riunisce oltre 40 organizzazioni, tra cui aziende tecnologiche come Amazon, Apple, Google e Microsoft, operatori di cybersecurity e – appunto – alcuni istituti finanziari statunitensi, chiamati a testare le capacità avanzate del modello [1].

La rilevanza della vicenda va oltre il singolo caso Mythos e si inserisce in un contesto più ampio: l’evoluzione dell’intelligenza artificiale sta incidendo sempre più direttamente sul mondo della cybersecurity, in particolare sulle attività di analisi del codice e di individuazione delle vulnerabilità software. Mythos Preview segnala infatti un possibile cambio di scala: non più soltanto strumenti di supporto per analisti e ricercatori, ma modelli potenzialmente in grado di accelerare in modo significativo la ricerca delle falle nei software più diffusi.

È tuttavia importante sottolineare che molte di queste capacità sono, allo stato attuale, dichiarate in contesti controllati e non ancora pienamente verificabili in scenari indipendenti. Per questo motivo, è necessario mantenere cautela nell’interpretazione dei risultati e distinguere tra capacità annunciate, risultati sperimentali e reale efficacia operativa.

In parallelo, anche altri produttori stanno sviluppando modelli sempre più performanti nelle attività di coding, reasoning tecnico e uso di strumenti, come mostra il lancio di GPT-5.5 da parte di OpenAI [3]. Questo conferma una tendenza più generale: i modelli di frontiera stanno diventando sempre più rilevanti anche per le attività di sicurezza applicata.

La riunione BCE con le banche dell’area euro

In questo quadro si inseriscono anche i primi elementi emersi a valle del vertice BCE: secondo ricostruzioni di stampa, l’incontro avrebbe avuto una natura prevalentemente operativa, con l’obiettivo di accelerare la preparazione delle banche europee piuttosto che introdurre nuove misure formali di vigilanza. In particolare, l’istituto di Francoforte avrebbe esercitato pressione sugli intermediari affinché rafforzino e velocizzino i processi di sicurezza IT, alla luce delle nuove capacità dell’AI di individuare vulnerabilità e potenzialmente ridurre i tempi tra scoperta e sfruttamento delle falle [7].

Secondo ulteriori elementi emersi dal confronto tra supervisori e istituti di credito, alla riunione avrebbero partecipato circa 300 rappresentanti tra banche, settore pubblico e associazioni, con il coinvolgimento anche di istituti statunitensi attivi nell’Eurozona già esposti alla sperimentazione di Mythos. L’incontro, durato circa due ore, ha avuto come obiettivo principale la condivisione di esperienze e l’avvio di un dialogo strutturato tra supervisori e operatori su rischi e possibili contromisure [10].

L’importanza dell’AI nella vulnerability discovery

La ricerca delle vulnerabilità è da sempre una delle attività più complesse in ambito cybersecurity, perché richiede competenze specialistiche, tempo e capacità di analizzare sistemi spesso articolati, distribuiti e in continua evoluzione. In questo contesto, i modelli di frontiera promettono di accelerare le attività di vulnerability discovery, grazie alla possibilità di analizzare grandi quantità di codice e dati, riconoscere pattern anomali e formulare ipotesi di sfruttamento in tempi significativamente più rapidi rispetto ai processi tradizionali.

In termini pratici, l’uso dell’AI può rafforzare diverse attività difensive, tra cui:

• l’analisi preliminare di basi di codice molto estese, con l’obiettivo di individuare aree potenzialmente esposte [1];

• il supporto al triage delle segnalazioni, aiutando i team di sicurezza a prioritizzare le vulnerabilità più critiche [4];

• la generazione di scenari di test e verifica, utili ad accelerare la conferma tecnica delle falle individuate [3];

• l’integrazione nei processi di secure development e auditing continuo, secondo una logica più vicina alla validazione costante che alla sola revisione periodica [4].

L’interesse verso questi strumenti nasce proprio dalla crescente complessità del software moderno, sempre più distribuito, interconnesso e aggiornato secondo cicli di rilascio rapidi. In questo scenario, un controllo manuale completo della sicurezza diventa progressivamente più difficile, mentre cresce l’esigenza di strumenti capaci di supportare analisi più frequenti, scalabili e tempestive.

I limiti dell’AI tra falsi positivi e verificabilità

Accanto alle opportunità, il caso Mythos ha riportato al centro del dibattito anche alcuni limiti strutturali dell’utilizzo dell’AI nella ricerca delle vulnerabilità software. In particolare, al di là dell’impatto mediatico dei risultati annunciati, mancano ancora informazioni essenziali sui falsi positivi, sulla riproducibilità delle vulnerabilità segnalate e sul reale valore operativo delle evidenze prodotte [1].

Questo punto è decisivo perché, in ambito cybersecurity, il numero di segnalazioni generate non equivale automaticamente a un miglioramento della capacità difensiva. Un sistema in grado di individuare migliaia di potenziali falle può creare valore solo se riesce anche a distinguere in modo affidabile tra vulnerabilità effettivamente sfruttabili, problemi teorici, condizioni non realistiche e segnalazioni che richiedono un’ulteriore validazione umana.

Molti falsi positivi possono infatti derivare da vulnerabilità presenti solo in configurazioni non realistiche, da input non controllabili dall’esterno o da scenari già mitigati da controlli runtime. Senza una verifica accurata, il rischio è quello di sovraccaricare i team di sicurezza con segnalazioni poco concrete o difficilmente azionabili.

La questione della verificabilità diventa ancora più rilevante quando si passa dai software più diffusi a sistemi meno popolari, meno documentati o più verticali. Oggi l’attenzione si concentra soprattutto sui grandi sistemi operativi e sui software largamente adottati; in prospettiva, tuttavia, l’efficacia di questi modelli su sistemi meno diffusi potrebbe avere implicazioni ancora più delicate, sia sul piano difensivo sia su quello offensivo.

Le prime indicazioni per il sistema bancario

Le prime indicazioni emerse dal vertice BCE mostrano come il tema non sia solo tecnico, ma anche operativo e sistemico per il settore bancario. Secondo fonti citate dal Financial Times, i supervisori europei avrebbero sottolineato come l’accelerazione portata dai modelli di frontiera imponga una revisione dei processi interni delle banche, in particolare per quanto riguarda i tempi di applicazione delle patch di sicurezza. In alcuni casi, vulnerabilità corrette tramite aggiornamenti software potrebbero essere ricostruite tramite reverse engineering in tempi molto ridotti, rendendo inefficaci i cicli di aggiornamento tradizionali [8].

Le indicazioni operative emerse dal confronto con la Vigilanza BCE vanno proprio in questa direzione: agli intermediari sarebbe stato richiesto di definire piani di azione per aumentare la resilienza ai rischi legati all’AI, con particolare attenzione alla velocità degli aggiornamenti informatici. L’uso di modelli come Mythos potrebbe infatti rendere le patch di sicurezza una fonte indiretta di informazione sulle vulnerabilità, imponendo alle banche di reagire con maggiore rapidità ed efficacia [10].

Sempre secondo indiscrezioni riportate dalla stampa internazionale, un ulteriore elemento discusso nel meeting riguarda la necessità di rafforzare la cooperazione tra istituti europei e statunitensi. La BCE avrebbe infatti sollecitato le banche con accesso diretto a Mythos a condividere informazioni e risultati delle attività di testing con gli operatori europei, nel tentativo di ridurre l’asimmetria tecnologica attualmente esistente [8].

In questo contesto, la BCE continua a considerare Mythos un possibile “game changer”, evidenziando come la capacità di identificare rapidamente vulnerabilità complesse possa modificare in modo significativo il profilo di rischio del sistema finanziario. L’accesso limitato al modello, oggi disponibile solo per alcuni attori statunitensi, introduce inoltre una dimensione geopolitica che incide sul livello di resilienza relativo tra sistemi bancari [11].

Controllo, accesso e rischio sistemico

La scelta di Anthropic di non rilasciare pubblicamente Mythos, limitandone l’accesso a un gruppo ristretto di grandi produttori software e partner selezionati, segnala che la questione non è soltanto tecnica, ma anche di governance. Se uno strumento di AI è effettivamente in grado di accelerare la scoperta e la potenziale sfruttabilità delle vulnerabilità, allora la gestione degli accessi, dei casi d’uso consentiti e delle modalità di controllo diventa parte integrante della sicurezza stessa [5].

Questo apre anche un tema di concentrazione del potere tecnologico. Strumenti di questo tipo rischiano infatti di rafforzare il vantaggio degli attori già più strutturati, creando un’asimmetria tra organizzazioni dotate delle risorse necessarie per reagire rapidamente e realtà meno attrezzate sul piano tecnico, economico e operativo.

Inoltre, la stessa capacità che può accelerare le attività difensive potrebbe, in linea teorica, ridurre la barriera d’ingresso per attività offensive, rendendo più accessibili competenze che in passato richiedevano esperienza avanzata e capacità specialistiche. Un esempio concreto è emerso nel 2025, quando un gruppo di hacker cinesi avrebbe utilizzato Claude, il modello sviluppato da Anthropic, per condurre una campagna di attacco in larga parte automatizzata. Secondo quanto riportato, l’AI sarebbe stata impiegata per supportare diverse fasi operative, dalla ricognizione alla scrittura di codice, mostrando come questi strumenti possano contribuire ad aumentare scala, velocità e automazione delle operazioni offensive [6].

Il tema si intreccia con una considerazione più ampia: gran parte del software su cui si fonda l’ecosistema digitale è sviluppato, aggiornato e mantenuto da soggetti privati. Di conseguenza, la capacità di individuare, verificare e correggere le vulnerabilità dipende sempre più da risorse, incentivi e processi interni alle aziende.

In questo scenario, assumono un ruolo ancora più centrale le pratiche di coordinated vulnerability disclosure, ossia i processi attraverso cui chi scopre una vulnerabilità la segnala in via riservata al produttore, collaborando alla sua analisi e risoluzione prima di un’eventuale divulgazione pubblica. Questi meccanismi aiutano a trasformare la scoperta delle falle in un processo ordinato di verifica, comunicazione e correzione. Le linee guida del NIST insistono proprio sull’importanza di definire processi chiari per ricevere, valutare e gestire le segnalazioni di vulnerabilità [4].

Verso una cybersecurity più automatizzata

Alla luce di queste opportunità e criticità, il caso Mythos suggerisce che la cybersecurity stia entrando in una nuova fase, nella quale la scoperta delle vulnerabilità potrà essere sempre più automatizzata e integrata direttamente nei processi di sviluppo software. In questa prospettiva, gli strumenti di AI non sarebbero più utilizzati soltanto per assistere analisti e ricercatori, ma anche per mettere costantemente alla prova il codice, individuando possibili punti di debolezza prima che possano essere sfruttati da attaccanti reali.

Anche il rilascio di GPT-5.5 conferma la direzione generale del mercato verso modelli sempre più avanzati nelle attività di coding, uso di strumenti e ragionamento tecnico. OpenAI ha infatti presentato il nuovo modello come più capace nella gestione di compiti complessi e ha dedicato specifica attenzione ai profili di rischio e alle valutazioni in ambito cybersecurity. Questo non consente di sovrapporre direttamente GPT-5.5 a Mythos, che nasce con una finalità più specificamente orientata alla sicurezza del software, ma mostra chiaramente come i modelli di frontiera stiano diventando sempre più rilevanti anche nelle attività di sicurezza applicata.

Conclusioni

L’intelligenza artificiale applicata alla ricerca delle vulnerabilità software rappresenta una delle evoluzioni più rilevanti della cybersecurity contemporanea. Da un lato, questi strumenti promettono di aumentare la velocità e la profondità dell’analisi difensiva; dall’altro, pongono interrogativi concreti su accuratezza delle segnalazioni, falsi positivi, controllo degli accessi, distribuzione del potere tecnologico e possibili utilizzi offensivi.

Il punto, quindi, non è soltanto quante vulnerabilità un modello riesca a individuare, ma quanto siano affidabili le sue segnalazioni, come vengano validate e chi abbia concretamente la capacità di intervenire per correggerle. In un contesto in cui il software è sempre più pervasivo e in larga parte sviluppato e mantenuto da operatori privati, il vero vantaggio non sarà soltanto scoprire più vulnerabilità, ma governare in modo maturo, trasparente e rapido l’intero ciclo che va dalla scoperta alla remediation.

La sfida futura non sarà quindi solo integrare questi strumenti nei processi di sviluppo, ma farlo in modo da rafforzare la sicurezza complessiva dell’ecosistema digitale, evitando che la loro diffusione crei un vantaggio strutturale per pochi grandi attori a discapito di molti, o finisca per aumentare il rischio sistemico invece di ridurlo.

Alla luce delle informazioni emerse dal vertice BCE, questa dinamica assume anche una dimensione di policy. Le autorità di vigilanza sembrano infatti orientate non tanto a intervenire direttamente sui modelli di AI, quanto a richiedere agli operatori finanziari un adeguamento rapido delle pratiche di sicurezza e resilienza operativa. In questo senso, il meeting rappresenta un primo segnale di come i rischi legati all’AI possano entrare stabilmente nel perimetro della vigilanza prudenziale, pur in assenza, al momento, di un quadro regolatorio specifico dedicato a questi strumenti [9].

In questa prospettiva, l’evoluzione dei modelli di frontiera potrebbe non solo modificare le capacità tecniche di attacco e difesa, ma anche incidere sui modelli di governance della sicurezza, spingendo verso una maggiore integrazione tra innovazione tecnologica, cooperazione internazionale e supervisione regolatoria.

Riferimenti bibliografici

https://www.milanofinanza.it/news/banche-allarme-bce-su-mythos-di-anthropic-urgente-gli-istituti-devono-raddoppiare-gli-sforzi-sull-ai-202605131210487376

@RIPRODUZIONE RISERVATA

Sara Frizziero

Senior Manager ICT Consulting

Seguimi su

Marco Lentini

Senior Manager ICT Consulting

Seguimi su

Edoardo Meraviglia

Senior Consultant ICT Consulting

Partecipa alla community

0 Commenti

Più recenti

Più votati

Inline Feedback

Vedi tutti i commenti

Argomenti

Canali

S
Sicurezza digitale

Mythos Preview, perché la BCE teme l’escalation del rischio cyber

Mythos Preview e Project Glasswing

La riunione BCE con le banche dell’area euro

L’importanza dell’AI nella vulnerability discovery

I limiti dell’AI tra falsi positivi e verificabilità

Le prime indicazioni per il sistema bancario

Controllo, accesso e rischio sistemico

Verso una cybersecurity più automatizzata

Conclusioni