Sì, Fable 5 era sorprendente. L’ho potuto provare per qualche giorno prima che lo bloccassero e quanto ho potuto apprendere lo conferma e permette forse di capire meglio quanto accaduto dopo.
È successo tutto nel giro di poche ore: Anthropic ha rilasciato la prima versione di un modello di classe Mythos, il modello Fable 5, inizialmente con l’obiettivo di renderlo accessibile agli utenti con abbonamento Claude fino al 22 giugno per poi limitarlo ad un accesso via API. Il piano iniziale è però stato sabotato dal governo americano che il 12 giugno ha emesso un ordine restrittivo imponendo che l’accesso al modello fosse solo per i cittadini americani e di fatto imponendo la messa off-line dello stesso.
Il motivo dell’azione governativa è stato un apparente jailbreak del ricercatore in cybersecurity “Pliny the liberator” che è riuscito ad ottenere risposte dal modello Mythos 5 aggirando i vari classificatori che avrebbero dovuto impedire che l’AI rispondesse a questioni di cybersecurity. Il ricercatore è riuscito anche ad estrarre circa il prompt di sistema di circa 120KB sollevando preoccupazione nella comunità che le inusuali capacità di Mythos di individuare bug di sicurezza potessero essere accessibili ad attori che potessero compromettere i sistemi globali.
Indice degli argomenti
Fable 5 e modello Mythos: cosa si è visto nel test
Dopo molte supposizioni a proposito delle fantasmagoriche capacità del modello Mythos (e le altrettante illazioni che si trattasse solo di una trovata di marketing) la disponibilità di Fable 5, seppur breve, ha consentito di farsi un’idea delle capacità del nuovo modello per chi è riuscito come me ad interagirci per qualche scambio. Nonostante sia sempre più difficile farsi un’idea sulla capacità di un modello da un singolo prompt ho provato dopo tanto tempo questa via e i risultati sono stati sorprendenti: cerchiamo di capire perché e farsi un’idea delle nuove AI che comunque emergeranno nel prossimo futuro.
Il modello Mythos alla prova del paradosso di Gödel
Se un tempo bastava chiedere a un modello “un mattone pesa 1kg più mezzo mattone, quanto pesa un mattone” per apprezzarne la capacità di funzionamento i modelli odierni richiedono approcci più sofisticati. Non appena Fable 5 è stato rilasciato mi sono chiesto: quale prompt potrei usare per evidenziarne le capacità? Ho successivamente pensato al noto indovinello del viandante che deve scegliere ad un bivio la strada giusta e ha una sola domanda da rivolgere a uno di due fratelli (il primo che dice sempre il vero e il secondo che dice sempre il falso), ho quindi deciso di chiedere ad Opus 4.8 quale potesse essere un prompt per mettere alla prova Fable 5.

Il prompt scelto per misurare la risposta
La risposta come sempre era interlocutoria ma il prompt di esempio che mi ha fornito mi è piaciuto molto ed ho deciso di usarlo per testare le capacità del nuovo modello. Forse mi ha colpito l’esempio di illustrare il teorema di incompletezza di Gödel, un teorema molto affascinante che dimostra che in un qualsiasi sistema formale abbastanza espressivo da descrivere l’aritmetica esistono affermazioni per cui è impossibile stabilire il grado di verità. Si tratta di un risultato straordinario, ma anche difficile da apprezzare e da comprendere, e mi sembrava interessante l’idea di provare la creatività dell’AI nello spiegare con una metafora “originale” un risultato simile.
Fable 5, Opus 4.8 e GPT-5.5 davanti alla stessa metafora
La risposta che ho ottenuto da Fable 5 è stata sicuramente sorprendente, e la metafora sicuramente è originale, così come le considerazioni che il modello fa per indicarne i limiti. Ma in fondo non avevo mai provato questo prompt con altri modelli e quindi per apprezzare la risposta data ho cercato di capire come Opus 4.8 e GPT-5.5 rispondessero alla stessa domanda.

Anthropic e OpenAI nel confronto diretto
È interessante osservare le risposte che danno i modelli di Anthropic e OpenAI: Opus 4.8 da una risposta poco espressiva e chiara mentre GPT-5.5 sembra avvicinarsi a Fable 5 sia nell’approccio scelto che nella qualità della risposta.


Creatività del modello Mythos tra catasto e mappe ricorsive
Poiché nel prompt si richiede una metafora originale mi sono chiesto: ma le AI pensano tutte al catasto? Certo il catasto si presta ad una metafora con un sistema formale come la matematica e i certificati possono ricordare le dimostrazioni, ma è l’unica possibile?
Metafore diverse a parità di prompt
Ho provato a ripetere quindi il prompt e qui Fable 5 mi ha sorpreso davvero: mentre Opus e GPT-5.5 continuavano a generare varianti di un catasto il nuovo modello ha generato tre metafore sostanzialmente distinte ed altrettanto efficaci.


Ormai siamo tutti abituati al fatto che le AI a parità di prompt generino risposte differenti, ma non mi era ancora capitato di avere risposte così differenti a parità di prompt e contesto. Il comportamento che mi aspettavo era quello che Opus e GPT esibivano: variazioni sul tema centrate intorno alla stessa idea. Ma Fable in qualche modo ha fatto molto di più, e per quanto mi riguarda si tratta sicuramente di un comportamento degno di nota e nuovo.
Certo è difficile capire se queste novità sono legate al solo nuovo modello oppure al complesso di sistemi AI che ormai interagiscono tra loro per generare una risposta: le informazioni stesse relative a Fable 5 lasciano intravedere un’architettura multi-modello che prende in carico un prompt e decide quali modelli debbano essere coinvolti nella risposta, e non è da escludersi che non sia il modello di per sé ad esibire creatività ma le interazioni tra i modelli stessi (magari un prompt ad un modello intermedio seleziona uno dei possibili oggetti e poi Mythos si limita a generare la risposta.
Nuovi modelli AI dopo Fable 5: costi, accesso e formazione
Sebbene abbia avuto poco tempo per giocare con Fable l’impressione che da è quella di una nuova generazione di modelli AI che esibiscono comportamenti complessi e superano le capacità di quelli a cui ci stiamo rapidamente abituando. Anche GPT-5.5 non si comporta male e anche qui la sensazione sembra riflettere quello che i benchmark sembrano dire: Mythos è un modello molto capace ma GPT-5.5 non è troppo distante e in termini di costi costa molto meno. In effetti Fable 5 consumava una volta e mezzo i token usati da Opus 4.8 in termini di costi: la scelta di Anthropic lascia quindi intravedere un modello capace ma molto costoso in termini di esecuzione.
Accesso, riapertura e corsa degli altri attori
Credo che sia solo questione di tempo e Fable sarà riaperto al grande pubblico: l’amministrazione Americana non si può permettere troppe polemiche che potrebbero minare ulteriormente la credibilità su servizi Cloud su cui molte nazioni poggiano il proprio funzionamento. Se è comprensibile un po’ di panico di fronte al sospetto che gli hacker potessero compromettere i sistemi di mezzo mondo grazie al nuovo arrivato la misura restrittiva sembra decisamente temporanea. In ogni caso i tempi sono maturi per modelli di questo livello, ed è solo questione di tempo perché o altre realtà americane o aziende cinesi replicheranno capacità analoghe.
Le competenze necessarie per leggere le nuove AI
Dobbiamo quindi tutti prepararci ad un AI molto più capace di quelle a cui siamo abituati, un’AI che richiede un background molto solido solo per leggere le risposte che fornisce, e questo impone una forte responsabilità al sistema formativo per assicurare che le nuove generazioni non si limitino a subire una conoscenza che, per quanto sofisticata, è basata sulla fotografia attuale del mondo. Come si possono formare i nuovi ricercatori? Quali basi servono agli uomini di domani per essere protagonisti attivi e non semplici succubi di una AI? Sono domande aperte che richiedono una risposta urgente: l’evoluzione dei modelli come testimoniato da Fable 5 non ci aspetta.














Partecipa alla community