intelligenza artificiale

Claude Sonnet 3.7, l’AI ibrida di Anthropic: guida alle nuove funzioni



Indirizzo copiato

Sonnet 3.7 di Anthropic è un modello ibrido che combina modalità standard e di ragionamento, migliorando la generazione di codice e artefatti. Offre capacità avanzate di analisi dati, avvicinando l’ecosistema Claude alla maturità e consolidando design futuri.

Pubblicato il 6 mar 2025

Antonio Cisternino

Università di Pisa



reddit Anthropic

A seguito dell’accelerazione imposta dal rilascio di DeepSeek R1 anche Anthropic ha rilasciato il nuovo modello, Sonnet 3.7, un modello di terza generazione che è caratterizzato dall’essere un modello ibrido, ovverosia che è capace sia di svolgere compiti secondo una modalità standard dell’LLM sia secondo una modalità di ragionamento simile a quanto fa OpenAI con o1.

In accordo alle informazioni disponibili il modello è unico, ed è solo la modalità con cui viene ingaggiato a determinarne il comportamento, si tratta quindi di un approccio diverso rispetto a quello seguito, ad esempio, dalla concorrente OpenAI, in cui si usano modelli distinti per scopi diversi.

Il modello Sonnet 3.7

Nonostante sia sempre più difficile elaborare prompt che consentano di provare le capacità di un nuovo modello, l’impressione che si ha nel provare questo nuovo modello è quella di un notevole passo avanti rispetto al suo predecessore (Sonnet 3.5), soprattutto negli aspetti di generazione di codice che poi sono alla base degli artefatti, una funzione su cui Anthropic sta investendo molto.

Sonnet 3.7 alla prova pratica

Dopo un po’ di fatica e tentativi sono riuscito a trovare un indovinello che richiedesse un po’ di ragionamento per ottenere una risposta diversa tra la versione con e senza di Sonnet 3.7. È sorprendente come gli indovinelli classici che richiedono l’uso della logica siano risolti senza l’uso del ragionamento e quello che ha richiesto questa capacità richiede anche l’uso di senso comune e non solo un ragionamento logico:

Immagine che contiene testo, schermata, CarattereIl contenuto generato dall'IA potrebbe non essere corretto.

L‘interfaccia di ragionamento e l’approccio ibrido di Sonnet 3.7

La risposta, sicuramente creativa, è evidentemente errata. Quando attiviamo la modalità di ragionamento otteniamo invece la risposta più ragionevole (e contro le zanzare):

Immagine che contiene testo, schermata, CarattereIl contenuto generato dall'IA potrebbe non essere corretto.

Come si vede l’interfaccia, in modo analogo a quanto avviene per altri modelli, riporta il tempo utilizzato per produrre la risposta ed espandendo il pannello possiamo leggere il ragionamento svolto che nel caso di Claude (come di o1) avviene in inglese:

Immagine che contiene testo, schermata, Carattere, documentoIl contenuto generato dall'IA potrebbe non essere corretto.

Vantaggi ed efficienza del modello unico per più funzioni

Sonnet 3.7 appare quindi un modello decisamente migliore del predecessore a cui è anche stata aggiunta la capacità di ragionare. Al momento la natura ibrida del modello da un punto di vista dell’interazione non sembra molto differente da disporre di due modelli, uno per la chat e l’altro per il ragionamento come avviene nel caso di OpenAI. La natura ibrida sembra, almeno per ora, più utile dal punto di vista dei costi di esecuzione: in un cloud basta caricare un solo modello per servire due tipologie di richieste, un approccio che sembra più efficiente in termini di uso risorse.

L‘evoluzione degli artefatti con la migliore generazione di codice

Il miglioramento del modello nell’ambito della generazione di codice ha comportato un netto miglioramento degli artefatti generati. Gli artefatti sono delle piccole applicazioni HTML che vengono eseguite nell’interfaccia stessa di Claude e stanno divenendo sempre più sofisticati.

Ho ottenuto con un semplice prompt il migliore generatore di frattali di Mandelbrot che sia riuscito a far generare, non solo funzionalmente ma anche dal punto di vista dell’organizzazione grafica e delle informazioni visualizzate. È anche possibile provarlo grazie alla possibilità di condividere gli artefatti generati.

Immagine che contiene testo, schermata, software, Software multimedialeIl contenuto generato dall'IA potrebbe non essere corretto.

Nuove capacità grafiche e animazioni nei risultati generati

È possibile anche ottenere semplici applicazioni che fanno uso di grafica 3D come il seguente simulatore di cubo di Rubik:

Immagine che contiene testo, schermata, software, Software multimedialeIl contenuto generato dall'IA potrebbe non essere corretto.

Tra le novità troviamo anche l’abilità di generare delle animazioni basate sul formato SVG. Si possono quindi ottenere schemi vettoriali, ad esempio per produrre disegni geometrici (ancora con quale difetto, ma decisamente sorprendenti):

Immagine che contiene testo, schermata, software, Software multimedialeIl contenuto generato dall'IA potrebbe non essere corretto.

Le funzionalità di analisi dati introdotte da Anthropic

Anthropic ha anche lanciato in anteprima l’abilità di effettuare l’analisi di dati, una funzionalità analoga al Data Analyst di OpenAI. In questo caso il modello genera codice per importare ed analizzare i dati da file in vari formati. Provando con dati in formato CSV sul bilancio di genere nelle Università Italiane sono riuscito ad ottenere prima un’analisi testuale assolutamente ragionevole (anche nei commenti qualitativi).

Ho poi chiesto “Puoi generare una dashboard per visualizzare questi dati?” ed ho ottenuto una dashboard interattiva simile a quelle che si possono ottenere con PowerBI (anche se meno funzionale) e che è visibile nella seguente figura:

Immagine che contiene testo, schermata, software, Icona del computerIl contenuto generato dall'IA potrebbe non essere corretto.

La maturazione dell’ecosistema Claude e il futuro di Anthropic

Il nuovo modello Sonnet 3.7 di Anthropic è decisamente un grande passo in avanti, anche nella sua struttura ibrida che consente di assolvere due funzioni distinte: l’interazione ormai “classica” della chat e quella che prevede il ragionamento.

La sensazione, visto anche il recente annuncio dell’uso di Amazon dei modelli di Anthropic nel nuovo servizio Alexa+, è che l’intero ecosistema di Claude stia rapidamente maturando avvicinandosi alla maturità anche nel software intorno al modello che caratterizza i sistemi di OpenAI, che ha di recente rilasciato GPT 4.5.

Il consolidamento del design e le innovazioni nel settore

Alcuni concetti, come i progetti, cominciano ad essere comuni e supportati da più sistemi incluso Claude, e questa è una buona notizia, ed è un segno che questi sistemi stiano cominciando a consolidare alcuni design che caratterizzeranno sicuramente il prossimo futuro.

Anthropic resta l’implementazione più soddisfacente degli artefatti, anche se anche OpenAI ha cominciato ad introdurre una funzione analoga all’interno del Canvas ma che per ora sembra essere meno matura.

L’altra novità degna di nota è l’introduzione dell’analisi dei dati, elemento analogo al code interpreter di OpenAI, che consente al modello di avvalersi dell’esecuzione di programmi per il proprio funzionamento.

guest

0 Commenti
Più recenti
Più votati
Inline Feedback
Vedi tutti i commenti

Articoli correlati