Intelligenza artificiale

Ecco Claude Science. Cosa cambia, a confronto con Google e OpenAI



Indirizzo copiato

Anthropic apre in beta Claude Science: integra gli strumenti di laboratorio, gestisce calcolo su cluster HPC o GPU on demand restando sull’infrastruttura del ricercatore, e produce output riproducibili. Il confronto con Co-Scientist di Google mostra due strade diverse per la ricerca scientifica. La biologia di frontiera resta riservata a Mythos 5

Pubblicato il 1 lug 2026

Fabio Lalli

ceo ICONICO | Innovation & Digital Transformation



claude science
AI Questions Icon
Chiedi all'AI
Riassumi questo articolo
Approfondisci con altre fonti


Anthropic pubblica il 30 giugno l’annuncio di Claude Science e lo apre in beta il giorno dopo, il primo luglio, per gli utenti Pro, Max, Team ed Enterprise su macOS e Linux. È un’app che raccoglie in un unico ambiente gli strumenti che uno scienziato usa ogni giorno: PubMed, Jupyter, R, il terminale del cluster, decine di database con schemi diversi. Il posizionamento è chiaro fin dal nome: non un modello nuovo, un banco di lavoro.

Claude Science, un ambiente che sostituisce il collage di strumenti

La proposta di Anthropic parte da un problema concreto, quello della frammentazione. Un ricercatore che analizza dati genomici o proteomici passa la giornata a spostarsi tra tool con logiche incompatibili, a scrivere pipeline su misura per ogni formato di file, a rincorrere risultati che poi fatica a riprodurre mesi dopo. Claude Science mette al centro un agente coordinatore generalista, con accesso a oltre 60 skill e connettori già configurati per genomica, proteomica, biologia strutturale, single cell, cheminformatica. Questo agente può generarne altri, dialogare con agenti specialistici creati dagli utenti, e si affianca a un reviewer agent che controlla citazioni e calcoli, segnalando e correggendo gli errori man mano che emergono.

Fonte: Anthropic, «Claude Science, an AI workbench for scientists»

Ogni output porta con sé la propria storia: il codice che l’ha generato, l’ambiente in cui è girato, la cronologia completa dei messaggi. Chiedere di togliere le gridline da un grafico o passare a scala logaritmica su un asse diventa una richiesta in linguaggio naturale, e l’agente modifica direttamente il proprio codice. La riproducibilità entra nel criterio di costruzione dell’output, prima ancora di diventare una verifica a valle.

Perché il calcolo con Claude Science resta sul laboratorio invece che nel cloud di Anthropic

La scelta architetturale più marcata riguarda dove girano i dati. Claude Science funziona sul laptop del ricercatore, su una macchina Linux, via SSH su un cluster HPC o su un login node, esattamente come un notebook Jupyter. Le pipeline di calcolo pesante, il folding di una proteina, un’analisi genomica su un dataset enorme, vengono pianificate dall’agente, sottoposte a revisione dell’utente prima dell’invio, e poi eseguite sull’infrastruttura che il laboratorio già possiede, oppure scalate su GPU a richiesta tramite Modal.

Fonte: Anthropic, «Claude Science, an AI workbench for scientists»

I dataset sensibili o di grandi dimensioni non lasciano mai i sistemi su cui già si trovano, solo il contesto necessario a ogni passaggio dell’analisi viene inviato al modello. È una scelta che parla direttamente a chi lavora con dati clinici, campioni biologici, materiale coperto da accordi di riservatezza: il vincolo di compliance non è un livello aggiunto sopra il prodotto, è nell’architettura.

Domain-ready dal primo giorno grazie a NVIDIA

Claude Science arriva già configurato per biologia, chimica computazionale, genomica, sostenuto da oltre 60 database scientifici. Le skill del BioNeMo Agent Toolkit di NVIDIA lo collegano nativamente a modelli come Evo 2, Boltz-2 e OpenFold3. Chi ha già pipeline validate, modelli proprietari o strumenti di fiducia può salvarli come skill riutilizzabile o collegarli tramite connettore, e le sessioni successive li ereditano in automatico.

Fonte: Anthropic, «Claude Science, an AI workbench for scientists»

I casi d’uso raccontati nell’annuncio danno la misura del salto. Manifold Bio ha usato Claude Science per classificare candidati farmacologici tissue-targeting, incrociando espressione superficiale, trafficking e profilo di sicurezza con i dati proprietari dei programmi passati. Jérôme Lecoq, neuroscienziato all’Allen Institute, ha costruito una pipeline di venti skill dedicate a produrre review sistematiche della letteratura: un lavoro che al suo team richiedeva fino a due anni ora produce dieci review, molte oltre cento pagine, con citazioni verificate da agenti dedicati. Stephen Francis, epidemiologo alla UCSF, ha ridotto a un decimo il tempo necessario per gli studi sulla suscettibilità genetica al glioma, con risultati validati indipendentemente dal suo laboratorio.

Google e OpenAI corrono sullo stesso terreno, con strade diverse

Il confronto competitivo più diretto è con Co-Scientist di Google DeepMind, ora dentro Gemini for Science: un sistema multi-agente costruito su Gemini che genera, critica, classifica e fa evolvere ipotesi scientifiche attraverso un “torneo” tra idee concorrenti, ispirato ai meccanismi di AlphaGo. Calico, l’Allen Institute e diversi National Lab lo stanno già usando, e Google ha pubblicato risultati concreti, dal repurposing di farmaci per la leucemia mieloide acuta alla scoperta di target genetici per la fibrosi epatica. La differenza di fondo è nel baricentro: Co-Scientist punta sulla generazione e il vaglio delle ipotesi, un lavoro che avviene prevalentemente lato Google Cloud, mentre Claude Science punta sull’esecuzione dell’intero ciclo, dall’analisi dei dati al manoscritto pronto per la pubblicazione, restando sull’infrastruttura del laboratorio.

OpenAI gioca invece una partita più lontana nel tempo. Il piano dichiarato da Sam Altman parla di un “research intern” entro il 2026 e di un ricercatore automatizzato entro il 2028, capace di condurre esperimenti in autonomia su problemi troppo complessi per un umano. Per ora la traduzione pratica è deep research, che sintetizza fonti web in report analitici ma non gestisce calcolo scientifico, ambienti riproducibili o pipeline di laboratorio. Sul fronte accademico, iniziative come il Virtual Lab di Stanford, Biomni o la piattaforma no profit FutureHouse coprono nicchie simili a quella di Claude Science, senza però la stessa base installata di modelli e la stessa rete di partnership industriali.

La biologia di frontiera resta fuori dal workbench

Qui il pezzo si allaccia a un’altra vicenda dello stesso mese. Quando Anthropic ha lanciato Fable 5 e Mythos 5 il 9 giugno, la biologia era già protagonista, ma da un angolo completamente diverso. Mythos 5, la versione senza le protezioni applicate a Fable, ha mostrato una velocità di scoperta di farmaci circa dieci volte superiore, ha eguagliato o superato ricercatori esperti in compiti di protein design, ha prodotto candidati promettenti per nove target su quattordici testati, e ha condotto ricerca genomica in gran parte autonoma su milioni di cellule appartenenti a 138 specie animali. Numeri che parlano di un salto di capacità, non di uno strumento operativo.

Fable 5, la versione resa pubblica, dirotta invece verso Opus 4.8 qualunque richiesta che tocchi cybersecurity, biologia, chimica o rischi di distillazione: la stessa logica del margine di sicurezza descritta da Anthropic nel post sul redeployment di fine giugno, dove il “safety margin” blocca deliberatamente anche richieste probabilmente innocue pur di non lasciar passare quelle pericolose. L’accesso alla biologia di livello Mythos resta riservato a un programma di trusted access per ricercatori biomedici selezionati, con le protezioni su biologia e chimica rimosse ma quelle cyber ancora attive.

Claude Science, per contro, gira su modelli generalisti senza queste restrizioni verticali: non promette capacità di scoperta di frontiera, promette di eliminare l’attrito tra gli strumenti che un laboratorio già usa. Sono due prodotti nati dalla stessa azienda nello stesso mese che rispondono a due domande diverse. Uno chiede quanto in alto può arrivare un modello sulla biologia computazionale, l’altro chiede quanto tempo si può togliere al lavoro quotidiano di chi la biologia la pratica tutti i giorni in laboratorio.

Claude Science, a chi serve oggi, e chi resta fuori

Il pubblico naturale di Claude Science sono i laboratori accademici e le aziende biotech di piccola e media dimensione che già lavorano con HPC proprio o con Modal, che hanno pipeline consolidate da collegare piuttosto che da ricostruire da zero, e per cui il costo di adozione di un nuovo strumento pesa più della sua potenza teorica. Anthropic lo segnala con chiarezza nel programma di sconto per i team accademici e nei 50 progetti finanziabili con crediti fino a 30.000 dollari, candidature aperte fino al 15 luglio.

Restano fuori, almeno per ora, i gruppi che cercano proprio quella capacità di frontiera su biologia e chimica riservata a Mythos, così come chi non dispone già di un minimo di infrastruttura di calcolo su cui appoggiare l’agente. E resta aperta la domanda su quanto la promessa di riproducibilità regga alla prova di revisori esterni e riviste scientifiche, che di script generati da un agente e verificati da un altro agente non hanno ancora una prassi consolidata di valutazione. Anthropic sembra scommettere che la fiducia si costruisca proprio lì, nell’audit trail che accompagna ogni figura e ogni numero pubblicato.

Partecipa alla community

guest

0 Commenti
Più recenti
Più votati
Inline Feedback
Vedi tutti i commenti

Articoli correlati

0
Lascia un commento, la tua opinione conta.x