intelligenza artificiale

L’IA che valuta se stessa: promessa o paradosso?

La valutazione dei modelli di AI generativa presenta sfide complesse: dalla contaminazione dei dati alla sensibilità dei prompt. I test tradizionali mostrano limiti evidenti e emerge una soluzione controversa: affidare il giudizio agli stessi sistemi di intelligenza artificiale

Pubblicato il 27 ott 2025

Bernardo Magnini

Fondazione Bruno Kessler

AGI benchmark intelligenza artificiale generale valutazione dei modelli di IA AI coding assistant Governance dei dati AI

Come distinguere un buon modello di AI generativa da uno scarso? Quali sono i test a nostra disposizione, e quanto sono affidabili? Domande tutt’altro che scontate, tanto più che le risposte possono influenzare l’esito della battaglia commerciale miliardaria tra le “big tech” per la supremazia nel settore dell’IA.

@RIPRODUZIONE RISERVATA