Negli ultimi anni, l’attenzione di un numero crescente di ricercatori in Natural Language Processing (NLP) studia i potenziali elementi di criticità presenti nei dataset usati per il pre-training dei Language Model. Uno dei temi principali riguarda la scarsa o assente documentazione di queste risorse computazionali, che spesso vengono descritte in modo generico in molti paper di presentazione dei Language Model.
trasparenza e accessbilità
Dataset per i Language Model: i problemi che l’archivistica aiuta a superare
Il campo del Natural Language Processing (NLP) è sempre più attento alla documentazione dei dataset utilizzati per il pre-training dei Language Model. Nonostante l’applicazione di pratiche derivate dalle scienze archivistiche, questioni come la trasparenza e l’accessibilità delle risorse rimangono irrisolte. Il punto su problemi e progressi della ricerca
Università degli Studi di Torino

Continua a leggere questo articolo
Argomenti
Canali
InnovAttori
-

Come l’AI porta il caffè sulle nostre tavole al tempo della guerra
13 Mar 2026 -

Smart home, l’AI accelera la transizione green: ma occhio alla sicurezza
02 Mar 2026 -

Robotica avanzata: la strategia italiana per competere con Cina e Usa
24 Feb 2026 -

Industria metalmeccanica, se il consulente è la GenAI: il caso Co.Me.T
24 Feb 2026 -

L’AI cambia la fabbrica: ecco i trend più avanzati
23 Feb 2026











