intelligenza artificiale

CMSF: la vulnerabilità nascosta nei modelli di linguaggio avanzati



Indirizzo copiato

CMSF, una nuova forma di manipolazione semantica, sfrutta la coerenza narrativa nei modelli LLM per produrre contenuti sensibili mascherati da simulazioni. Un esperimento rivela l’efficacia di questo fenomeno nel modificare il comportamento del modello

Pubblicato il 10 lug 2025

Daniela Lucia Calabrese

Digital Transformation Expert- SpritzMatter, SpinOff dell’Università di Padova



LLM e RAG nell'automazione Funzionamento dei modelli ai Vulnerabilità dei LLM red-teaming LLM verifica LLM LLM open source introspezione dei modelli linguistici

Il fenomeno del “Compliance Masking via Simulated Framing” (CMSF) rappresenta una vulnerabilità complessa nei modelli linguistici di grandi dimensioni LLM di ultima generazione, in particolare quelli basati su GPT-4.

Continua a leggere questo articolo

Articoli correlati