Inganno Unicode

Caratteri invisibili nel codice e nei prompt IA: rischi e difese



Indirizzo copiato

Caratteri invisibili, omoglifi e normalizzazione Unicode possono alterare ciò che leggiamo e ciò che i sistemi eseguono. Dal Trojan Source alla prompt injection nei modelli generativi, il rischio cresce quando revisione umana, parsing e tokenizzazione producono interpretazioni diverse dello stesso testo

Pubblicato il 25 mar 2026

Massimo Dionisi

Terrorism and Counterterrorism



programmare codice con IA (1) Informatica e AI

Ogni riga di codice può nascondere un’illusione: spesso quella che vediamo non è la stessa che il computer esegue (Cambridge, 2021). È il cuore degli attacchi “Trojan Source”, scoperti da ricercatori di Cambridge: inserendo caratteri Unicode speciali invisibili o bidirezionali in punti strategici, un revisore umano vede un testo innocuo mentre il compilatore esegue altro. Queste tecniche non si fermano al software tradizionale: nelle applicazioni di intelligenza artificiale generativa, caratteri invisibili (bidirezionali, a larghezza zero, omoglifi) e differenze di normalizzazione possono camuffare comandi o forzare parsing diversi, aprendo la strada a prompt injection (OWASP, 2024).

Continua a leggere questo articolo

Articoli correlati

0
Lascia un commento, la tua opinione conta.x