Inganno Unicode

Caratteri invisibili nel codice e nei prompt IA: rischi e difese

Caratteri invisibili, omoglifi e normalizzazione Unicode possono alterare ciò che leggiamo e ciò che i sistemi eseguono. Dal Trojan Source alla prompt injection nei modelli generativi, il rischio cresce quando revisione umana, parsing e tokenizzazione producono interpretazioni diverse dello stesso testo

Pubblicato il 25 mar 2026

Aggiungi tra i preferiti su Google

Massimo Dionisi

Terrorism and Counterterrorism

programmare codice con IA (1) Informatica e AI

Ogni riga di codice può nascondere un’illusione: spesso quella che vediamo non è la stessa che il computer esegue (Cambridge, 2021). È il cuore degli attacchi “Trojan Source”, scoperti da ricercatori di Cambridge: inserendo caratteri Unicode speciali invisibili o bidirezionali in punti strategici, un revisore umano vede un testo innocuo mentre il compilatore esegue altro. Queste tecniche non si fermano al software tradizionale: nelle applicazioni di intelligenza artificiale generativa, caratteri invisibili (bidirezionali, a larghezza zero, omoglifi) e differenze di normalizzazione possono camuffare comandi o forzare parsing diversi, aprendo la strada a prompt injection (OWASP, 2024).

@RIPRODUZIONE RISERVATA

Massimo Dionisi

Terrorism and Counterterrorism

Analista geopolitico ed esperto di sicurezza, con focus su terrorismo, cyberterrorismo e impatto delle tecnologie emergenti sugli equilibri internazionali. Si occupa di analisi strategica legata alla competizione per le materie prime critiche, alla sicurezza digitale e alle implicazioni per l’Europa e l’Italia. Affianca all’attività di ricerca e scrittura un impegno nella divulgazione sui temi della cybersecurity e dell’innovazione applicata alla sicurezza.

Seguimi su