Ho iniziato a occuparmi di standard più o meno verso il 2007, subito dopo l’approvazione di Open Document Format (ODF) da parte di ISO/IEC, come ISO/IEC 26300:2006. L’inattesa decisione dello Stato del Massachusetts, che aveva adottato ODF per tutti i documenti pubblici, aveva scatenato Microsoft nella rincorsa allo sviluppo di un proprio formato per i documenti Office, in alternativa a ODF.

All’epoca ero attivo all’interno del progetto OpenOffice ma la mia cultura sugli standard aperti era limitata, perché fino a quel giorno avevo avuto nei confronti degli standard lo stesso atteggiamento che ancora oggi ha la maggioranza degli utenti, e quindi li avevo ignorati, perché non avevo compreso il loro ruolo determinante per l’innovazione, lo scambio trasparente dei contenuti tra utenti, e l’indipendenza dalle strategie commerciali delle aziende.

Avevo seguito solo la parte finale del processo di standardizzazione di ODF, e questo significa che mi ero perso la parte più importante, ovvero quella relativa alla trasformazione del formato proprietario dei documenti OpenOffice – basato su XML – in un formato aperto sviluppato da un consorzio neutrale sulla base di un consenso trasparente tra chi sviluppa e chi utilizza il software, e basato su uno schema XML che rispetta le due principali caratteristiche del linguaggio: essere “human readable” e privilegiare la chiarezza rispetto alla sintesi.

Lo schema XML

Lo schema XML rappresenta la sintassi del linguaggio: per fare degli esempi comprensibili anche per chi non lo conosce, le etichette che descrivono le parti (tag) devono essere facilmente comprensibili, come per esempio è <text> e non <w> per il testo, e devono evitare inutili contrazioni, come fa <fo:color> e non <w:color w:val> per introdurre un colore (“fo” per format è una contrazione abituale nelle etichette XML).

Tutto questo però io non lo sapevo, per l’atteggiamento superficiale di cui sopra, per cui quando vengo coinvolto all’ultimo momento in una riunione Uninfo – ISO in Italia – per sostituire l’abituale delegato italiano del progetto OpenOffice, vado più per ascoltare e riportare quanto detto dagli altri che per occuparmi del tema, senza immaginare che questo mi avrebbe appassionato tanto da studiarlo e diventare quasi un esperto.

Ovviamente, non ricordo tutti i dettagli di quel grigio pomeriggio invernale, ma ricordo la mia sorpresa nello scoprire la complessità di un argomento che fino ad allora avevo completamente ignorato, e nell’intuire – in modo ancora sommario – la portata degli interessi commerciali che si celavano dietro al formato dei file per la produttività individuale gestiti da Microsoft Office (e per riflesso anche dalle suite per ufficio concorrenti come OpenOffice).

Fino a quel giorno avevo pensato, ingenuamente, che la battaglia tra i programmi per la produttività individuale si giocasse sulle funzionalità, che influenzavano le scelte degli utenti, ma dopo il primo scambio di opinioni tra l’esponente IBM e quello Microsoft avevo capito che era il formato dei file ad “ammanettare” gli utenti e a condizionare in modo determinante le loro scelte.

Chi controlla il formato dei file controlla il mercato

In effetti, avrei dovuto capirlo prima, perché era evidente da tempo che il formato dei documenti sarebbe diventato un fattore determinante per l’interoperabilità e lo scambio trasparente dei contenuti all’interno di un ambiente di lavoro sempre più digitalizzato. Quindi, chi controllava il formato dei file controllava gli utenti, e come conseguenza anche il mercato.

Un mercato che, a dispetto di tutte le previsioni sul fatto che le suite per ufficio sarebbero scomparse e sarebbero state sostituite da altre applicazioni non meglio identificate, continua a crescere con un tasso annuo che gli analisti stimano nel 5%, e nel 2025 avrà un valore superiore a 31 miliardi di dollari (dove il margine è superiore – per essere cauti – al 50%). Un bel gruzzolo, per un’azienda che ha una quota di quel mercato superiore al 50%, come Microsoft.

ODF vs OOXML

Uscendo dalla riunione Uninfo, che per me aveva avuto lo stesso effetto di un elettroshock, avevo speso per diversi giorni una parte consistente del mio tempo alla ricerca di tutte le informazioni disponibili sull’argomento degli open standard e sui due processi di standardizzazione dei formati: quello rispettoso delle regole di ODF, e quello devastante – per l’assoluta mancanza di rispetto di ogni regola in materia di standardizzazione, e non solo di un formato aperto ma di uno standard tout court – di OOXML (Office Open XML ovvero DOCX, XLSX e PPTX, per usare termini conosciuti dagli utenti).

In pochi giorni, avevo scoperto un universo di informazioni a me totalmente sconosciuto, e una serie di personaggi che avrei poi conosciuto in modo diretto o virtuale, e dei quali ho raccolto – nel corso degli anni – tutti i contributi, che oggi ho iniziato a indicizzare un po’ per evitare che vengano persi e un po’ con la speranza che la loro presenza all’interno di un corpus organizzato contribuisca ad aumentare la conoscenza e la consapevolezza del problema a livello globale.

Parliamo di circa 5.000 documenti, da quelli che parlano dell’importanza degli standard – dove il massimo esponente è la professoressa olandese Tineke Egyedi con i suoi collaboratori – a quelli che descrivono gli orrori del processo OOXML raccolti nel blog di Andy Updegrove, da quelli che descrivono il processo di sviluppo di XML (blog di Tim Bray) a quelli che analizzano ODF verso OOXML scritti soprattutto da Rob Weir, probabilmente il maggiore esperto mondiale, che IBM ha immolato sull’altare di Apache OpenOffice, e poi ha eliminato perché reso “inutile” dal fallimento di quest’ultimo progetto (che aveva l’obiettivo di non lasciare la leadership sul formato ODF alla comunità LibreOffice, a conferma di quanto scrivevo sopra sul ruolo strategico del formato dei documenti).

I cinque elementi che distinguono uno standard aperto da uno proprietario

Ovviamente, sintetizzare tutti questi documenti in un solo articolo è del tutto impossibile, per cui – prima di ritornare sull’argomento con approfondimenti su temi specifici, o su dettagli degli standard rilevanti per l’attività degli utenti e per la difesa dei loro diritti digitali – oggi fornirò solamente i cinque elementi che contraddistinguono uno standard aperto rispetto a uno proprietario, fermo restando che solo uno standard aperto protegge gli utenti dalle strategie commerciali delle aziende.

I cinque elementi sono riassunti nel glossario delle “linee guida su acquisizione e riuso di software per le pubbliche amministrazioni” pubblicate da AgID nel 2019:

1. Formato di dato pubblico: sia ODF che OOXML sono descritti in un documento disponibile al pubblico;

2. Formato versionato: solo i documenti ODF contengono al loro interno l’indicazione della versione dello standard con cui sono stati creati;

3. Formato documentato esaustivamente e senza vincoli all’implementazione: tanto ODF che OOXML sono descritti in modo esauriente, ma solo nel caso di ODF la descrizione viene aggiornata in occasione della nuova versione dello standard;

4. Formato riconosciuto da un ente di standardizzazione e mantenuto in modo condiviso tra più organizzazioni che forniscono implementazioni concorrenti, con un processo trasparente: sia ODF che OOXML sono riconosciuti da ISO/IEC, ma mentre ODF è gestito dal consorzio indipendente OASIS con il contributo di diverse organizzazioni (tra cui Microsoft), OOXML è gestito da ECMA – ente che raccoglie molte aziende che intrattengono relazioni commerciali con Microsoft – con un processo privato;

5. Formato coerente con la versione dichiarata: mentre nel caso di ODF è possibile verificare la coerenza con la versione dello standard dichiarata, nel caso di OOXML questo è impossibile, anche perché la sintassi XML viene modificata periodicamente senza nessun tipo di documentazione, ed è diversa in base alla versione di Microsoft Office da cui è stata generata.

Conclusioni

Per il momento, sorvolo sul fatto che il formato OOXML Transitional usato da Microsoft Office dal 2007 in avanti non viene considerato standard nemmeno da ISO/IEC, in quanto doveva essere abbandonato – così come aveva promesso la stessa Microsoft – nel 2008, mentre viene allegramente mantenuto anche nel 2022 (a svantaggio degli utenti, che sono convinti di utilizzare un formato standard e invece ne utilizzano uno proprietario e assolutamente non standard).

Concludo con un’ultima differenza tra i due formati, che riguarda il riuso degli standard esistenti: mentre ODF riutilizza tutti gli standard esistenti, per cui la sua documentazione è più contenuta in quanto non deve descrivere tutte queste parti, nel caso di OOXML vengono usati numerosi formati proprietari Microsoft, che non fanno che aumentare le dimensioni della documentazione e rendono più complessa o addirittura impossibile l’interoperabilità.

E questo è solo l’inizio. Ci vorrà un po’ di tempo, e qualche altro articolo, perché ODF – l’unico standard aperto per i documenti – diventi un po’ meno sconosciuto.

