backup

Dati digitali perduti e altri disastri: cosa è cambiato in vent’anni



Indirizzo copiato

Il “recupero dati” (data recovery) da hard disk o altri dispositivi di archiviazione digitale è un’attività tecnica di soccorso poco conosciuta. Sebbene l’evoluzione della tecnologia delle memorie, la legge di Moore e l’espansione dei cloud abbiano diminuito la necessità di intervento, il disastro è sempre possibile

Pubblicato il 13 dic 2023

Micael Zeller

recuperohd.it, cultura-digitale.com



Cloud,Computing,Cityscape,,Smart,City,,Big,Data,Exchange,Storage,,Online

Chiunque usi un computer dà per scontato che i suoi dati digitali siano sempre disponibili, qualsiasi cosa accada. Solo quando avviene il disastro si rende conto che, in mancanza di backup, dovrà fronteggiare le conseguenze di un danno non sempre rimediabile.

Perciò la ricerca di un servizio di recupero dati avviene sempre in emergenza, dopo che tecnici anche molto esperti di hardware o di software devono riconoscere di trovarsi davanti a un problema “di nicchia” che richiede un intervento molto specializzato.

Dall’interfaccia parallela alla seriale: evoluzione degli hard disk

Negli Anni 2000 i vecchi hard disk EIDE, come pure le prime generazioni di hard disk “Serial ATA”, ospitavano meno di 1 TB di dati, e alcuni di essi col tempo cominciavano a evidenziare malfunzionamenti, di solito sottovalutati dall’utente, spia di guasto di semplice natura logica, fino a quelli più complicati di natura meccanica. In questi casi il perno che vincola il movimento delle testine di lettura comincia a disassarsi di una piccola frazione di grado, e a distruggere alcuni dei milioni di “settori” sulla superficie dei piattelli rotanti. Molti dati diventano illeggibili, o il file system inaccessibile.

In queste condizioni, nella maggior parte dei casi la clonazione dell’hard disk è un compito lungo e non sempre facile.

In metà dei casi, invece, l’hd sembra “sbiellato”, perché all’accensione produce un ripetuto ticchettìo. Questo è il risultato del movimento della testina che rifiuta la traccia madre, non trova più i punti magnetici di repere, non può allinearsi.

La speranza è allora che il guasto riguardi il gruppo delle testine di lettura (che sono di solito da 1 a 8), piuttosto che gli stessi dischi magnetici. Il gruppo testine può essere sostituito con un’operazione molto delicata, accompagnata da ulteriori operazioni manuali, di correzione dell’allineamento, ma anche il più esperto e abile dei tecnici arriva a rimediare meno della metà dei casi; negli altri la traccia magnetica è irrimediabilmente persa.

Col passar degli anni gli hard disk SATA hanno soppiantato i vecchi EIDE, ma è poi intervenuta una novità: i nuovi modelli, nella piastra logica che controlla il funzionamento del disco ed è avvitata dietro l’hard disk (PCB), contengono un circuito che, durante il processo di memorizzazione cripta i dati in tempo reale con un algoritmo esclusivo.

Questa criptica innovazione permette di imporre, volendo, una password all’accensione dell’hard disk. Il problema è che, se il PCB si guasta, sostituendolo con un PCB buono dello stesso modello l’hard disk diventa illeggibile. Il problema non si risolve senza dissaldare lo specifico chip originale, sperando che sia sano, per saldarlo sul PCB buono.

La grande varietà di problematiche nel recupero dati

Ma il ripristino dell’hard disk non esaurisce il lavoro di recupero. Nei decenni scorsi molte aziende usavano server contenenti tre o più hard disk in “RAID”. I dati contenuti sono distribuiti negli hard disk secondo un concatenamento ridondante, efficiente, teoricamente molto sicuro, ma anche molto cervellotico. Nel recupero dei dati di un RAID guasto il problema più arduo non era il ripristino dei singoli hard disk, ma nella ricostruzione della sequenza dei dati distribuiti. Occorreva scrutare per ore i dati grezzi, a basso livello, alla ricerca di discontinuità nei dati, sintomo di fine di una “striscia” e inizio di un’altra “striscia”, cioè di blocchi di dati, la cui grandezza è una potenza di 2 a priori ancora da scoprire.

Per esempio, se si nota che un blocco finisce con i byte ASCII “Chiunque abbia un computer dà per scon”, si potrebbe trovare, negli altri dischi che compongono il RAID, un blocco iniziante con “tato che i suoi dati…”. La ricerca è complicata dalla ricorrenza di blocchi interpolati di “parità”, che contengono i blocchi corrispondenti degli altri dischi, ma confusi.

Una volta scoperta la sequenza il problema è risolto: un lavoro di ricerca ideale per un LLM delle attuali intelligenze artificiali, ma negli Anni Duemila non esistevano software specializzati.

C’è chi immagina che per recuperare un hard disk ciò che conta sia di lavorarlo in una camera “bianca”, priva di polveri sottili in sospensione. In realtà la camera bianca è solo un ambiente pulito dove aprire un hard disk.

Il lavoro di recupero dati si svolge su una grande varietà di hard disk (per esempio SCSI o SAS) e di altri dispositivi, che richiedono un armamentario di attrezzature, e su una grandissima varietà di problemi, talvolta unici. Come dice Peter Dinhofer, un esperto di lunga data in questo campo, la tecnica non basta: è spesso necessario intuito artistico.

Per esempio un recuperatore, esaminando un hard disk a basso livello, notò che i file di Microsoft Office, contenevano in ogni “header” la scritta “Migrosoft”. Questa storpiatura sembrava uno scherzo, e non poté trovare alcun caso analogo a questo, finché non scoprì che uno dei quattro canali per cui passavano i dati si era guastato, corrompendo così un byte ogni 8, o ogni 16…

Cambiamenti dei file e sfide del ripristino

Il ripristino dei dati desiderati dall’utente richiede spesso ricerche ulteriori. Per controllare l’integrità dei file che interessano all’utente, il recuperatore deve installare le specifiche applicazioni, assai svariate: per esempio per controllare i file di AutoCAD di uno studio di ingegneri, o i file DICOM delle indagini radiografiche di un ospedale.

Ma anche i formati di file si evolvono (come del resto i file system). Nei lustri passati se l’hard disk di uno scrittore si guastava parzialmente, con pazienza era possibile recuperare anche tutto il libro in lavorazione, a pezzetti, cercandoli con parole-chiave. Ma i vecchi file di Office (.DOC , . XLS…) sono attualmente soppiantati da .DOCX , .XLSX, .ODT ecc. Questi file sono in realtà file .ZIP, ed, essendo compressi, se corrotti diventano interamente illeggibili.

Chip misteriosi: una scoperta inquietante

Con l’evoluzione degli hard disk (secondo la legge di Moore) nel 2010 iniziò la produzione di hard disk da 1 TB, cui seguirono quelli da 2TB. Alcune componenti del PCB avvitato sul loro retro suscitò la curiosità di uno studioso, un hacker olandese

che decise di esaminare accuratamente i chip montati, e fece un’interessante scoperta: alcuni di essi sono i grado di controllare totalmente l’hard disk. Opportunamente programmati, possono bloccarlo impedendone la lettura a basso livello. O possono passare invisibilmente delle password. Infine, uno di questi chip può contenere un sistema operativo Linux. Sembrano gli strumenti perfetti per una potenza malefica che voglia bloccare tutti i computer del mondo, o prenderne il controllo.

I personal computer attuali montano invece “dischi” a stato solido (SSD), oramai molto veloci anche in scrittura ed economici. Ci si può chiedere se contengano chip potenzialmente spioni o peggio malevoli, ma comunque i componenti di un SSD sono molto opachi, inoltre usano algoritmi cifrati e quindi in caso di guasto anche smontandoli sarebbe illusorio sperare di decifrarli o recuperarne i dati. In caso invece di dati cancellati per sbaglio la loro ricerca è complicata dal “trim”, cioè la funzione automatica che cancella le celle di memoria flash che, considerate vuote dagli indici, potrebbero ancora contenere preziosi dati “cancellati”. A tempo perso, il trim sbianca definitivamente le zone di memoria oramai ignorate dal file system per velocizzare il loro prossimo riuso. Alcuni SSD sono tanto diligenti da dedicarsi al trim anche a computer spento.

Gli hard disk magnetici non sono affatto tramontati, anzi, la maggior parte dei dati digitali nel mondo si trova negli hard disk dei data center. Col passare degli anni sono diventati più efficienti e più robusti: è più raro che si guastino, ma quando lo fanno risultano più spesso irreparabili.

Cloud e prevenzione dei disastri

La disponibilità di nuvole informatiche ha reso per molti più pratico il backup, diminuendo così i casi di necessità di recuperi. Il backup su cloud ha inoltre (per ora) il pregio di mettere i dati al riparo della minaccia più odiosa che imperversa in questi anni: il ransomware.

Troppi utenti lasciano le loro memorie collegate col server, il che permette ai software criminali di cifrare anche le riserve. Per evitarlo, basta staccare fisicamente i dispositivi di backup dopo la copiatura dei dati.

Un settore in cui si manifesta spesso la necessità di recupero dati è quello della produzione video. Dallo shooting al riversamento del girato la schedina flash della videocamera può subire diversi tipi di incidenti. In caso di danno parziale, la difficoltà consiste nel ricostruire l’indice del singolo spezzone per poterlo restaurare.

Conclusioni

“In questo hard disk c’è tutta la mia vita”. Questa frase, un po’ esagerata, rappresenta spesso l’angoscia espressa da chi ha visto svanire le proprie fotografie e gli altri documenti.

I dati digitali non sono preziosi solo per le Big Tech, ma per tutti. Prevenire un disastro è facile; rimediarvi, costoso e incerto.

EU Stories - La coesione innova l'Italia

Tutti
Social
Iniziative
Video
Analisi
Iniziative
Al via il progetto COINS
Eventi
Un nuovo sguardo sulla politica di coesione dell'UE
Iniziative
Parte la campagna di comunicazione COINS
Interviste
Marco De Giorgi (PCM): “Come comunicare le politiche di coesione”
Analisi
La politica di coesione europea: motore della transizione digitale in Italia
Politiche UE
Il dibattito sul futuro della Politica di Coesione
Mobilità Sostenibile
L’impatto dei fondi di coesione sul territorio: un’esperienza di monitoraggio civico
Iniziative
Digital transformation, l’Emilia-Romagna rilancia sulle comunità tematiche
Politiche ue
Fondi Coesione 2021-27: la “capacitazione amministrativa” aiuta a spenderli bene
Finanziamenti
Da BEI e Banca Sella 200 milioni di euro per sostenere l’innovazione di PMI e Mid-cap italiane
Analisi
Politiche di coesione Ue, il bilancio: cosa ci dice la relazione 2024
Politiche UE
Innovazione locale con i fondi di coesione: progetti di successo in Italia
Iniziative
Al via il progetto COINS
Eventi
Un nuovo sguardo sulla politica di coesione dell'UE
Iniziative
Parte la campagna di comunicazione COINS
Interviste
Marco De Giorgi (PCM): “Come comunicare le politiche di coesione”
Analisi
La politica di coesione europea: motore della transizione digitale in Italia
Politiche UE
Il dibattito sul futuro della Politica di Coesione
Mobilità Sostenibile
L’impatto dei fondi di coesione sul territorio: un’esperienza di monitoraggio civico
Iniziative
Digital transformation, l’Emilia-Romagna rilancia sulle comunità tematiche
Politiche ue
Fondi Coesione 2021-27: la “capacitazione amministrativa” aiuta a spenderli bene
Finanziamenti
Da BEI e Banca Sella 200 milioni di euro per sostenere l’innovazione di PMI e Mid-cap italiane
Analisi
Politiche di coesione Ue, il bilancio: cosa ci dice la relazione 2024
Politiche UE
Innovazione locale con i fondi di coesione: progetti di successo in Italia

Articoli correlati