Dati sui dati

Eric Schmidt (Google) ha recentemente affermato che nel 2010 è stata creata una quantità di dati superiore a quella prodotta complessivamente dall’uomo negli ultimi 30.000 anni. Per capire di cosa parla bisogna innanzitutto chiarire che per dato informatico si intende «qualsiasi rappresentazione di fatti, informazioni o concetti in una forma che può essere trattata da un sistema di informazione…». Questa è la definizione codificata a livello internazionale. Dunque nel corso del solo 2010 sono state prodotte rappresentazioni informatiche di fatti, informazioni e concetti in quantità superiore a quanto rappresentato dall’uomo negli ultimi 30 mila anni di storia.

Il “dato” è impressionante, e può esser accompagnato da alcune ulteriori considerazioni relative all’evoluzione dei supporti di archiviazione di questa inimmaginabile massa di informazioni. Un conto infatti è la produzione di “dati informatici”, che sono la materia prima dei sistemi informativi (computer e reti) e che si auto-generano esponenzialmente ad ogni connessione ed a ogni comunicazione, ed un conto è l’archiviazione in vista di un loro utilizzo o riutilizzo.

Nel 1984 un hard disk standard conteneva circa 10 MB di dati: 2.500 pagine dattiloscritte. Archiviare musica e video aveva costi all’epoca proibitivi. 1 GB di spazio costava a metà anni ’80 circa 85.000 dollari  (in valuta attuale, al cambio corrente: 65.000 €). Oggi 1 GB di spazio ha un costo di circa tre centesimi di euro e molto spesso è all’utente offerto gratuitamente; o meglio, è offerto in cambio di un po’ dei suoi dati.

Nel 1999 un lettore MP3 conteneva circa un’ora di musica, al prezzo medio negli Stati Uniti di circa 300 dollari. Oggi un disco esterno da 3 terabyte (3072 GB) costa all’utente finale circa 200 € e può contenere 700 mila brani musicali in formato di buona qualità. E stiamo parlando solo dei supporti nella disponibilità di privati cittadini, disseminati in miliardi di connessioni in rete. I costi di sola archiviazione dei dati sono diminuiti negli ultimi 30 anni in media con un fattore 10 ogni 4,2 anni. È probabile che la tendenza al ribasso possa proseguire in futuro.

Archiviare 30.000 anni di dati prodotti nel solo 2010 diventa così affermazione in qualche modo più accettabile e comprensibile, pur nella difficoltà, almeno mia, di immaginare l’enorme database costituito dal Web 3.0, ovvero dall’intera massa di dati disseminata sulla rete, potenzialmente trattabili da chiunque, da ogni luogo della terra. Sono intuibili le potenzialità di questa inedita capacità di memorizzazione.

Ancora qualche dato tratto da un recente articolo apparso su Brookings. Oggi, archiviare il tracciamento GPS di un milione di persone, 24 ore al giorno, sette giorni su sette, per un intero anno, con memorizzazione della posizione rilevata dal satellite ogni 5 minuti ha un costo approssimativo di circa 39 €. Monitorare un’intera popolazione di circa 60 milioni di abitanti, l’Italia, comporterebbe una spesa, per lo spazio di archiviazione, di qualche migliaio di euro. Ed ormai tutti abbiamo in tasca un cellulare atto a geolocalizzarci.

Memorizzare il contenuto delle telefonate di una persona per un intero anno, ipotizzando una media di circa un’ora di conversazione al giorno, può occupare circa 3,3 GB di spazio: più o meno 13 centesimi. Il governo siriano di Bashar Al-Assad ha acquistato proprio da un’azienda italiana un sistema di captazione di tutte le comunicazioni elettroniche. Registrare le conversazioni di 14 milioni di persone, ovvero l’intera popolazione siriana di età superiore ai 14 anni, per un anno ha un costo di archiviazione stimabile in circa 2,5 milioni di dollari. Non molto per uno stato sovrano. Se poi l’andamento dei costi dovesse confermare il trend degli ultimi 30 anni, nel 2016 il costo sarebbe di circa 250.000 dollari e nel 2020 di 25.000.

In Cina la città di Chongqing possiede un network di 500.000 videocamere per 12 milioni di abitanti. Una videocamera ogni 24 residenti. Archiviare per un anno tutte le immagini comporta ad oggi un costo spropositato, ma riducendo la qualità delle immagini e supponendo una decrescita costante dei costi di archiviazione, è ipotizzabile nel 2020 di poter coprire la spesa con una micro tassa “per la sicurezza” di soli 20 centesimi di euro ad abitante. Sono certo che qualche sindaco del nord Italia un pensiero lo farebbe.

I dati, ovvero la rappresentazione di fatti, informazioni e concetti, siano essi analogici o informatici, sono da sempre la materia prima da cui si estrae sapere e conoscenza. Per dirla con Dante, noi siam fatti per seguire virtù e conoscenza. Per la conoscenza ben si comprende la straordinaria opportunità del nostro tempo; quanto alla virtù, allo stato non è ancora stata digitalizzata…

Mi fermo qui. Stupefatto e inquieto.

 

Carlo Blengino

Avvocato penalista, affronta nelle aule giudiziarie il diritto delle nuove tecnologie, le questioni di copyright e di data protection. È fellow del NEXA Center for Internet & Society del Politecnico di Torino. @CBlengio su Twitter