Dati aperti

Da WikiPA.

I dati aperti, comunemente chiamati con il termine inglese open data anche nel contesto italiano, sono alcune tipologie di dati liberamente accessibili a tutti, senza restrizioni di copyright, brevetti o altre forme di controllo che ne limitino la riproduzione. L'open data si richiama alla più ampia disciplina dell’open government, cioè una dottrina in base alla quale la pubblica amministrazione dovrebbe essere aperta ai cittadini, tanto in termini di trasparenza quanto di partecipazione diretta al processo decisionale, anche attraverso il ricorso alle nuove tecnologie dell'informazione e della comunicazione; e ha alla base un'etica simile ad altri movimenti e comunità di sviluppo "open", come l'open source, l'open access e l'open content. Nonostante la pratica e l'ideologia che caratterizzano i dati aperti siano da anni ben consolidate, con la locuzione "open data" si identifica una nuova accezione piuttosto recente e maggiormente legata a internet come canale principale di diffusione dei dati stessi.

Panoramica generale

Nonostante il concetto di dato aperto non sia nuovo, al momento non si riscontra un accordo generale e condiviso su di una definizione puntuale del termine, a differenza, ad esempio, di quanto già avviene con il software libero, l'accesso aperto o l'open source dove diverse dichiarazioni formali sono state comunemente accettate e condivise a livello internazionale.

Gli open data fanno di frequente riferimento a informazioni rappresentate in forma di database e riferite alla tematiche più disparate, ad esempio: cartografia, genetica, composti chimici, formule matematiche e scientifiche, dati medici e pratica, delle bioscienze, dati anagrafici, dati governativi, ecc. Vi sono alcune difficoltà oggettive che impediscono alla pratica dei dati aperti una larga diffusione. Uno dei problemi principali spesso riguarda il valore commerciale che gli stessi dati, visti sia in forma puntuale che aggregata, possono avere. I dati sono di frequente controllati da organizzazioni, sia pubbliche che private, che spesso mostrano reticenza di fronte alla possibilità di diffondere il proprio patrimonio informativo. Il controllo sui dati può avvenire attraverso limitazioni all'accesso, alle licenze con cui vengono rilasciati, ai diritti d'autore, brevetti e diritti di riutilizzo. Di fronte a queste forme di controllo sui dati, e più in generale sulla conoscenza, i sostenitori dell'Open Data affermano che tali restrizioni siano un limite al bene della comunità e che i dati dovrebbero essere resi disponibili senza alcuna restrizione o forma di pagamento. Inoltre, è importante che i dati, dopo essere stati pubblicati, siano riutilizzabili senza necessità di ulteriore autorizzazione, anche se determinate forme di riutilizzo (come la creazione di opere derivate) può essere controllato attraverso specifiche licenze (ad esempio Creative Commons, GFDL).

Una rappresentazione tipica della necessità dell'apertura dei dati viene proposta in una dichiarazione di John Wilbanks, direttore esecutivo dello Science Commons:

Numerosi scienziati hanno sottolineato con ironia che proprio nel momento storico in cui disponiamo delle tecnologie per consentire la disponibilità dei dati scientifici a livello globale e dei sistemi di distribuzione che ci consentirebbero di ampliare la collaborazione e accelerare il ritmo e la profondità della scoperte... siamo occupati e bloccare i dati e a prevenire l'uso di tecnologie avanzate che avrebbero un forte impatto sulla diffusione della conoscenza.

Inoltre accade spesso che gli stessi creatori di dati sottovalutino l'importanza degli stessi e non considerino la necessità di precisare le condizioni della proprietà intellettuale, delle licenze e del loro riutilizzo. Ad esempio, molti enti (siano essi di natura scientifica o governativa) per mancanza di consapevolezza dell'importanza dei propri dati non prendono in considerazione l'ipotesi di rilasciarli con licenze aperte. La mancanza di una determinata licenza che certifichi la possibilità di riutilizzare i dati rende difficile determinare lo stato di un insieme di dati e ne limita l'uso.

Diritti fondamentali

Secondo i sostenitori del movimento Open data, i dati andrebbero trattati come beni comuni; di seguito alcune delle argomentazione utilizzate a sostegnao di questa tesi:

  • I dati appartengono al genere umano. Esempi tipici sono i genomi, i dati sugli organismi per la scienza medica, dati ambientali e meteorologici, ecc.
  • I dati prodotti dalla pubblica amministrazione, in quanto finanziati da denaro pubblico, devono ritornare ai contribuenti, e alla comunità in generale, sotto forma di dati aperti e universalmente disponibili
  • Restrizioni sui dati e sul loro riutilizzo limitano lo sviluppo della comunità
  • I dati sono necessari per agevolare l'esecuzione di comuni attività umane (ad esempio i dati cartografici, le istituzioni pubbliche, ecc.)
  • In campo scientifico il tasso di scoperta è accelerato da un migliore accesso ai dati.
  • E' essenziale che i dati scientifici siano resi aperti per fare in modo che la scienza sia più efficace e la società ottenga il massimo beneficio dalle ricerche scientifiche.

Definizione

Il progetto Open Definition di Open Knowledge Foundation utilizza la seguente frase per definire dati (e contenuti) aperti: «un contenuto o un dato si definisce aperto se chiunque è in grado di utilizzarlo, ri-utilizzarlo e ridistribuirlo, soggetto, al massimo, alla richiesta di attribuzione e condivisione allo stesso modo».[1]

La definizione, molto sintetica, viene poi meglio esplicata attraverso il documento "Conoscenza Aperta" i cui contenuti sono molto simili a quelli della OSI definition. Si tratta di 11 punti che mettono chiarezza sulle modalità di distribuzione e di accesso a tale informazioni. Fra questi ricordiamo: la possibilità di utilizzare a qualsiasi scopo i dati (quindi eliminando clausole quali la possibilità di lucro) e l'assenza di restrizioni tecnologiche (formati aperti ma anche il servizio d'accesso).

Gli open data nel panorama culturale contemporaneo

Open data rientra in un più ampio movimento di pensiero che mira a difendere i diritti dei cittadini/utenti con iniziative affini, da considerarsi parallele, sovrapporte in alcuni punti.

  • L'Open content è il "padre" dell'Open data: il primo si occupa principalmente di opere creative, il secondo di dati e ricerca scientifica.
  • Il software libero, che ha ispirato l'open content, è incentrato sulla libertà dell'utente oltre che sulla apertura del codice sorgente a beneficio del sistema sociale della produzione e distribuzione di software.
  • L'open source è concentrato sulla sola apertura del codice sorgente (e non sulla sua redistribuzione).

Elementi caratterizzanti

In estrema sintesi si possono individuare alcuni aspetti che caratterizzano un insieme di dati come "aperto":[2]

  • i dati aperti devono essere indicizzati dai motori di ricerca;
  • i dati aperti devono essere disponibili in un formato aperto, standardizzato e leggibile da una applicazione informatica per facilitare la loro consultazione ed incentivare il il loro riutilizzo anche in modo creativo ;
  • i dati aperti devono essere rilasciati attraverso licenze libere che non impediscano la diffusione e il riutilizzo da parte di tutti i soggetti interessati.

Iniziative internazionali sul tema Open data

L'approccio aperto ai dati ha trovato applicazione in diversi paesi; di seguito vengono elencate alcune delle principali iniziative.

Stati Uniti

Una grossa spinta all'affermarsi del movimento Open data in ambito governativo è stata data dall'attuale presiedente degli Stati Uniti d'America Barack Obama con la promulgazione della Direttiva sull'Open government nel dicembre 2009,[3] nella quale si legge testualmente: Fin dove possibile e sottostando alle sole restrizioni valide, le agenzie devono pubblicare le informazioni on line utilizzando un formato aperto (open) che possa cioè essere recuperato, soggetto ad azioni di download, indicizzato e ricercato attraverso le applicazioni di ricerca web più comunemente utilizzate. Per formato open si intende un formato indipendente rispetto alla piattaforma, leggibile dall’elaboratore e reso disponibile al pubblico senza che sia impedito il riuso dell’informazione veicolata. Alla direttiva sopra citata è stato dato un seguito "tangibile" attraverso il sito pubblico Data.gov, lanciato nel maggio 2009 dal "Chief Information Officer" (CIO) dell'amministrazione pubblica statunitense Vivek Kundra. Il sito e stato creato con l'obiettivo principale di raccogliere in un unico portale tutte le informazioni rese disponibili dagli enti statunitensi in formato aperto.

Italia

In Italia si è cominciato a parlare di dati aperti anche grazie al progetto OpenStreetMap. Anche con il fine di creare uno stradario liberamente utilizzabile, tra il 2007 e il 2010 alcune amministrazioni locali, grazie all'iniziativa di volontari (tra cui Merano, Vicenza, Montecchio Maggiore e Schio), hanno pubblicato con licenza aperta i dati dei propri stradari e altri propri dati. Il 18 Ottobre 2011 il portale dati.gov.it è stato messo on line.

La Piemonte nel maggio del 2010 ha realizzato il proprio portale regionale dei dati aperti dati.piemonte.it. Il sito resta al momento la più riuscita e strutturata esperienza nazionale sul tema dei dati aperti. La regione Emilia Romagna ha seguito l'esempio piemontese nel 2011 con il suo sito Open Data.

Nell’ottobre 2010 il Formez ha rilasciato la versione beta della Italian Open Data License caratterizzata da restrizione per uso commerciale. A fronte di varie critiche la licenza è stata revisionata e in maggio 2011 è uscita la versione 1.0 della licenza Italian Open Data License v1.0, prima licenza italiana specificatamente dedicata ai dati pubblici aperti. La IODL è compatibile con i modelli di licenza Creative Commons 2.5 e Open Data Commons. La IODL 1.0 ha le seguenti caratteristiche:

  • è una licenza Share-Alike (è necessario mantenere i lavori derivati sotto la stessa licenza o una delle licenze compatibili);
  • è compatibile (a senso unico) sia con ODbL che con CC-BY-SA 3.0
  • è pensata per la Pubblica Amministrazione.

Open Knowledge Foundation Italia e il Centro NEXA su Internet & Società del Politecnico di Torino offrono il repository it.ckan.net dove chiunque può segnalare i data sets italiani disponibili online. Un servizio analogo è gestito dalla comunità del sito Spaghetti Open Data disponibile alla pagina dei Dati del sito spaghettiopendata.org L'associazione di giornalismo investigativo e Radio Radicale hanno dato il via al primo corso strutturato di Open Data Journalism Sito ufficiale

Voci correlate

Collegamenti esterni

Note

  1. «A piece of content or data is open if anyone is free to use, reuse, and redistribute it — subject only, at most, to the requirement to attribute and share-alike.» http://opendefinition.org
  2. http://opendefinition.org/okd/italiano/
  3. http://www.whitehouse.gov/omb/assets/memoranda_2010/m10-06.pdf
  4. Spaghetti open data reloaded