Wikidata, un database universale

Poche righe descrivono questo marchio sul sito in lingua inglese di Wikipedia:

“Wikidata is a proposed project to provide a collaboratively edited database to
support Wikipedia. The project is being started by Wikimedia Deutschland and is intended to provide a common source of certain data types, for example, birth dates, a class of validated data, which can be used in all other articles on Wikipedia. It will be the first new project of the Wikimedia Foundation since 2006.”

Wikipedia Deutschland, la sezione tedesca del movimento Wikimedia, sta
sviluppando un database collaborativo che possa essere letto e scritto sia da umani che
da macchine.

Sviluppare un database che possa essere letto in modo automatico porterà non
solamente grande innovazione al web, ma aiuterà molto la stessa Wikipedia:
Wikipedia supporta infatti più di 280 lingue che avranno così una comune
fonte di dati strutturati. Questi dati potranno essere utilizzati in tutti gli articoli
dell’enciclopedia libera più importante del web. L’idea è quella di spostare tutti i
dati nelle “infobox” (ovvero i riquadri sulla destra di alcune pagine di Wikipedia):
Wikidata aggiungerà le informazioni agli infobox ovunque essi appaiano. Ovviamente
alcune cose potrebbero essere diverse da come descritte, in quanto il progetto è ancora
in corso.

I dati saranno pubblicati sotto licenza Creative Commons, in modo che possano essere
utilizzati per diverse applicazioni (per esempio quelle di e-governance) o per scambi
di dati scientifici rilevanti.

Il progetto Wikidata sarà sviluppato in tre fasi.
La prima (fine prevista per Agosto 2012) unirà i link delle diverse versioni
linguistiche di Wikipedia, creando una fonte comune di dati strutturati che potrà
essere usata in tutti gli articoli. In questo modo tutti i dati saranno registrati e
immagazzinati in un solo posto.
Con la seconda fase (Dicembre 2012) gli editors saranno in grado di aggiungere e
utilizzare dati in Wikidata.
L’ultima fase permetterà infine la creazione di liste e grafici (che potranno essere
presenti sulle stesse pagine di wikipedia) in modo automatico basandosi sui dati
presenti in Wikidata.

Wikimedia Deutschland avrà il compito di curare Wikidata fino a Marzo 2013,
successivamente il proprietario di questo progetto sarà Wikimedia Foundation.

La seconda finalità del progetto è quella di permettere agli utenti di porre differenti
tipologie di domande (per esempio, quale è il più giovane primo ministro europeo?).
Ad oggi, l’unico modo per rispondere a tali domande è di creare manualmente una
lista; con Wikidata, si avranno automaticamente tali liste.
Non è una coincidenza che il leader del team di sviluppatori sia il dottor Denny

Vrandečić (Karlsruhe Institute of Technology), che è il co-fondatore (insieme a
Markus Krötzsch) del progetto Semantic MediaWiki, che ha inseguito lo stesso
obiettivo di Wikidata negli ultimi anni.

Nella definizione di Wikipedia su Wikidata c’è un’ulteriore frase: “The creation
of the project was founded by donations from the Allen Institute for Artificial
Intelligence, the Gordon and Betty Moore Foundation, and Google, Inc., totaling
€1.3 million”.

Metà della cifra è stata donata da Allen Institute for Artificial Intelligence,
l’organizzazione creata nel 2010 dal co-fondatore di Microsoft Paul Allen. Questo
instituto promuove attività a lungo termine per ricerche finalizzate ad accellerare i
progressi nel campo dell’intelligenza artificiale (come il web semantico).
Il 25% degli investimenti provengono dalla Gordon and Betty Moore Foundation,
attraverso il Science Program.
Il restante 25% dei fondi è stato fornito da Google, Inc.: “Google’s mission is to
make the world’s information universally accessible and useful” riferisce il direttore
dell’Open Source di Google, Chris DiBona. “We’re therefore pleased to participate in
the Wikidata project which we hope will make significant amounts of structured data
available to all”.
Google ha ovviamente un grande interesse per questo progetto: grazie al database
semantico centralizzato, saranno in grado di fornire risposte immediate a domande
comuni.
Se si svilupperà ulteriormente nel campo delle ricerche semantiche, Google potrebbe
dare risposte immediatamente, così che gli utenti spenderanno maggior tempo su
Google che su altri siti.

Wikidata, a worldwide database

Only few lines describe this brand project on the Wikipedia website:

“Wikidata is a proposed project to provide a collaboratively edited database to
support Wikipedia. The project is being started by Wikimedia Deutschland and is intended to provide a common source of certain data types, for example, birth dates, a class of validated data, which can be used in all other articles on Wikipedia. It will be the first new project of the Wikimedia Foundation since 2006.”

Wikimedia Deutschland, the German section of the Wikimedia movement, is now
developing a collaboratively database of the world’s knowledge that can be read and
edited by humans and machines alike.

Developing a machine-readable database doesn’t just help push the web forward,
it also helps Wikipedia itself: Wikidata will support more than 280 languages with
one common source of structured data that can be used in all articles of the free
encyclopedia. Infact, the idea is for the data to live in the “info box” (on the right side
of some Wikipedia pages): Wikidata will drive the info boxes wherever they appear.
Obviously some details can change because the project is still in progress.

The data will be published under a free Creative Commons license, so they can be
used for different applications, for example e-government, or to connect data in the
sciences.

Wikidata project will be developed in three phases.
The first one (finished in August 2012) centralizes links among different language
versions of Wikipedia, creating a common source of structured data that can be used
in all articles. In this way all the data would be recorded and maintained in one place.
In the second phase (December 2012) editors will be able to add and use data in
Wikidata.
The last phase will allow for the automatic creation of lists and charts based on the
data in Wikidata which will be present in the pages of Wikipedia.
Wikimedia Deutschland cares for Wikidata until March 2013, before Wikimedia
Foundation will be the owner of this project.

A second purpose of Wikidata project is to enable users to ask different types of
questions (e.g. who is the youngest prime minister in Europe?). Today the only way
to answer those types of questions is to create manually a list; Wikidata will be able to
create these lists automatically.
It’s not a coincidence that the leader of the eight developers team is Dr. Denny
Vrandečić, from the Karlsruhe Institute of Technology. In fact, together with
Dr. Markus Krötzsch, he is co-founder of the Semantic MediaWiki project, which has
pursued the goals of Wikidata for the last few years.

There is one more sentence in the Wikipedia definition of Wikidata:

“The creation of the project was founded by donations from the Allen Institute for
Artificial Intelligence, the Gordon and Betty Moore Foundation, and Google, Inc.,
totaling €1.3 million.”

50% of the total investment has been donated by the Allen Institute for Artificial
Intelligence, the organization established by Microsoft co-founder Paul Allen in 2010.
This organization supports long-range research activities that have the potential to
accelerate progress in artificial intelligence (like web semantics).
One quarter of the funding comes from the Gordon and Betty Moore Foundation,
through its Science Program.
The last quarter has been provided by Google, Inc.: “Google’s mission is to make the
world’s information universally accessible and useful” said Director Chris DiBona,
Open Source at Google. “We’re therefore pleased to participate in the Wikidata
project which we hope will make significant amounts of structured data available to
all”.
Google has certainly a big interest in this project: thanks to a centralized semantic
database they will be able to provide direct answers to common queries. As it moves
further into semantic search, Google could provide answers itself so that people
would spend more time on Google than on detailed websites.