Wikidata

Aus InkluPedia

Wikidata ist ein Projekt der US-amerikanischen gemeinnützigen Wikimedia Foundation. Es ist eine frei nutzbare und bearbeitbare Wissensdatenbank auf Basis von MediaWiki, die z. B. in den Wikimedia-Projekten genutzt werden können. Aber auch andere Projekte können die Daten nutzen. Alle strukturierten Daten des Haupt-, Eigenschaften-, Lexem- und EntitySchema-Namensraums sind unter der Creative Commons CC0 Lizenz verfügbar.[1] Stand 23. Juni 2021 hatte Wikidata bereits über 94.000.000 Datenobjekte.[2]

Wikidata
Logo
Motto Die freie Wissensdatenbank, die jeder bearbeiten kann
Wikiprojekt zur Zentralisierung von Daten und Fakten
Sprachen mehrsprachig
Betreiber Wikimedia Foundation
Registrierung optional
Online 30. Oktober 2012
wikidata.org

Aufbau

Wikidata läuft auf MediaWiki, das durch der Erweiterung Wikibase mit strukturierten Daten umgehen kann.[3] Wikibase besteht aus dem Wikibase Repository, in dem die Daten abgelegt und verwaltet werden, und der dazugehörigen Wikibase Client-Extension für MediaWiki, mit dem man auf das Repository zugreifen kann.[4] Der Hauptnamensraum der Wikidata ist eine Sammlung von Objekten, die mit dem Präfix „Q“ bezeichnet werden. Die Objekte bestehen aus beliebig vielen Aussagen und Behauptungen, die mit dem Präfix „P“ (für Property) bezeichnet werden. Diese können mit Qualifikatoren weiter präzisiert werden. Im Zuge der Integration des Wikipedia-Schwesterprojekts Wiktionary wurde die Möglichkeit geschaffen, auch Lexeme als Datenobjekte anzulegen.

 
Datenmodel eines Objekts in Wikidata mit ausgeklappter Fundstelle und einer Aussagengruppe


Geschichte

Das Projekt Wikidata wurde erstmals im September 2004 von Erik Möller vorgeschlagen.[5] Magnus Manske implementierte daraufhin einen Prototypen, welcher die grundsätzliche Machbarkeit des Projekts demonstrierte. Die eigentliche Umsetzung begann aber erst im März 2012.[6] Die Entwicklung wurde mit 1,3 Millionen € von Allen Institute for Artificial Intelligence, dem Gordon and Betty Moore Foundation Program und Google Inc. finanziert.[7] Von großem Einfluss auf die Entwicklung von Wikidata war Semantic MediaWiki, eine freie Open-Source-Softwareerweiterung zu MediaWiki.[6] Die Semantic MediaWiki-Entwickler Markus Krötzsch und Denny Vrandečić arbeiteten beide an Wikidata mit.[8]

Nach einem Projektplan wurde am 30. Oktober 2012[6] Wikidata offiziell gestartet und die Bearbeitung freigeschaltet. Zunächst wurden die in den einzelnen Wikipedias lokal im Wikitext gespeicherten Sprachlinks in Wikidata zu Datenobjekten zusammengeführt und mit Bezeichnungen und Beschreibungen versehen. Danach wurden Aussagen zu den Datenobjekten hinzugefügt. Diese Informationen wurden zum Teil automatisiert aus Wikipediaartikeln übertragen. Damit können einzelne Felder in Infoboxen in Wikipediaartikeln auf die zentral in Wikidata gespeicherten Daten zugreifen, so dass diese für alle Wikis nur einmal gepflegt werden müssen. Seit dem 6. März 2013 ist die Sprachlinkunterstützung in allen Wikipedien verfügbar.[9] Am 27. März 2013 konnten die ersten 11 Wikipedien Daten aus Wikidata in ihren Artikeln einbinden,[10] seit dem 24. April 2013 ist dies für alle Wikipedien möglich.[11]

Ende 2014 gab Google bekannt, Freebase Mitte 2015 zugunsten von Wikidata zu schließen. Die Freebase-Daten sollen soweit möglich in Wikidata integriert werden.[12] Im Oktober 2016 stellte Wikidata einen Abfragedienst bereit, welcher die Ausführung von Abfragen mit der Abfragesprache SPARQL (SPARQL Protocol And RDF Query Language) ermöglicht. Ende 2017 begann die Entwicklung von WBStack.[13] WBStack war ein Projekt, um Wikibase und dazugehörige Dienste wie den blazegraph-Abfragedienst auf einer geteilten Plattform zur Verfügung zu stellen, auf der Installation, Upgrades und Wartung zentral durchgeführt werden.[14] Seit Mai 2018 werden auch lexikographische Daten in Wikidata gespeichert, die von Wiktionary genutzt werden.[15] Ebenfalls 2018 wurde Wbaas (Wikibase as a service) ursprünglich mit der WMDE (Wikimedia Deutschland – Gesellschaft zur Förderung Freien Wissens) gestartet.[13]

Seit Anfang 2019 werden die transkribierten Artikel der deutschsprachigen Illustrierten „Die Gartenlaube‟ vollständig mit Hilfe von Wikidata formal und inhaltlich erschlossen.[16] Bis September 2019 waren erst 528.000 von 10 Millionen Datensätzen von Freebase nach Wikidata migriert worden.[17] Im Oktober 2019 wurde die Alpha-Version von WBStack zur Wikidatacon veröffentlicht. Ende 2020 wurde WBStack Open Source.[13] Ende 2021 begann die Entwicklung von Wikibase.cloud, welches dann am 21. April 2022 von Wikimedia Deutschland gestartet wurde. Im selben Monat begann die Migration der User von WBStack.com nach Wikibase.cloud.[18]

Literatur

  • 2014: Normdaten in Wikidata - Handbuch, Jakob Voß u. a., 68 Seiten, ISBN 978-1-291-85658-3 Online-Version
  • 2017: Semantic Search for Novel Information, Michael Färber, 193 Seiten, ‎Akademische Verlagsgesellschaft AKA, ISBN ‎978-3898387279 (Englisch)
  • 2019: A systematic literature review on Wikidata von Marçal Mora-Cantallops, Salvador Sánchez-Alonso und Elena García-Barriocanal In: Data Technologies and Applications, Band 53, ISSN 2514-9288

Weblinks

Quellen