Wikidata

Infobox globusikon
Wikidata
Nettstedslogo
Den gratis kunnskapsdatabasen som alle kan redigere
Wiki-prosjekt for å sentralisere data og fakta
språk flerspråklig
operatør Wikimedia Foundation
Registrering valgfri
På nett 29. oktober 2012
www.wikidata.org

Wikidata er en fritt redigerbar kunnskapsdatabase som blant annet har som mål å støtte Wikipedia . Prosjektet ble startet av Wikimedia Germany og gir visse datatyper for Wikimedia-prosjekter som en felles kilde, for eksempel fødselsdatoer eller andre generelle data som kan brukes i alle artiklene i Wikimedia-prosjektene.

Siden starten av 2012 har Wikidata sett en relativt sterk vekst på innholdssidene; Det er nå rundt 90 millioner dataobjekter (per september 2020).

Informasjonen i Wikidata er under Creative Commons-lisensen CC0 1.0 Universal (CC0 1.0) Public Domain Dedication . Dette betyr at dataene kan brukes fritt uten å spesifisere en forfatter. Alle andre navneområder er under Creative Commons Attribution / Share-Alike lisens (CC BY-SA 3.0).

konstruksjon

Strukturen til en Wikidata-uttalelse

Hovednavnet til Wikidata er en samling objekter (betegnet med prefikset "Q" og et nummer umiddelbart etter det). Objektene i sin tur består av et hvilket som helst antall uttalelser og påstander (betegnet med prefikset "P" for engelsk eiendom og et nummer). Disse egenskapene kan spesifiseres nærmere med kvalifiseringskilder (også identifisert med prefikset "P"). Krav støttet av kilder kalles uttalelser . I løpet av integreringen av Wikipedia-søsterprosjektet Wiktionary , som utvikler en flerspråklig ordbok, var det mulig å lage lexemer som dataobjekter direkte i Wikidata.

Som alle prosjekter fra Wikimedia Foundation, drives Wikidata på grunnlag av MediaWiki , som måtte utvides til å omfatte komponenter kalt Wikibase for å kunne håndtere strukturerte data. Wikibase består av Wikibase-depotet, der dataene lagres og administreres, og den tilknyttede Wikibase-klienten, som kan brukes til å få tilgang til depotet.

WIKIDATA muliggjør, for eksempel, autoritet data som skal opprettholdes på et sentralt sted, som for eksempel Library of Congress myndigheter (LCAuth), som blir brukt av Wikipedia prosjekter, spesielt Wikipedia . På samme måte kan data om programversjoner redigeres en gang i Wikidata i stedet for individuelt på mange prosjekter, noe som betyr en betydelig reduksjon i arbeidsmengden, spesielt for mindre prosjekter.

historie

Utvikling av dataobjektnumre på Wikidata
Eksempel på en liste over amerikanske presidenter med ektefeller vist som en graf.
Wikidata-spørringstjeneste
Wikidata- spørretjeneste med SPARQL- eksempel på query.Wikidata.org

Wikidata var det første nye prosjektet til Wikimedia Foundation siden 2006. Wikidata-prosjektet ble først foreslått i september 2004 av Erik Möller . Kort tid etter implementerte Magnus Manske en første prototype som demonstrerte den grunnleggende gjennomførbarheten av prosjektet. Den faktiske implementeringen startet endelig i april 2012 og ble finansiert av donasjoner fra Paul Allens Allen Institute for Artificial Intelligence , Gordon and Betty Moore Foundation og Google Inc. med til sammen 1,3 millioner euro . Finansiering gjennom donasjoner gikk offisielt frem til våren 2013; for perioden etterpå planla Wikimedia Tyskland å finne oppfølgingsfinansiering.

Semantic MediaWiki av Markus Krötzsch og Denny Vrandečić , som begge jobber på Wikidata (Vrandečić var ​​Wikidata-prosjektleder i Wikimedia Germany i 2012), hadde stor innflytelse på utviklingen av Wikidata .

Det ene millionte dataobjektet ble lagt inn 15. desember 2012.

Prosjektplanen , som nå er fullført , ga tre faser:

  • Fase 1 begynte 30. oktober 2012 med den offisielle lanseringen av Wikidata og godkjenningen for redigering. Først ble språkkoblingene lagret lokalt i Wikitext i de enkelte Wikipediaene slått sammen sentralt i Wikidata til dataobjekter (engelske artikler ) og gitt navn og beskrivelser. Automatiske dataskripter (også kjent som bots ) ble primært brukt til disse oppgavene . Opprinnelig kunne bare språkkoblinger settes inn. Fra 14. januar 2013 var disse tilgjengelige på den ungarskspråklige Wikipedia, 30. januar 2013 ble de aktivert på hebraisk og italiensk og 13. februar i den engelskspråklige Wikipedia, og siden 6. mars 2013 har de vært tilgjengelige i alle språkversjoner.
  • 4. februar 2013 gikk "Fase 2" i drift med et fortsatt begrenset funksjonsutvalg. Her er utsagn lagt til dataobjekter (som Marie Curie : fødselWarszawa ). Noe av denne informasjonen ble automatisk overført fra Wikipedia-informasjonsbokser og kategorier. Målet er å lagre informasjon på infofelter i Wikipedia-språkversjonene sentralt i Wikidata og bruke dette i Wikipedia om nødvendig. 27. mars 2013 ble støtte for fase 2 aktivert i de første elleve Wikipedia-språkversjonene. 23. april fulgte resten av Wikipediaene etter, inkludert den tyskspråklige Wikipedia .
  • Siden fase 3 har det vært mulig å lage lister automatisk med data fra Wikidata. I tillegg til de manuelt opprettede og vedlikeholdte tabellene og lister i Wikipedia, har det siden vært mange muligheter for automatisk å opprette lister.

I 2013 donerte IBM premiepengene til Feigenbaum-prisen 2013 for Watson- prosjektet til Wikimedia Foundation, nærmere bestemt Wikidata, fordi Wikipedia hadde gitt et stort bidrag til prosjektets suksess og Wikidata hadde satt seg som mål å lage mennesker og maskiner lettere For å gi tilgang til kunnskap.

På slutten av 2014 kunngjorde Google at de ville stenge sin egen faktabase Freebase i 2015 til fordel for Wikidata-prosjektet. For å kunne overføre data til Wikidata lettere ble det levert et importverktøy. Ved midten av 2019 hadde imidlertid bare rundt 528 000 eller mindre enn fem prosent av rundt 10 millioner dataposter blitt overført til Wikidata.

Den offisielle spørringstjenesten som gjør det mulig å utføre SPARQL- spørringer, har blitt gjort tilgjengelig siden oktober 2016 .

fordeling

En undersøkelse utført av biblioteketjenesteleverandøren OCLC i 2018 viste at Wikidata ble nummer fem blant de tilknyttede dataprosjektene der data ble innlemmet i sine egne tilbud, med 41% av respondentene - foran WorldCat og ISNI , men klart ifølge biblioteket av Kongressen og VIAF . Sammenlignet med 2015 har Wikidata blitt viktigere, spesielt for biblioteker, museer og arkiver.

I mai 2019 ble det kunngjort at Library of Congress ville integrere data fra Wikidata i myndighetsdataene.

kritikk

Spesielt i de første dagene av Wikidata ble det kritisert at en lisens uten copyleft ble brukt. Kvaliteten på Wikidatas database ble også gjentatte ganger kritisert. En komparativ studie av datakvaliteten fra DBpedia , Freebase, OpenCyc , Wikidata og YAGO kom til resultatet i november 2017 at ingen av de nevnte kunnskapsgrafene er egnet for alle tenkelige formål.

Diverse

I juli 2015 bachelorstudenter fra Hasso Plattner Institute ved det universitetet i Potsdam presenteres et prosjekt for å "sikre fullstendighet og riktigheten av data fra den raskt voksende database". For konsistensjekk bør du konsultere dataene fra det tyske nasjonalbiblioteket og Internet Movie Database .

Logoen kommer fra Arun Ganesh og ble valgt ut som en del av en konkurranse. Den stiliserte strekkoden viser også ordet "Wiki" i Morse-kode og i fargene på Wikimedia- prosjektene.

litteratur

weblenker

Commons : Wikidata  - samling av bilder, videoer og lydfiler

Individuelle bevis

  1. ^ Spesiell: Statistikk. I: Wikidata. Hentet 12. september 2019 .
  2. Wikidata: Nedlasting av database. På: wikidata.org. Hentet 9. september 2016 .
  3. Wikidata: Ordliste. I: www.wikidata.org. Hentet 9. september 2016 .
  4. Wikibase - Hjem. Hentet 3. desember 2018 .
  5. ^ Matthew Roth: Wikipedia-datarevolusjonen. I: Wikimedia Blogg. 30. mars 2012, åpnet 9. september 2016 .
  6. Erik Möller : Den hemmelige medierevolusjonen - Hvordan weblogger, wikier og gratis programvare forandrer verden . 1. utgave. Heise Zeitschriften Verlag, Hannover 2005, ISBN 3-936931-16-X , s. 189, 196 ff . ( medienrevolution.dpunkt.de [PDF; 3.0 MB ]).
  7. Boonsri Dickinson: Paul Allen investerer i et massivt prosjekt for å gjøre Wikipedia bedre. I: Business Insider . 30. mars 2012, åpnet 9. september 2016 .
  8. ^ Sarah Perez: Wikipedia's neste store ting: Wikidata, en maskinlesbar, brukerredigerbar database finansiert av Google, Paul Allen og andre. I: TechCrunch . 30. mars 2012, åpnet 9. september 2016 .
  9. Torsten Kleinz: Wikidata: datafond for Wikipedia åpnet. I: heise online . 31. oktober 2012, åpnet 9. september 2016 .
  10. Lydia Pintscher, Das Wikidata-Team , Blogg wikimedia.de, 4. april 2012
  11. ^ Lydia Pintscher: Første skritt fra Wikidata i den ungarske Wikipedia. I: Wikimedia Germany Blog. 14. januar 2013, åpnet 14. januar 2013 .
  12. Lydia Pintscher: Wikidata kommer til de to neste Wikipedia. I: Wikimedia Germany Blog. 30. januar 2013, åpnet 31. januar 2013 .
  13. ^ Lydia Pintscher: Wikidata på den engelske Wikipedia. I: Wikimedia Germany Blog. 13. februar 2013, åpnet 7. mars 2013 .
  14. Lydia Pintscher: Wikidata nå på hele Wikipedia. I: Wikimedia Germany Blog. 6. mars 2013, åpnet 7. mars 2013 .
  15. Lydia Pintscher: Wikidata over hele verden. Wikimedia Germany , 24. april 2013, åpnet 28. april 2013 .
  16. ^ Matthew Roth: IBM Research donerer AAAI Feigenbaum-prisen for Watson til Wikimedia Foundation. I: Wikimedia Foundation-bloggen. 16. juli 2013, åpnet 9. september 2016 .
  17. Kunnskapsgrafteamet på Google: Da vi offentlig lanserte Freebase tilbake i 2007, tenkte vi på det som en ... I: Google+ . 16. desember 2014, åpnet 9. september 2016 .
  18. ^ Wikidata: Primær kildeverktøy. Hentet 3. februar 2017 .
  19. Thomas Pellissier Tanon, Denny Vrandečić, Sebastian Schaffert, Thomas Steiner, Lydia Pintscher: Fra freebase til Wikidata: The Great Migration . I: Proceedings of the 25. International Conference on World Wide Web - WWW '16 . ACM Press, Montréal, Québec, Canada 2016, ISBN 978-1-4503-4143-1 , pp. 1419–1428 , doi : 10.1145 / 2872427.2874809 ( acm.org [åpnet 27. september 2019] også fritt tilgjengelig .).
  20. Marco Fossati: (Wikidata) Googles eierandel i Wikidata og Wikipedia. I: Wikidata-l adresseliste. 27. september 2019, tilgjengelig 27. september 2019 .
  21. ^ Sebastian Hellmann: (Wikidata) Googles andel i Wikidata og Wikipedia. I: Wikidata-l adresseliste. 27. september 2019, tilgjengelig 27. september 2019 .
  22. ^ Wikidata-spørringstjeneste. Hentet 5. november 2018 .
  23. ^ Karen Smith-Yoshimura: Analyse av 2018 International Linked Data Survey for Implementers . I: Code4Lib Journal . teip 42 , 8. november 2018, ISSN  1940-5758 ( code4lib.org ).
  24. ^ Meghan Ferriter, Matt Miller: Integrering av Wikidata på Library of Congress. I: The Signal. Library of Congress, 22. mai 2019, åpnet 9. juni 2019 .
  25. Alexrk2: Er CC den riktige lisensen for data? I: meta.wikimedia.org. 1. april 2012, åpnet 9. september 2016 .
  26. Andreas Kolbe: Uansett, upålitelig og i ansiktet ditt for alltid: Wikidata, fremtiden for online tull , The Register , 8. desember 2015.
  27. Michael Färber, Frederic Bartscherer, Carsten Menne, Achim Rettinger: Linked data kvalitet dbpedia, Freebase, OpenCyc, WIKIDATA, og YAGO . I: Semantisk web . teip 9 , nr. 1. 30. november 2017, s. 77–129 , doi : 10.3233 / SW-170275 ( medra.org [åpnet 27. september 2019] det er en fritt tilgjengelig versjon .).
  28. HPI-studenter sørger for kvalitetssikring i Wikidata. Hasso Plattner Institute , 7. desember 2015, åpnet 9. september 2016 .
  29. ^ Felix Naumann, Anja Jentzsch: Wikidata Quality. Hasso Plattner Institute , 24. august 2016, åpnet 9. september 2016 .
  30. https://blog.wikimedia.de/2012/07/13/und-der-gewinner-ist/