Wikidata
Wikidata | |
---|---|
Den gratis kunnskapsdatabasen som alle kan redigere | |
Wiki-prosjekt for å sentralisere data og fakta | |
språk | flerspråklig |
operatør | Wikimedia Foundation |
Registrering | valgfri |
På nett | 29. oktober 2012 |
www.wikidata.org |
Wikidata er en fritt redigerbar kunnskapsdatabase som blant annet har som mål å støtte Wikipedia . Prosjektet ble startet av Wikimedia Germany og gir visse datatyper for Wikimedia-prosjekter som en felles kilde, for eksempel fødselsdatoer eller andre generelle data som kan brukes i alle artiklene i Wikimedia-prosjektene.
Siden starten av 2012 har Wikidata sett en relativt sterk vekst på innholdssidene; Det er nå rundt 90 millioner dataobjekter (per september 2020).
Informasjonen i Wikidata er under Creative Commons-lisensen CC0 1.0 Universal (CC0 1.0) Public Domain Dedication . Dette betyr at dataene kan brukes fritt uten å spesifisere en forfatter. Alle andre navneområder er under Creative Commons Attribution / Share-Alike lisens (CC BY-SA 3.0).
konstruksjon
Hovednavnet til Wikidata er en samling objekter (betegnet med prefikset "Q" og et nummer umiddelbart etter det). Objektene i sin tur består av et hvilket som helst antall uttalelser og påstander (betegnet med prefikset "P" for engelsk eiendom og et nummer). Disse egenskapene kan spesifiseres nærmere med kvalifiseringskilder (også identifisert med prefikset "P"). Krav støttet av kilder kalles uttalelser . I løpet av integreringen av Wikipedia-søsterprosjektet Wiktionary , som utvikler en flerspråklig ordbok, var det mulig å lage lexemer som dataobjekter direkte i Wikidata.
Som alle prosjekter fra Wikimedia Foundation, drives Wikidata på grunnlag av MediaWiki , som måtte utvides til å omfatte komponenter kalt Wikibase for å kunne håndtere strukturerte data. Wikibase består av Wikibase-depotet, der dataene lagres og administreres, og den tilknyttede Wikibase-klienten, som kan brukes til å få tilgang til depotet.
WIKIDATA muliggjør, for eksempel, autoritet data som skal opprettholdes på et sentralt sted, som for eksempel Library of Congress myndigheter (LCAuth), som blir brukt av Wikipedia prosjekter, spesielt Wikipedia . På samme måte kan data om programversjoner redigeres en gang i Wikidata i stedet for individuelt på mange prosjekter, noe som betyr en betydelig reduksjon i arbeidsmengden, spesielt for mindre prosjekter.
historie
Wikidata var det første nye prosjektet til Wikimedia Foundation siden 2006. Wikidata-prosjektet ble først foreslått i september 2004 av Erik Möller . Kort tid etter implementerte Magnus Manske en første prototype som demonstrerte den grunnleggende gjennomførbarheten av prosjektet. Den faktiske implementeringen startet endelig i april 2012 og ble finansiert av donasjoner fra Paul Allens Allen Institute for Artificial Intelligence , Gordon and Betty Moore Foundation og Google Inc. med til sammen 1,3 millioner euro . Finansiering gjennom donasjoner gikk offisielt frem til våren 2013; for perioden etterpå planla Wikimedia Tyskland å finne oppfølgingsfinansiering.
Semantic MediaWiki av Markus Krötzsch og Denny Vrandečić , som begge jobber på Wikidata (Vrandečić var Wikidata-prosjektleder i Wikimedia Germany i 2012), hadde stor innflytelse på utviklingen av Wikidata .
Det ene millionte dataobjektet ble lagt inn 15. desember 2012.
Prosjektplanen , som nå er fullført , ga tre faser:
- Fase 1 begynte 30. oktober 2012 med den offisielle lanseringen av Wikidata og godkjenningen for redigering. Først ble språkkoblingene lagret lokalt i Wikitext i de enkelte Wikipediaene slått sammen sentralt i Wikidata til dataobjekter (engelske artikler ) og gitt navn og beskrivelser. Automatiske dataskripter (også kjent som bots ) ble primært brukt til disse oppgavene . Opprinnelig kunne bare språkkoblinger settes inn. Fra 14. januar 2013 var disse tilgjengelige på den ungarskspråklige Wikipedia, 30. januar 2013 ble de aktivert på hebraisk og italiensk og 13. februar i den engelskspråklige Wikipedia, og siden 6. mars 2013 har de vært tilgjengelige i alle språkversjoner.
- 4. februar 2013 gikk "Fase 2" i drift med et fortsatt begrenset funksjonsutvalg. Her er utsagn lagt til dataobjekter (som Marie Curie : fødsel → Warszawa ). Noe av denne informasjonen ble automatisk overført fra Wikipedia-informasjonsbokser og kategorier. Målet er å lagre informasjon på infofelter i Wikipedia-språkversjonene sentralt i Wikidata og bruke dette i Wikipedia om nødvendig. 27. mars 2013 ble støtte for fase 2 aktivert i de første elleve Wikipedia-språkversjonene. 23. april fulgte resten av Wikipediaene etter, inkludert den tyskspråklige Wikipedia .
- Siden fase 3 har det vært mulig å lage lister automatisk med data fra Wikidata. I tillegg til de manuelt opprettede og vedlikeholdte tabellene og lister i Wikipedia, har det siden vært mange muligheter for automatisk å opprette lister.
I 2013 donerte IBM premiepengene til Feigenbaum-prisen 2013 for Watson- prosjektet til Wikimedia Foundation, nærmere bestemt Wikidata, fordi Wikipedia hadde gitt et stort bidrag til prosjektets suksess og Wikidata hadde satt seg som mål å lage mennesker og maskiner lettere For å gi tilgang til kunnskap.
På slutten av 2014 kunngjorde Google at de ville stenge sin egen faktabase Freebase i 2015 til fordel for Wikidata-prosjektet. For å kunne overføre data til Wikidata lettere ble det levert et importverktøy. Ved midten av 2019 hadde imidlertid bare rundt 528 000 eller mindre enn fem prosent av rundt 10 millioner dataposter blitt overført til Wikidata.
Den offisielle spørringstjenesten som gjør det mulig å utføre SPARQL- spørringer, har blitt gjort tilgjengelig siden oktober 2016 .
fordeling
En undersøkelse utført av biblioteketjenesteleverandøren OCLC i 2018 viste at Wikidata ble nummer fem blant de tilknyttede dataprosjektene der data ble innlemmet i sine egne tilbud, med 41% av respondentene - foran WorldCat og ISNI , men klart ifølge biblioteket av Kongressen og VIAF . Sammenlignet med 2015 har Wikidata blitt viktigere, spesielt for biblioteker, museer og arkiver.
I mai 2019 ble det kunngjort at Library of Congress ville integrere data fra Wikidata i myndighetsdataene.
kritikk
Spesielt i de første dagene av Wikidata ble det kritisert at en lisens uten copyleft ble brukt. Kvaliteten på Wikidatas database ble også gjentatte ganger kritisert. En komparativ studie av datakvaliteten fra DBpedia , Freebase, OpenCyc , Wikidata og YAGO kom til resultatet i november 2017 at ingen av de nevnte kunnskapsgrafene er egnet for alle tenkelige formål.
Diverse
I juli 2015 bachelorstudenter fra Hasso Plattner Institute ved det universitetet i Potsdam presenteres et prosjekt for å "sikre fullstendighet og riktigheten av data fra den raskt voksende database". For konsistensjekk bør du konsultere dataene fra det tyske nasjonalbiblioteket og Internet Movie Database .
Logoen kommer fra Arun Ganesh og ble valgt ut som en del av en konkurranse. Den stiliserte strekkoden viser også ordet "Wiki" i Morse-kode og i fargene på Wikimedia- prosjektene.
litteratur
- ARL Task Force on Wikimedia and Linked Open Data: ARL White Paper on Wikidata: Muligheter og anbefalinger . Red.: Association of Research Libraries. 18. april 2019 (engelsk, arl.org ).
- Christian Erlinger, Jens Bemme: Datasken i lysthuset. Åpne 'Die Gartenlaube' på Wikisource på en strukturert måte med Wikidata - en workshoprapport . I: diedatenlaube.github.io . 18. november 2019 ( github.io ).
- Torsten Kleinz: Data Encyclopedia. Wikidata-prosjektet har som mål å strukturere innholdet på Wikipedia. I: c't - magasin for datateknologi. Nr. 9, 2013, s. 76–79 ( online , mot betaling).
- Marçal Mora-Cantallops, Salvador Sánchez-Alonso, Elena García-Barriocanal: En systematisk litteraturgjennomgang på Wikidata . I: Datateknologier og applikasjoner . teip 53 , nr. 3 , 1. juli 2019, ISSN 2514-9288 , s. 250–268 , doi : 10.1108 / DTA-12-2018-0110 ( emerald.com [åpnet 14. august 2020]).
- Claudia Müller-Birn, Benjamin Karran, Janette Lehmann, Markus Luczak-Rösch: Peer-production system eller samarbeidende ontologi engineering innsats: Hva er Wikidata? . I: Proceedings of the 11. International Symposium on Open Collaboration. ACM, 2015 ( doi: 10.1145 / 2788993.2789836 ).
- Joachim Neubert: Hvorfor donerer vi data til Wikidata? I: ABI-teknologi . teip 40 , nei. 2 , 1. mai 2020, ISSN 2191-4664 , s. 209-209 , doi : 10.1515 / ABiTec-2020-2013 ( degruyter.com [åpnet 4. mai 2020]).
- Adrian Pohl: Hva er Wikidata, og hvordan kan det støtte biblioteksarbeid? I: ABI-teknologi . teip 38 , nr. 2 , 4. juli 2018, ISSN 2191-4664 , s. 208-208 , doi : 10.1515 / ABiTec-2018-2013 ( degruyter.com [åpnet 21. juli 2018] Open Access i bloggen for forfatteren .. ).
- Houcemeddine Turki, Thomas Shafee, Mohamed Ali Hadj Taieb, Mohamed Ben Aouicha, Denny Vrandečić: Wikidata: En storstilt samarbeidende ontologisk medisinsk database . I: Journal of Biomedical Informatics . 1. september 2019, s. 103292 , doi : 10.1016 / j.jbi.2019.103292 ( elsevier.com [åpnet 25. september 2019] også tilgjengelig på Zenodo for privat bruk).
- Jakob Voss et al.: Autoritetsdata i Wikidata . 2014, ISBN 978-1-291-85658-3 .
- Denny Vrandečić, Markus Krötzsch: Wikidata: A Free Collaborative Knowledge Base . I: Kommunikasjon av ACM. Volum 57, nr. 10, 2014, s. 78-85.
- Denny Vrandečić: Mot en abstrakt Wikipedia . I: Proceedings of the 31. International Workshop on Description Logics co-located with the 16. International Conference on Principles of Knowledge Representation and Reasoning (KR 2018). Vol. 2211-3. Tempe, Arizona, USA, 2018.
- Wikidata: Den gratis kunnskapsdatabasen som alle kan redigere. Veiledningen for alle som ønsker å beskrive verden sammen i åpne og strukturerte data. Wikimedia Germany, 2019, åpnet 9. august 2019 (Redaktør: Nicolas Rück, Layout and Design: Valerie Schandl).
weblenker
- Hovedside for Wikidata
- Prosjektside på Meta-Wiki fra Wikimedia Foundation
- Wikipedia: Wikidata - ytterligere informasjon i prosjektdokumentasjonen til det tyske språket Wikipedia
- WIKIDATA trykk vurderinger
- Rapportkort Wikidata WMF / stats.wikimedia.org
- Videoer: Foredrag av WikidataCon på media.ccc.de
- Podcaster:
- CRE205 Wikidata - Tim Pritlove i samtale med Jens Ohlig i CRE- podcasten
- Between the Brackets - Yaron Koren i samtale med Denny Vrandečić
- Wikidata Query Service Tutorial - for å lære SPARQL-spørsmål på Wikidata
Individuelle bevis
- ^ Spesiell: Statistikk. I: Wikidata. Hentet 12. september 2019 .
- ↑ Wikidata: Nedlasting av database. På: wikidata.org. Hentet 9. september 2016 .
- ↑ Wikidata: Ordliste. I: www.wikidata.org. Hentet 9. september 2016 .
- ↑ Wikibase - Hjem. Hentet 3. desember 2018 .
- ^ Matthew Roth: Wikipedia-datarevolusjonen. I: Wikimedia Blogg. 30. mars 2012, åpnet 9. september 2016 .
- ↑ Erik Möller : Den hemmelige medierevolusjonen - Hvordan weblogger, wikier og gratis programvare forandrer verden . 1. utgave. Heise Zeitschriften Verlag, Hannover 2005, ISBN 3-936931-16-X , s. 189, 196 ff . ( medienrevolution.dpunkt.de [PDF; 3.0 MB ]).
- ↑ Boonsri Dickinson: Paul Allen investerer i et massivt prosjekt for å gjøre Wikipedia bedre. I: Business Insider . 30. mars 2012, åpnet 9. september 2016 .
- ^ Sarah Perez: Wikipedia's neste store ting: Wikidata, en maskinlesbar, brukerredigerbar database finansiert av Google, Paul Allen og andre. I: TechCrunch . 30. mars 2012, åpnet 9. september 2016 .
- ↑ Torsten Kleinz: Wikidata: datafond for Wikipedia åpnet. I: heise online . 31. oktober 2012, åpnet 9. september 2016 .
- ↑ Lydia Pintscher, Das Wikidata-Team , Blogg wikimedia.de, 4. april 2012
- ^ Lydia Pintscher: Første skritt fra Wikidata i den ungarske Wikipedia. I: Wikimedia Germany Blog. 14. januar 2013, åpnet 14. januar 2013 .
- ↑ Lydia Pintscher: Wikidata kommer til de to neste Wikipedia. I: Wikimedia Germany Blog. 30. januar 2013, åpnet 31. januar 2013 .
- ^ Lydia Pintscher: Wikidata på den engelske Wikipedia. I: Wikimedia Germany Blog. 13. februar 2013, åpnet 7. mars 2013 .
- ↑ Lydia Pintscher: Wikidata nå på hele Wikipedia. I: Wikimedia Germany Blog. 6. mars 2013, åpnet 7. mars 2013 .
- ↑ Lydia Pintscher: Wikidata over hele verden. Wikimedia Germany , 24. april 2013, åpnet 28. april 2013 .
- ^ Matthew Roth: IBM Research donerer AAAI Feigenbaum-prisen for Watson til Wikimedia Foundation. I: Wikimedia Foundation-bloggen. 16. juli 2013, åpnet 9. september 2016 .
- ↑ Kunnskapsgrafteamet på Google: Da vi offentlig lanserte Freebase tilbake i 2007, tenkte vi på det som en ... I: Google+ . 16. desember 2014, åpnet 9. september 2016 .
- ^ Wikidata: Primær kildeverktøy. Hentet 3. februar 2017 .
- ↑ Thomas Pellissier Tanon, Denny Vrandečić, Sebastian Schaffert, Thomas Steiner, Lydia Pintscher: Fra freebase til Wikidata: The Great Migration . I: Proceedings of the 25. International Conference on World Wide Web - WWW '16 . ACM Press, Montréal, Québec, Canada 2016, ISBN 978-1-4503-4143-1 , pp. 1419–1428 , doi : 10.1145 / 2872427.2874809 ( acm.org [åpnet 27. september 2019] også fritt tilgjengelig .).
- ↑ Marco Fossati: (Wikidata) Googles eierandel i Wikidata og Wikipedia. I: Wikidata-l adresseliste. 27. september 2019, tilgjengelig 27. september 2019 .
- ^ Sebastian Hellmann: (Wikidata) Googles andel i Wikidata og Wikipedia. I: Wikidata-l adresseliste. 27. september 2019, tilgjengelig 27. september 2019 .
- ^ Wikidata-spørringstjeneste. Hentet 5. november 2018 .
- ^ Karen Smith-Yoshimura: Analyse av 2018 International Linked Data Survey for Implementers . I: Code4Lib Journal . teip 42 , 8. november 2018, ISSN 1940-5758 ( code4lib.org ).
- ^ Meghan Ferriter, Matt Miller: Integrering av Wikidata på Library of Congress. I: The Signal. Library of Congress, 22. mai 2019, åpnet 9. juni 2019 .
- ↑ Alexrk2: Er CC den riktige lisensen for data? I: meta.wikimedia.org. 1. april 2012, åpnet 9. september 2016 .
- ↑ Andreas Kolbe: Uansett, upålitelig og i ansiktet ditt for alltid: Wikidata, fremtiden for online tull , The Register , 8. desember 2015.
- ↑ Michael Färber, Frederic Bartscherer, Carsten Menne, Achim Rettinger: Linked data kvalitet dbpedia, Freebase, OpenCyc, WIKIDATA, og YAGO . I: Semantisk web . teip 9 , nr. 1. 30. november 2017, s. 77–129 , doi : 10.3233 / SW-170275 ( medra.org [åpnet 27. september 2019] det er en fritt tilgjengelig versjon .).
- ↑ HPI-studenter sørger for kvalitetssikring i Wikidata. Hasso Plattner Institute , 7. desember 2015, åpnet 9. september 2016 .
- ^ Felix Naumann, Anja Jentzsch: Wikidata Quality. Hasso Plattner Institute , 24. august 2016, åpnet 9. september 2016 .
- ↑ https://blog.wikimedia.de/2012/07/13/und-der-gewinner-ist/