Wikidata Query Service/User Manual/tr

Vikiveri Sorgulama Hizmeti (WDQS), Vikiveri verilerine ayarlamak karşı sorgulama yapmanızı sağlayan bir SPARQL uç noktası sağlamak üzere tasarlanmış bir yazılım paketi ve kamu hizmetidir.

Bu sayfa veya diğer ilgili belgelendirme sayfaları buna göre güncellenecektir; hizmeti kullanıyorsanız bunları izlemeniz önerilir.

SPARQL Sorgularının örneklerini SPARQL örnekler sayfasında görebilirsiniz.

Veri ayarı
Vikiveri Sorgulama Hizmeti, RDF döküm biçimi belgelerinde açıklandığı gibi RDF'de temsil edilen Wikidata.org'dan alınan bir veri kümesi üzerinde çalışır.

Hizmetin veri kümesi, esas olarak performans nedenleriyle, RDF dökümleri tarafından üretilen veri kümesiyle tam olarak eşleşmiyor; belgeler, küçük bir dizi farkı açıklar.

Aynı verilerin haftalık dökümünü şuradan indirebilirsiniz:

https://dumps.wikimedia.org/wikidatawiki/entities/

Temel Bilgiler - Anlamsal Üçlü olarak da bilinen DPT'yi (Konu, Yüklem, Nesne) anlama
spo veya "özne, yüklem, nesne" üçlü olarak bilinir veya Vikiveri'de genellikle verilerle ilgili bir ifade olarak anılır.

"Amerika Birleşik Devletleri'nin başkenti Washington DC'dir" ifadesi "Birleşik Devletler" konusundan (Q30), ve bir "Washington DC" nesnesi (Q61) "sermaye" yükleminden (P36) oluşur. Bu ifade üç URI olarak temsil edilebilir:

Önekler sayesinde (aşağıya bakınız), aynı ifade daha özlü bir biçimde yazılabilir. İfadenin sonunu temsil etmek için sondaki noktaya dikkat edin.

/entity/ (wd:) Vikiveri varlığını (Q-sayı değerleri) temsil eder. /prop/direct/ (wdt:), "gerçek" bir özelliktir. İfadeye bakarken en sık bekleyeceğimiz bir değerdir. Doğruluk özelliklerine ihtiyaç vardır çünkü bazı ifadeler diğerlerinden "daha doğru" olabilir. Örneğin, "ABD'nin başkenti New York City'dir" ifadesi doğrudur, ancak yalnızca 1790 yılının tarihsel bağlamında. WDQS, hangi ifadelerin "doğru" olarak kullanılması gerektiğini belirlemek için sıralamayı kullanır.

Doğru ifadelere ek olarak, WDQS tüm ifadeleri saklar (hem doğru hem de değil), ancak aynı wdt: önekini kullanmazlar. ABD başkenti üç değere sahiptir: DC, Philadelphia ve New York. Ve bu değerlerin her birinin "niteleyicileri" vardır, her bir ifadenin kapsamını daraltan başlangıç ​​ve bitiş tarihleri ​​gibi ek bilgiler. Bu bilgiyi üçlü depoda depolamak için WDQS, esasen rastgele bir sayı olan otomatik bir "ifade" konusunu sunar:

Daha fazla bilgi için SPARQL eğitimi - niteleyicilere bakın.

spo ayrıca RDF veri yapılarını veya Blazegraph yüksek performanslı bir grafik veritabanı tarafından desteklenen Vikiveri Sorgu Hizmeti (WDQS) gibi herhangi bir grafik veritabanını veya üçlü depoyu sorgulamak için bir temel sözdizimi düzeni biçimi olarak kullanılır.

Üçlülerin (spo) gelişmiş kullanımları, üçlüleri diğer üçlülerin nesnesi veya öznesi olarak kullanmak da dahil!

Temel Bilgiler - Önekleri Anlama
Özneler ve yüklemler (üçlü sayının birinci ve ikinci değerleri) her zaman URI olarak saklanmalıdır. Örneğin, konu Evren (Q1) ise,    olarak depolanacaktır. Ön ekler, bu uzun URI'yi daha kısa bir biçimde yazmamıza izin verir: wd:Q1. Öznelerden ve yüklemlerden farklı olarak, nesne (üçlü'nün üçüncü değeri) bir URI veya bir hazır bilgi olabilir, ör. bir sayı veya bir dize.

WDQS, önek olarak bilinen birçok kısayol kısaltmasını anlar. Bazıları Vikiveri'ye dahildir, ör. wd, wdt, p, ps, bd ve diğerleri, rdf, skos, owl, schema gibi yaygın olarak kullanılan harici öneklerdir.

Aşağıdaki sorguda, "P279 = Q7725634" ifadesinin olduğu veya daha eksiksiz bir ifadeyle, nesnesi = "edebi eser" olan "alt sınıf" yüklemi olan konuları seçerek öğeleri istiyoruz.

Çıkış değişkenleri:

Uzantılar
Hizmet, standart SPARQL yeteneklerinin aşağıdaki uzantılarını destekler:

Etiket hizmeti
URI  ile özel hizmeti kullanarak, dil yedeğini kullanarak sorguladığınız varlıkların etiketini, diğer adını veya açıklamasını getirebilirsiniz. Hizmet, etiketleri almak istediğinizde çok faydalıdır, çünkü aksi takdirde aynı etkiyi elde etmek için ihtiyaç duyacağınız SPARQL sorgularının karmaşıklığını azaltır.

Servis iki moddan birinde kullanılabilir: el ve otomatik.

Otomatik modda, yalnızca hizmet şablonunu belirtmeniz gerekir, örn.:

ve WDQS otomatik olarak aşağıdaki gibi etiketler oluşturacaktır:


 * içindeki ilişkisiz bir değişken  olarak adlandırılırsa, WDQS,   değişkenindeki varlık için etiketi  üretir.
 * içindeki bir ilişkisiz değişken  olarak adlandırılırsa, WDQS,   değişkenindeki varlık için diğer adı  üretir.
 * içindeki bir ilişkisiz değişken  olarak adlandırılırsa, WDQS,   değişkenindeki varlık için açıklamayı  üretir.

Her durumda,  içindeki değişken bağlanmalıdır, aksi takdirde hizmet başarısız olur.

Otomatik mod yalnızca sorgunun projeksiyonunu denetler. Örneğin,  içinde yalnızca ilk etiket tanınır ve   otomatik mod tarafından hiç desteklenmez. Bu gibi durumlarda, el modu kullanmanız gerekecektir (aşağıya bakın).

Bir veya daha fazla  üçlüsü içeren etiket için tercih ettiğiniz dili/dilleri belirtirsiniz. Her dize, virgülle ayrılmış bir veya daha fazla dil kodu içerebilir. WDQS, dilleri belirttiğiniz sıraya göre değerlendirir. Belirtilen dillerden herhangi birinde etiket yoksa, varlığın Q-id'si (herhangi bir önek olmadan) etiketidir.

Vikiveri Sorgulama Hizmeti web sitesi,  öğesini otomatik olarak geçerli kullanıcı arayüzünün dil koduyla değiştirir. Örneğin, kullanıcının kullanıcı arayüzü Fransızca ise, SPARQL''nin kodu  sorgu hizmetine gönderilmeden önce   biçimine dönüştürülecektir.

ABD başkanlarının ve eşlerinin listesini gösteren örnek:

Bu örnekte WDQS, özellikler için otomatik olarak  ve   etiketlerini oluşturur.

El modda, hizmet çağrısı içindeki etiket değişkenlerini açıkça bağlarsınız, ancak WDQS yine de dil çözünürlüğü ve geri dönüş sağlar. Örnek:

Bu, Fransızca, Almanca ve İngilizce etiketleri ve açıklamaları dikkate alacak ve hiçbiri mevcut değilse, etiket olarak Q-id'yi kullanacaktır.

Coğrafi arama
Hizmet, merkezi bir noktanın belirli bir yarıçapında veya belirli bir sınırlayıcı kutu içinde yer alan koordinatlara sahip öğelerin aranmasına olanak tanır.

Etrafta arama noktası
Örnek:

hizmet çağrısının ilk satırı, aramanın sonucunun belirtilen konum içindeki öğelere  ve koordinatlarına   bağlayacağı       biçiminde olmalıdır. Desteklenen parametreler şunlardır:

Kutunun içinde arama
Kutu arama örneği:

veya:

Koordinatlar doğrudan belirtilebilir:

hizmet çağrısının ilk satırı,      biçiminde olmalıdır, burada ve aramanın sonucu,   ile belirtilen konum içindeki öğelere ve   koordinatlarına bağlayacaktır. Desteklenen parametreler şunlardır:

ve  birlikte, ayrıca   ve   birlikte kullanılmalıdır ve karıştırılamaz. ve  yüklemleri kullanılırsa, noktaların kutunun köşegeninin koordinatları olduğu varsayılır ve köşeler buna göre türetilir.

Mesafe işlevi
işlevi, Dünya üzerindeki iki nokta arasındaki mesafeyi kilometre cinsinden döndürür. Örnek kullanım:

Koordinat parçaları işlevleri
İşlevler,   ve   koordinatlarının parçalarını döndürür. Buna göre dünya URI'si, enlem ve boylam.

URL işlevlerinin kodunu çözün
işlevi, verilen URI dizesinin kodunu çözer (yani yüzde kodlama) tersine çevirir. Bu, Vikipedi başlıklarını (kodlanmış) gerçek dizelere dönüştürürken gerekli olabilir. Bu işlev, SPARQL encode_for_uri işlevinin tersidir.

Otomatik önekler
Yaygın sorgularda kullanılan çoğu önekler, açıkça belirtilmelerine gerek kalmadan motor tarafından desteklenir.

Genişletilmiş tarihler
Hizmet, geçmişte ve gelecekte yaklaşık 290 milyar yıl aralığındaki  türündeki tarih değerlerini bir saniyelik çözünürlükle destekler. WDQS, tarihleri ​​Unix çağından bu yana 64 bitlik saniye sayısı olarak depolar.

Blazegraph uzantıları
Üstünde WDQS'nin uygulandığı Blazegraph platformu kendi SPARQL uzantısına sahiptir. Bunların arasında, BFS, en kısa yol, CC ve PageRank uygulamaları dahil Blazegraph Wiki'de belgelenmiş olan çeşitli grafik geçiş algoritmaları vardır.

Sorgu yürütme ve motorun çeşitli yönlerinin nasıl kontrol edileceği hakkında bilgi için lütfen ayrıca Blazegraph sorgu ipuçlarına ilişkin belgelere bakın.

There is no documentation in the BlazeGraph wiki about the bd:sample extension. It's documented only in a comment in the code.

Federasyon
SPARQL Federasyonlu Sorgular'ın seçili sayıda harici veritabanına çağrı yapmasına izin veriyoruz. Lütfen ilgili sayfadaki federe uç noktaların tam listesine bakın.

Örnek federasyonlu sorgu:

Lütfen, federasyonlu uç noktaların hizmet verdiği veritabanlarının Vikiveri'den çok farklı olabilecek ontolojiler kullandığını unutmayın. Bu veritabanlarına ontolojiler ve veri erişimi hakkında bilgi edinmek için lütfen sahip belgelendirme bağlantılarına bakın.

MediaWiki API
Lütfen MediaWiki API Hizmeti belgelendirme sayfasında tam açıklamaya bakın.

MediaWiki API Hizmeti, SPARQL'den MediaWiki API'sine çağrı yapılmasına ve sonuçların SPARQL sorgusunun içinden alınmasına olanak tanır. Örnek (kategori üyelerini bulma):

Wikimedia servisi
Wikimedia, http://query.wikidata.org/ adresinde kullanılabilen WDQS'nin kamu hizmeti örneğini çalıştırır.

Genel uç noktada sorgunun çalışma zamanı 60 saniye ile sınırlıdır. Bu hem GUI hem de genel SPARQL uç noktası için geçerlidir. Daha uzun sorgular çalıştırmanız gerekiyorsa lütfen Keşif ekibi ile iletişime geçin.

GUI
http://query.wikidata.org/ değerinin ana sayfasındaki GUI, SPARQL sorgularını düzenlemenize ve sorgu motoruna göndermenize izin verir. Sonuçlar bir HTML tablosu olarak görüntülenir. Her sorgunun daha sonra kullanılmak üzere işaretlenebilecek benzersiz bir URL'si olduğunu unutmayın. Bu URL'ye gitmek, sorguyu düzenleme penceresine yerleştirecek, ancak çalıştırmayacaktır. Bunun için yine de "Yürüt" düğmesine tıklamanız gerekiyor.

Ayrıca, sağdaki "Kısa URL oluştur" bağlantısını tıklayarak bir URL kısaltma hizmeti aracılığıyla sorgu için kısa bir URL oluşturabilirsiniz. Bu, geçerli sorgu için kısaltılmış URL'yi üretecektir.

"Önek ekle" düğmesi, SPARQL sorguları için standart önekleri içeren başlığı oluşturur. Yararlı olabilecek öneklerin tam listesi RDF format belgelendirmede listelenmiştir. WDQS bunları kutudan çıktığı gibi desteklediğinden, en yaygın öneklerin otomatik olarak çalıştığını unutmayın.

GUI ayrıca, varlık sonucunun yanındaki "🔍" sembolüne tıklayarak etkinleştirilebilen basit bir varlık gezgini içerir. Q-id varlığına tıklamak sizi wikidata.org adresindeki varlık sayfasına götürecektir.

Varsayılan görünümler

 * Ana madde: wikidata:Special:MyLanguage/Wikidata:SPARQL query service/Wikidata Query Help/Result Views

Sorguyu WDQS GUI'de çalıştırırsanız, sorgunun başında bir yorum belirterek hangi görünümün sunulacağını seçebilirsiniz:.

SPARQL uç noktası
SPARQL sorguları,  ile bir GET veya POST isteği ile doğrudan SPARQL uç noktasına gönderilebilir.

GET istekleri, URL'de  biçiminde belirtilen sorguya sahiptir, ör. .

POST istekleri, alternatif olarak, URL uzunluk sınırlarına ulaşmadan daha büyük sorguların çalıştırılmasına izin veren URL yerine isteğin gövdesindeki sorguyu kabul edebilir. (POST gövdesinin yine de  önekini içermesi gerektiğini unutmayın (yani, yalnızca   yerine   olmalıdır) ve SPARQL sorgusu yine de URL çıkışlı olmalıdır.)

Sonuç, varsayılan olarak XML olarak veya  sorgu parametresi URL'ye dahil edilmişse veya istekle birlikte   başlığı sağlanmışsa JSON olarak döndürülür.

JSON formatı standarttır. SPARQL 1.1 Sorgu Sonuçları JSON Formatı.

POST sorguları önbelleğe alınmadığından daha küçük sorgular için GET ve daha büyük sorgular için POST kullanılması önerilir.

Desteklenen formatlar
Aşağıdaki çıkış biçimleri şu anda SPARQL uç noktası tarafından desteklenmektedir:

Sorgu limitleri
60 saniye olarak ayarlanmış bir sabit sorgu son tarihi var. Ayrıca aşağıdaki sınırlar vardır:


 * Bir istemciye (kullanıcı aracısı + IP) her 60 saniyede 60 saniyelik işlem süresine izin verilir
 * Bir istemciye dakikada 30 hata sorgusu izni verilir

Yukarıdaki sınırları aşan istemciler, HTTP kodu  ile kısıtlanır. İsteğin ne zaman tekrarlanabileceğini görmek için  başlığını kullanın. İstemci 429 yanıtı yok sayar ve sınırları üzerinde istek üretmeye devam ederse, hizmetten geçici olarak yasaklanabilir. Kullanıcı Denetim politikası ile uyumlu olmayan istemciler tamamen engellenebilir. İyi bir  başlık gönderdiğinizden emin olun.

Her sorgu, yürütülmesi bu yapılandırılmış son tarihten daha fazla zaman aldığında zaman aşımına uğrar. Sorguyu optimize etmek veya sorunlu bir sorguyu buradan bildirmek isteyebilirsiniz.

Ayrıca şu anda hizmete erişimin IP başına 5 paralel sorgu ile sınırlı olduğunu unutmayın. Yukarıdaki sınırlar, kaynaklara ve kullanım biçimlerine bağlı olarak değişebilir.

Sorgu Açıklaması
Blazegraph, sorgunun nasıl ayrıştırıldığını ve hangi optimizasyonların uygulandığını açıklayan sorgu analizinin gösterilmesini sağlar. Bu bilgiyi görmek için, sorgu dizesine  parametresi ekleyin, örneğin:.

Ad alanları
Vikiveri Sorgu Hizmeti'ndeki veriler, ana SPARQL uç noktasına yönelik sorguların yönlendirildiği ana ad alanını,  ile ve aşağıda listelenen diğer yardımcı ad alanlarını içerir. Farklı ad alanındaki verileri sorgulamak için bitiş noktası URL'si https://query.wikidata.org/bigdata/namespace/NAMESPACENAME/sparql olarak kullanın.

Kategoriler
Lütfen Kategoriler belgelendirme sayfasında tam açıklamaya bakın.

Vikiveri Sorgulama Hizmeti ayrıca belirli vikilerin kategori grafiğine erişim sağlar. Kapsanan vikilerin listesi burada görülebilir: https://noc.wikimedia.org/conf/dblists/categories-rdf.dblist

Kategori ad alanı adı. SPARQL'e erişim için uç noktası https://query.wikidata.org/bigdata/namespace/categories/sparql.

Ayrıntılı belgeler için lütfen Kategoriler sayfasına bakın.

DCAT-AP
Vikiveri için DCAT-AP verileri, https://dcatap.wmflabs.org/ uç noktasında SPARQL olarak mevcuttur.

Erişmek için SPARQL uç noktası: https://dcatap.wmflabs.org/sparql

Verilerin kaynağı: https://dumps.wikimedia.org/wikidatawiki/entities/dcatap.rdf

Veri almak için örnek sorgu:

Bağlantılı Veri Parçaları uç noktası
Ayrıca Üçlü Model Parçaları arayüzünü kullanarak veritabanını sorgulamayı da destekliyoruz. Bu, üçlünün bir veya iki bileşeninin bilindiği ve bu şablonla eşleşen tüm üçlüleri almanız gereken üçlü verilere ucuz ve verimli bir şekilde göz atmanızı sağlar. Bağlantılı Veri Parçaları sitesinde daha fazla bilgiye bakın.

Arayüze şu URL ile erişilebilir:. Bu hizmet, Blazegraph veritabanının üstünde uygulanmaktadır, bu nedenle Sorgu Hizmeti ile aynı gecikmeye sahip olacaktır. Örnek istekler:


 * https://query.wikidata.org/bigdata/ldf?subject=http%3A%2F%2Fwww.wikidata.org%2Fentity%2FQ146 - konusuna sahip tüm üçlüler
 * https://query.wikidata.org/bigdata/ldf?subject=&predicate=http%3A%2F%2Fwww.w3.org%2F2000%2F01%2Frdf-schema%23label&object=%22London%22%40en - İngilizce etiketi "London" olan tüm üçlüler

,  ve   parametreleri için şu anda yalnızca tam URL'lerin desteklendiğini unutmayın.

Varsayılan olarak, HTML arayüzü görüntülenir, ancak  HTTP başlığı ile tanımlanan çeşitli veri biçimleri mevcuttur.

Veriler, sayfa boyutu 100 üçlü olacak şekilde sayfalar halinde döndürülür. Sayfalar 1'den başlayarak numaralandırılır ve sayfa numarası  parametresi ile tanımlanır.

Bağımsız hizmeti
Hizmet açık kaynaklı bir yazılım olduğundan, aşağıda verilen yönergeleri kullanarak hizmeti herhangi bir kullanıcının sunucusunda çalıştırmak da mümkündür.

Donanım önerileri Blazegraph belgelerinde bulunabilir.

Hizmeti Vikiveri Wikibase olmayan örneğe karşı çalıştırmayı planlıyorsanız, lütfen ek talimatlara bakın.

Kurulum
Hizmeti kurmak için tam hizmet paketini bir ZIP dosyası olarak indirmeniz önerilir, örn. Maven Central üzerinden, grup kimliği  ve yapı kimliği " " ile veya kaynak dağıtımını https://github.com/wikimedia/wikidata-query-rdf/'da klonlayın ve "mvn paketi" ile oluşturun. ZIP paketi,  altındaki   dizininde olacaktır.

Paket, bir .war uygulaması olarak Blazegraph sunucusunu, wikidata sitesinden yeni veriler getirmek için güncelleyici hizmetini çalıştırmak için gereken kitaplıkları, çeşitli görevleri kolaylaştırmak için komut dosyalarını ve  alt dizindeki GUI'yi içerir. GUI'yi kullanmak istiyorsanız, HTTP sunucunuzu hizmet verecek şekilde yapılandırmanız gerekecektir.

Varsayılan olarak, yalnızca http://localhost:9999/bigdata/namespace/wdq/sparql adresindeki SPARQL uç noktası yapılandırılır ve varsayılan Blazegraph GUI, http://localhost:9999/bigdata/ adresinde bulunur. Varsayılan yapılandırmada her ikisine de yalnızca localhost'tan erişilebildiğini unutmayın. Bunlara dışarıdan erişmeyi düşünüyorsanız, harici uç noktalar ve uygun bir erişim kontrolü sağlamanız gerekecektir.

Anlık görüntü sürümlerini kullanma
Yayımlanmamış bir anlık görüntü sürümünü yüklemek istiyorsanız (genellikle yayımlanan sürümde bir hata varsa ancak yeni sürüm henüz mevcut değilse bu gereklidir) ve kendi ikili dosyalarınızı derlemek istemiyorsanız, aşağıdakilerden birini kullanabilirsiniz:
 * https://github.com/wikimedia/wikidata-query-deploy - üretim ikili dosyalarını içeren dağıtım deposu.  çalışması gerekiyor. Kontrol edin ve " " yapın.
 * https://archiva.wikimedia.org/#artifact/org.wikidata.query.rdf/service adresinde Archiva anlık görüntü dağıtımları - en son sürümü, ardından Artifacts'i seçin ve indirmek için en son paketi seçin.

Loading data
Further install procedure is described in detail in the Getting Started document which is part of the distribution, and involves the following steps:


 * 1) Download recent RDF dump from https://dumps.wikimedia.org/wikidatawiki/entities/ (the RDF one is the one ending in  ).
 * 2) Pre-process data with the   script. This creates a set of TTL files with preprocessed data, with names like , etc. See options for the script below.
 * 3) Start Blazegraph service by running the   script.
 * 4) Load the data into the service by using  . Note that loading data is usually significantly slower than pre-processing, so you can start loading as soon as several preprocessed files are ready. Loading can be restarted from any file by using the options as described below.
 * 5) After all the data is loaded, start the Updater service by using.

Loading categories
If you also want to load category data, please do the following:


 * 1) Create namespace, e.g.  :
 * 2) Load data into it:

Note that these scripts only load data from Wikimedia wikis according to Wikimedia settings. If you need to work with other wiki, you may need to change some variables in the scripts.

Scripts
The following useful scripts are part of the distribution:

munge.sh
Pre-process data from RDF dump for loading.

Örnek:

loadData.sh
Load processed data into Blazegraph. Requires  to be installed.

Örnek:

runBlazegraph.sh
Run the Blazegraph service.

Örnek:

Inside the script, there are two variables that one may want to edit: Also, the following environment variables are checked by the script (all of them are optional):

runUpdate.sh
Run the Updater service.

It is recommended that the settings for the  and   options (or absence thereof) be the same for munge.sh and runUpdate.sh, otherwise data may not be updated properly.

Örnek:

Also, the following environment variables are checked by the script (all of them are optional):

Güncelleyici seçenekleri
The following options works with Updater app.

They should be given to the  script as additional options after , e.g.:.

Configurable properties
The following properties are configurable via adding them to the script run command in the scripts above:

Missing features
Below are features which are currently not supported:


 * Redirects are only represented as owl:sameAs triple, but do not express any equivalence in the data and have no special support.

Contacts
If you notice anything wrong with the service, you can contact the Discovery team by email on the list  or on the IRC channel.

Bugs can also be submitted to and tracked on the Discovery Phabricator board.

Ayrıca bakınız

 * WDQ to SPARQL syntax translator
 * SPARQL Query examples
 * Discovery team
 * WDQS Implementation notes
 * An introduction to SPARQL query syntax