Extension:CommonsMetadata/tr

CommonsMetadata uzantısı, Wikimedia Commons sayfalarından meta verileri çıkarma girişimidir ancak diğer tüm Wikimedia projelerinde de mevcuttur. Resim açıklamasındaki şablonlara ve kategorilere bağlı olarak imageinfo API'ye bazı ekstra bilgiler ekler. Bir dizi uzantı/araç tarafından kullanılır (MediaViewer, VisualEditor, MobileFrontend, Mobil İçerik Hizmeti (MCS)) daha iyi açık kutuları veya görüntü seçimi iletişim kutuları sağlamak için.

Mevcut biçimindeki uzantının geçici bir çözüm olması amaçlanmıştır ve sonunda Commons'ta Vikiveri ile değiştirilmiştir.

Motivasyon ve tasarım seçenekleri
https://lists.wikimedia.org/pipermail/wikitech-l/2013-August/071593.html sayfasına bakın

Bu uzantının varsayımları aşağıdaki gibidir.


 * Gelecekte bir noktada, Vikiveri meta verilerin işlenmesini üstlenecek. Yakında yeniden değiştirilmesi gerekecek olan anlaşmazlık değişikliklerden kaçınmak için, uzantı şu anda olduğu gibi ortak meta verilerle çalışmalıdır (bu nedenle yeni ayrıştırıcı işlevlerini tanıtmaz). Bu nedenle ekran kazıma.


 * Ortak bir açıklama sayfasındaki alanların çoğunun içeriği zengin biçimlendirme içerir (Özellikle: Bağlantılar, eğik, kalın. Bazı durumlarda gömülü resimler gibi daha karmaşık şeyler)
 * Sonuç olarak, uzantı çıkışları html'yi ayrıştırdı (vikimetin berbat, düz metin verileri yakalamıyor)
 * Ayrıca, veriler (örneğin) makine tarafından biçimlendirilmiş tarihler yerine insan görüntüsü için biçimlendirilme eğilimindedir. Tarih alanı "yaklaşık 1600'ler" gibi bir şey söylediğinde, bunu kesin bir tarihe dönüştürmek zordur (otoh, birçok örnek olabilir).
 * Bunu ileriye taşımak için, vikide kontrol edilen exif meta verilerine biçimlendirme de uygulayın (Örneğin, commons kamera adını bir Vikipedi maddesine bağlar)


 * Açıklama sayfasından bilgi alamıyorsak, ancak dosyanın yazarı exif/XMP/iptc meta verilerinde etiketlenmişse, bunu bir yedek olarak kullanmalıyız.
 * İdeal olarak, böylesi bir sistem, Commons ve ortak olmayanlar kısımları ayrı olacak şekilde, olabildiğince ortak-denetimsel olacaktır.


 * Commons açıklama sayfalarında çok dilli açıklamalar bulunur. Pek çok kullanıcı muhtemelen yalnızca bir dil istiyor.
 * Bu uygulamada, tarihlere ve şeylere dil kurallarına göre uygulanır. Ek olarak, açıkça çok dilli alanlar (açıklama) için, tümünü veya yalnızca tek bir dili döndürme seçeneği vardır. Tek dil modunda bile, bazı şeyler yine de dile özgüdür (sayılar üzerindeki binlik ayırıcı gibi)

Test
Uzak resimlerle test ederken (örneğin,  etkinleştirdiyseniz Commons resimleri), CommonsMetadata'yı resmini açıklama sayfasını ayrıştırmaya ve meta verileri çıkarmaya zorlamak için   ayarlayabilirsiniz (normalde, uzak depoda CommonsMetadata da yüklüyse, API çıkışını oradan kopyalar).

Kullanım
imageinfo API'yi kullanın ve  ile   belirtilen bir görüntü bilgisi özelliği olarak ekleyin.

Örnek kullanım:


 * https://commons.wikimedia.org/w/api.php?action=query&prop=imageinfo&format=json&iiprop=extmetadata&iilimit=10&titles=File%3ACommon%20Kingfisher%20Alcedo%20atthis.jpg

Bu örneği API deneme tahtasında görüntüleyin:


 * https://www.mediawiki.org/wiki/Special:ApiSandbox#action=query&prop=imageinfo&format=json&iiprop=extmetadata&iilimit=10&titles=File%3ACommon%20Kingfisher%20Alcedo%20atthis.jpg

Verilen veriler
Uzantı şu anda yanıtın  alanında aşağıdaki öğeleri sağlamaktadır (alan adları, mümkün olduğunda, kullanılan IPTC-IIM biçimini EXIF başlıkları takip etmek için seçilmiştir):

Bilgi şablonundaki makine tarafından okunabilir verilere dayalı veriler:
 * ImageDescription - resim açıklaması
 * Artist - yazar adı (karmaşık HTML, birden çok yazar vb. içerebilir)
 * Credit - kaynak
 * DateTimeOriginal - oluşturma zamanı (mümkün olduğunda boşlukla ayrılmış ISO 8601 zaman damgası, ancak bir tarihin başka herhangi bir metinsel açıklaması olabilir, muhtemelen HTML karıştırılmış halde)
 * ObjectName - başlık (kitap/resim için; aksi takdirde yalnızca dosya adı)
 * Permission - şablonun İzin alanının içeriği. Pek çok şey olabilir (lisans şablonu, OTRS kimliği, nasıl atfedileceğine dair ayrıntılar...)
 * AuthorCount - yazarların olduğu şablonların sayısı (ör. Kitap, Fotoğraf...). Bir şablon tek bir dizede birden çok yazarı tanımlıyorsa gerçek yazarların sayısı daha yüksek olabilir.

Konum şablonundaki makine tarafından okunabilir verilere dayalı veriler:
 * GPSLatitude - enlem
 * GPSLongitude - boylam
 * GPSMapDatum - koordinat türü (şimdilik yalnızca  desteklenmektedir)

Lisans şablonundaki makine tarafından okunabilir verilere dayalı veriler: Çok lisanslı resimler için bu değerler şu anda güvenilir değildir.
 * LicenseShortName - kısa insan tarafından okunabilir lisans adı
 * LicenseUrl
 * UsageTerms
 * Copyrighted -  veya   (kamu malı resimler için)
 * Attribution - Sanatçı + Katkının yerini alması gereken özel ilişkilendirme (Bilgi şablonundan da kaynaklanabilir)
 * AttributionRequired - booleanish (T86726), atıfta bulunmak için yasal bir gereklilik olup olmadığını söyler
 * NonFree - booleanish, true, görselin özgür bir lisans kapsamında olmadığı anlamına gelir. (Yalnızca Commons olmayan resimler için kullanılır.)

Diğer veri:
 * CommonsMedadataExtension - meta veri ayrıştırıcı sürüm numarasını içerir; çoğunlukla dahili kullanım için
 * License - resmin lisansına ilişkin en iyi tahmin (çoğunlukla MediaViewer tarafından dahili kullanım için değişebilir; LicenseShortName muhtemelen daha güvenilirdir)
 * Categories - resim kategorilerinin -ayrılmış listesi.
 * Assessments - resminin değerlendirmelerinin -ayrılmış listesi (şu anda beş değer desteklenmektedir: poty, potd, featured, quality, valued). Kategori adlarının ayrıştırılmasına bağlı olarak, Commons'ta barındırılmayan resimler için muhtemelen çalışmayacaktır.
 * Restrictions - reuse restrictions such as trademarks or personality rights; an array of keywords (the class names from this table, without the  prefix). See also the restrict-* icons in MediaViewer.
 * DeletionReason - if set, the template is being considered for deletion. (Based on the nuke template, probably not reliable outside Commons.) It contains a deletion reason, but it is phrased to be applicable for a log entry, so it might be misleading (e.g. past tense when actually it is not yet decided whether the image will be deleted).