Extension:WikibaseLexeme/Data Model/tr

Bu, WikibaseLexeme tarafından kullanılan kavramsal veri modelini tanımlayan canlı bir belgedir. Herhangi bir somut bağlama, uygulama, eşleşme veya serileştirmenin spesifikasyonu değildir.


 * Lexeme:
 * Lemma
 * Language
 * Lexical category
 * Statements
 * Forms:
 * Representation
 * Grammatical Features
 * Statements
 * Senses:
 * Gloss
 * Statements

WikibaseLexeme veri modeli, Wikibase'de sözcükler ve ifadeler gibi "Sözlükbirimleri" olarak işlenen verilerin yapısını açıklar. Öğeler kullanarak bu şeyleri modellemek teorik olarak mümkün olsa da, daha anlamlı bir özel model karmaşıklığı azaltmaya ve diğer sözcüklerle yeniden kullanımı ve eşlemeleri geliştirmeye yardımcı olur. Bu veri modeli kavramsaldır ("Hangi bilgileri desteklememiz gerekir?") Ve bu verilerin teknik olarak nasıl temsil edilmesi gerektiğini ("Yazılım hangi veri yapılarını kullanmalıdır?") Veya sözdizimsel olarak ("Veriler nasıl ifade edilmelidir?") bir dosyadır. Ayrı belgeler, JSON ve RDF (Kaynak Tanımlama Çerçevesi) içindeki Wikibase veri modeli serisinin serileştirilmesini açıklar. Sözlükbirimi veri modeli, sabit bir ontoloji gibi davranan sözlükbirimleri tanımlamak için gereken temel kavramları ve ilişkileri tanımlar. Bu ontoloji, Öğeler ve İfade bir sözlük için ayrıntılı modelleme kullanılmasına izin veren minimal bir iskele sağlar. Sözlükbirimi veri modelinin özellikleri Wikibase veri modeli, bu nedenle Vikiveri sözlüğü ve Wikibase veri modeli primer bu belgenin anlaşılmasında yardımcı olabilir. Sözlükbirimi veri modeli, Ontolex W3C topluluk grubu tarafından LEMON modeli ile uyum sağlamayı amaçlamaktadır, kullanışlı ve pratik. Bununla birlikte, Wikibase ruhuyla, Sözlükbirimi modeli, LEMON tarafından alınan daha resmi yaklaşımın aksine, gündelik işbirlikçi düzenleme için yeterince basit ve esnek olacak şekilde tasarlanmıştır.

Sözcükbirimi


Sözcükbirimi, bir dilin sözcük, ifade veya önek gibi sözcüksel bir öğesidir (Vikipedi2de Sözcükbirimi sayfasına bakın). Sözcükbirimleri, Wikibase veri modeli Varlıklar anlamındadır. Bir Sözcükbirimi aşağıdaki bilgiler kullanılarak tanımlanır:

In Wikidata we use the most general lexical category possible, e.g. affix and then instead describe which type of affix it is using an instance of-statement.
 * Bir kimlik. Sözcükbirimleri, "L" ile başlayan ve ondalık gösterimde doğal bir sayı olan kimliğe sahiptir, ör. . Bu kimlikler Sözcükbirime yöneten depo içinde benzersizdir. Kimlik, Sözcükbirime için benzersiz bir URI oluşturmak üzere bir havuzun konsept tabanı URI'sı ile birleştirilebilir.
 * Sözcükbirimin okunabilir bir temsili olarak kullanım için bir 'Baş Kelime' , ör. "koş".
 * Sözcükbirime ait  Dil . Bu somut bir Öğe kaynağıdır, ör. İngilizce için Q1860.
 * Sözcükbirimin ait olduğu Sözcüksel kategoridir . Bu somut bir Öğe kaynağı olarak verilmiştir, ör. Q34698 sıfat için.
 * Bir Form veya Sense'e özgü olmayan sözcükbirimi özelliklerini tanımlamak için İfadeler listesi (ör. dilbilgisel cinsiyet veya sözdizimsel işlevden türetilmiş)
 * Tipik olarak 2. kişi/tekil/geçmiş zaman gibi ilgili gramer özelliklerinin her kombinasyonu için bir tane olan Formlar listesi.
 * Sözcükçemin farklı anlamlarını açıklayan bir Mantıklar listesi (örneğin, Türkçe adı bank için "finans kurumu" ve "su kütlesinin kenarı").
 * A Lemma for use as a human readable representation of the lexeme, e.g. "run".
 * The  Language  to which the lexeme belongs. This is a reference to a concrete Item, e.g. Q1860 for English.
 * The Lexical category  to which the lexeme belongs. This is given as a reference to a concrete Item, e.g. Q34698 for adjective.
 * A list of Statements to describe properties of the lexeme that are not specific to a Form or Sense (e.g. derived from or grammatical gender or syntactic function).
 * A list of Forms, typically one for each relevant combination of grammatical features, such as 2nd person / singular / past tense.
 * A list of Senses, describing the different meanings of the lexeme (e.g. "financial institution" and "edge of a body of water" for the English noun bank).

Söz
Lemma, lexeme'in insan tarafından okunabilir bir temsilidir (Vikipedi'de Söz sayfasına bakın). Tipik olarak, sözcükbirimin kanonik formu (örneğin, fiillerin mastar formu) lemma olarak kullanılacaktır (ayrıca bakınız lemon:canonicalForm). Baş kelimeler basit dizeler değildir, ancak MultilingualTextValues, çünkü aynı baş kelimede birden fazla yazım olabilir. Sırpça ve Japonca gibi birden çok yazım kullanan diller için bu özellikle önemlidir.

Bir Baş Kelimesi tamamen boş olamaz, en az bir varyant sağlanmalıdır.

Not: Baş kelimeler benzersiz değildir ve Baş Kelime, Dil ve Sözlük kategorisinin birleşimi değildir. Aynı sözlük kategorisine sahip iki farklı sözlükbirimi, farklı verilere sahipse aynı dilde mevcut olabilir, cinsiyet, etimoloji, morfoloji (farklı formlar vb.) olabilir.

Biçim
Sözcükçenin morfoloji bir dizi Form olarak anlaşılmaktadır. Her form, bir sözlüğün bir cümlede alabileceği belirli bir sözdizimsel rol veya moda göre nasıl değiştiğini tanımlar (ayrıca bakınız lemon:Form).

Bir Form aşağıdaki bilgiler kullanılarak tanımlanır:


 * Bir kimlik. Formların ait oldukları Sözlükbirimi kimliğiyle başlayan, ardından bir tire ("-") ve "F" ile başlayan ve ondalık gösterimle doğal bir sayı gelen kimlikleri vardır: ör. . Bu kimlikler Sözlükbirimi yöneten depo içinde benzersizdir. Kimlik, Form için benzersiz bir URI oluşturmak üzere bir deponun kavram tabanı URI'si ile birleştirilebilir.
 * Formu bir dize olarak heceleyen bir temsil.
 * Verilen formun hangi sözdizimsel rol için geçerli olduğunu tanımlayan dilbilgisel özellikler listesi. Bunlar somut Öğesidir, örneğin; katılımcısı için Q814722.
 * Formu veya diğer Formlar veya Öğelerle ilişkilerini daha ayrıntılı açıklayan bir İfadeler listesi (ör. söyleniş sesi, ile kullanılan tekerlemeler, bölgede kullanılana kadar)

Temsil
Bir formun Temsili, bir metinde kullanılan yazılı formudur (compare lemon:writtenRep). Tıpkı Sözcükbirimleri gibi, Temsiller basit dizeler değildir, ancak MultilingualTextValues gibi, aynı formda birden çok komut dosyasında birden çok yazım olabilir.

Bir Temsil tamamen boş olamaz, en az bir varyant sağlanmalıdır.

Multiple forms with the same representation are allowed to enable adding usage examples demonstrating each of them. Example in Wikidata

Dil Bilimsel Özellik
Bir formun dilbilgisel özellikleri, hangi koşullar altında hangi formda sözdizimsel rolün kullanılacağını belirtir (lexinfo:morphosyntacticProperty ve Vikipedi'de dil bilgisel kategorisi sayfasına bakın). Dilin dilbilgisinin hangi koşullar altında belirli bir formun kullanılmasını gerektirdiğini ifade etmek için çoklu dilbilgisel özellikler birleştirilebilir. Dilbilgisel özellikler Öğeler kaynakçası olarak temsil edilir. Multiple grammatical features can be combined to express under which conditions the language's grammar requires a given form to be used. Grammatical features are represented as references to Items.

Anlam
Bir sözcükçenin duyuları, bir metinde temsil edebileceği farklı anlamlardır. Duyular doğal dil tanımları veya parlaklık olarak verilir. (Vikipedi'deki boyutsal tanımları karşılaştırır).

Bir his, aşağıdaki bilgiler kullanılarak tanımlanır:
 * Bir kimlik. Duyuların ait oldukları Sözcülbirimi kimliğinden başlayarak bir tire ("-") ve "S" ile başlayan ve ondalık gösterimle doğal bir sayı gelen kimlikleri vardır: ör. . Bu kimlikler Sözcükbirimini yöneten depo içinde benzersizdir. Kimlik, Sense için benzersiz bir URI oluşturmak üzere bir havuzun konsept temel URI'sı ile birleştirilebilir.
 * Doğal dili kullanarak Sense'nin anlamını tanımlayan bir Parlaklık.
 * Anlam ve duyu ve öğelerle ilişkilerini daha fazla açıklayan bir İfadeler listesi (ör. bu anlamda öğe, eşanlamlı sözcük, karşıt anlamlı sözcük, çağrışım, kayıt, o anlamına gelir, çağrıştırıyor).

In Wikidata image is also added to provide a culturally adapted image of the sense, e.g. of a letterbox or color that can vary greatly between cultures.
 * An ID. Senses have IDs starting with the ID of the Lexeme they belong to, followed by a hyphen ("-") and an "S", followed by a natural number in decimal notation: e.g. . These IDs are unique within the repository that manages the Lexeme. The ID can be combined with a repository's concept base URI to form a unique URI for the Sense.
 * A Gloss, defining the meaning of the Sense using natural language.
 * A list of Statements further describing the Sense and its relations to Senses and Items (e.g. item for this sense, synonym, antonym, connotation, register, denotes, evokes).

Açıklama
Bir duyunun parlaklığı duyunun doğal bir tanımını verir (Vikipedi'de Parlak ve skos:definition sayfalarına bakın). Parlaklara kaynak verilemez.

Lemmalar benzer şekilde, Parlaklar basit dizeler değildir, MultilingualTextValues olur. Bununla birlikte, sebep varyantlar için destek sağlamak değil, parlaklığın tamamen farklı dillerde verilmesine izin vermektir. Örn. Fransızca öğrenen bir Almanca için, Fransızca anlamında bir Almanca parlaklığa sahip olmak oldukça faydalı olacaktır.

Bir Parlaklık tamamen boş olamaz, en az bir dil sağlanmalıdır.

Short glosses of only a single or a few words should be avoided as it leaves too much space for interpretation of the meaning.

In Wikidata Glosses are often very similar to carefully crafted descriptions on Q-items. E.g. for apple the Q-items English description fruit of the apple tree is copied as gloss when using tools like MachtSinn to match lexemes and Q-items together and create missing senses.

Ayrıca bakınız

 * Sözcükbirimi veri modeli örnekleri