Extension:WikibaseLexeme/Data Model/tr

Bu, WikibaseLexeme tarafından kullanılan kavramsal veri modelini tanımlayan canlı bir belgedir. Herhangi bir somut bağlama, uygulama, eşleşme veya serileştirmenin spesifikasyonu değildir.


 * Lexeme:
 * Lemma
 * Language
 * Lexical category
 * Statements
 * Forms:
 * Representation
 * Grammatical Features
 * Statements
 * Senses:
 * Gloss
 * Statements

WikibaseLexeme veri modeli, Wikibase'de sözcükler ve ifadeler gibi "Sözlükbirimleri" olarak işlenen verilerin yapısını açıklar. Teorik olarak bu şeyleri Öğeler kullanarak modellemek mümkün olsa da, daha anlamlı bir uzman model karmaşıklığı azaltmaya ve yeniden kullanım ve diğer kelime dağarcığıyla eşleştirmeleri geliştirmeye yardımcı olur. Bu veri modeli kavramsaldır ("Hangi bilgileri desteklememiz gerekir?") Ve bu verilerin teknik olarak nasıl temsil edilmesi gerektiğini ("Yazılım hangi veri yapılarını kullanmalıdır?") Veya sözdizimsel olarak ("Veriler nasıl ifade edilmelidir?") bir dosyadır. Ayrı belgeler, JSON ve RDF (Kaynak Tanımlama Çerçevesi) içindeki Wikibase veri modeli serisinin serileştirilmesini açıklar. Sözlükbirimi veri modeli, sabit bir ontoloji gibi davranan sözlükbirimleri tanımlamak için gereken temel kavramları ve ilişkileri tanımlar. Bu ontoloji, Öğeler ve İfade bir sözlük için ayrıntılı modelleme kullanılmasına izin veren minimal bir iskele sağlar. Sözlükbirimi veri modelinin özellikleri Wikibase veri modeli, bu nedenle Vikiveri sözlüğü ve Wikibase veri modeli primer bu belgenin anlaşılmasında yardımcı olabilir. Sözlükbirimi veri modeli, Ontolex W3C topluluk grubu tarafından LEMON modeli ile uyum sağlamayı amaçlamaktadır, kullanışlı ve pratik. Bununla birlikte, Wikibase ruhuyla, Sözlükbirimi modeli, LEMON tarafından alınan daha resmi yaklaşımın aksine, gündelik işbirlikçi düzenleme için yeterince basit ve esnek olacak şekilde tasarlanmıştır.

Sözcükbirimi


Sözcükbirimi, bir dilin sözcük, ifade veya önek gibi sözcüksel bir öğesidir (Vikipedi2de Sözcükbirimi sayfasına bakın). Sözcükbirimleri, Wikibase veri modeli Varlıklar anlamındadır. Bir Sözcükbirimi aşağıdaki bilgiler kullanılarak tanımlanır:


 * Bir kimlik. Sözcükbirimleri, "L" ile başlayan ve ondalık gösterimde doğal bir sayı olan kimliğe sahiptir, ör. . Bu kimlikler Sözcükbirime yöneten depo içinde benzersizdir. Kimlik, Sözcükbirime için benzersiz bir URI oluşturmak üzere bir havuzun konsept tabanı URI'sı ile birleştirilebilir.
 * Sözcükbirimin okunabilir bir temsili olarak kullanım için bir 'Baş Kelime' , ör. "koş".
 * Sözcükbirime ait  Dil . Bu somut bir Öğe kaynağıdır, ör. İngilizce için Q1860.
 * Sözcükbirimin ait olduğu Sözcüksel kategoridir . Bu somut bir Öğe kaynağı olarak verilmiştir, ör. Q34698 sıfat için.
 * Bir Form veya Sense'e özgü olmayan sözcükbirimi özelliklerini tanımlamak için İfadeler listesi (ör. dilbilgisel cinsiyet veya sözdizimsel işlevden türetilmiş)
 * Tipik olarak 2. kişi/tekil/geçmiş zaman gibi ilgili gramer özelliklerinin her kombinasyonu için bir tane olan Formlar listesi.
 * Sözcükçemin farklı anlamlarını açıklayan bir Mantıklar listesi (örneğin, Türkçe adı bank için "finans kurumu" ve "su kütlesinin kenarı").

Söz
Lemma, lexeme'in insan tarafından okunabilir bir temsilidir (Vikipedi'de Söz sayfasına bakın). Tipik olarak, sözcükbirimin kanonik formu (örneğin, fiillerin mastar formu) lemma olarak kullanılacaktır (ayrıca bakınız lemon:canonicalForm). Baş kelimeler basit dizeler değildir, ancak MultilingualTextValues, çünkü aynı baş kelimede birden fazla yazım olabilir. Sırpça ve Japonca gibi birden çok yazım kullanan diller için bu özellikle önemlidir.

Bir Baş Kelimesi tamamen boş olamaz, en az bir varyant sağlanmalıdır.

Not: Baş kelimeler benzersiz değildir ve Baş Kelime, Dil ve Sözlük kategorisinin birleşimi değildir. Aynı sözlük kategorisine sahip iki farklı sözlükbirimi, farklı verilere sahipse aynı dilde mevcut olabilir, cinsiyet, etimoloji, morfoloji (farklı formlar vb.) olabilir.

Biçim
Sözcükçenin morfoloji bir dizi Form olarak anlaşılmaktadır. Her form, bir sözlüğün bir cümlede alabileceği belirli bir sözdizimsel rol veya moda göre nasıl değiştiğini tanımlar (ayrıca bakınız lemon:Form).

Bir Form aşağıdaki bilgiler kullanılarak tanımlanır:


 * Bir kimlik. Formların ait oldukları Sözlükbirimi kimliğiyle başlayan, ardından bir tire ("-") ve "F" ile başlayan ve ondalık gösterimle doğal bir sayı gelen kimlikleri vardır: ör. . Bu kimlikler Sözlükbirimi yöneten depo içinde benzersizdir. Kimlik, Form için benzersiz bir URI oluşturmak üzere bir deponun kavram tabanı URI'si ile birleştirilebilir.
 * Formu bir dize olarak heceleyen bir temsil.
 * Verilen formun hangi sözdizimsel rol için geçerli olduğunu tanımlayan dilbilgisel özellikler listesi. Bunlar somut Öğesidir, örneğin; katılımcısı için Q814722.
 * Formu veya diğer Formlar veya Öğelerle ilişkilerini daha ayrıntılı açıklayan bir İfadeler listesi (ör. söyleniş sesi, ile kullanılan tekerlemeler, bölgede kullanılana kadar)

Temsil
A form's Representation is its written form, as used in a text (compare lemon:writtenRep). Just like Lemmas, Representations are not simple strings, but MultilingualTextValues, since the same form may have multiple spellings, possibly in multiple scripts.

A Representation cannot be entirely empty, at least one variant has to be provided.

Dil Bilimsel Özellik
A form's grammatical features specify under which conditions or in which syntactic role that form is used (see lexinfo:morphosyntacticProperty and grammatical category on Wikipedia). Multiple grammatical features can be combined to express under which conditions the language's grammar requires a given form to be used. Grammatical features are represented as references to Items.

Anlam
The senses of a lexeme are different meanings which it may represent in a text. The senses are given as natural language definitions or glosses (compare intensional definitions on Wikipedia).

A sense is described using the following information:
 * An ID. Senses have IDs starting with the ID of the Lexeme they belong to, followed by a hyphen ("-") and an "S", followed by a natural number in decimal notation: e.g. . These IDs are unique within the repository that manages the Lexeme. The ID can be combined with a repository's concept base URI to form a unique URI for the Sense.
 * A Gloss, defining the meaning of the Sense using natural language.
 * A list of Statements further describing the Sense and its relations to Senses and Items (e.g. translation, synonym, antonym, connotation, register, denotes, evokes).

Açıklama
A sense's gloss gives a natural definition of the sense (see Gloss on Wikipedia and skos:definition). Similar to Lemmas, Glosses are not simple strings, but MultilingualTextValues. However, the reason is not providing support for variants, but to allow the gloss to be given in entirely different languages. E.g. it would be quite useful for a German learning French to have a German gloss for a French word.

A Gloss cannot be entirely empty, at least one language has to be provided.

Ayrıca bakınız

 * Sözcükbirimi veri modeli örnekleri