Extension:WikibaseLexeme/Data Model/ar

From mediawiki.org
This page is a translated version of the page Extension:WikibaseLexeme/Data Model and the translation is 98% complete.

هذا توثيق مستمر، يصف نموذج البيانات المفاهيمية التي تستخدمها WikibaseLexeme .

ليست تخصيص لأي ربط، تطبيق، تخطيط، أو تسلسل ملموس.

يصف نموذج بيانات WikibaseLexeme هيكل البيانات التي يتم التعامل معها كـ "مفردات" في قاعدة الويكي، مثل الكلمات والعبارات. من الممكن نظريا نمذجة هذا الكلام باستخدام العناصر، إلا أن النمذجة المتخصصة الأكثر تعبيرا تساعد على تقليل التعقيد، وتحسن من إعادة استخدام الكلام وربطه بالمفردات الأخرى. نمذجة البيانات هذه مفهومة! ("ما المعلومات التي يجب أن ندعمها؟") وكيفية تحديد تمثيل هذه البيانات تقنيا ("ما هو هيكل البيانات التي يجب أن يستخدمها البرنامج؟") أو نحويا ("كيف ينبغي التعبير عن البيانات في ملف؟) تصف المستندات المنفصلة تسلسل نموذج بيانات قاعدة الويكي في JSON (JavaScript Object Notation) وفي RDF (Resource Description Framework). يحدد نموذج بيانات المفردة المفاهيم الأساسية والعلاقات اللازمة لوصف المفردات، والتي تعمل بمثابة أنطولوجيا محددة. توفر هذه الأنطولوجيا الحد الأدنى من الدعائم التي تسمح باستخدام العناصر والبيانات للنمذجة التفصيلية لـلمفردة. تعتمد مواصفات نموذج بيانات المفردة على نموذج بيانات قاعدة الويكي، لذلك قد يكون مسرد ويكي بيانات ودليل نموذج بيانات قاعدة الويكي مفيدا في فهم هذا التوثيق. يهدف نموذج بيانات المفردة إلى التوافق مع نموذج LEMON حسب مجموعة مجتمع Ontolex W3C، عندئذ يكون مفيدا وعمليا. ومع ذلك، اعتبارا لروح قاعدة الويكي، تم تصميم نموذج المفردة ليكون بسيطا ومرنا بدرجة كافية للتحرير التعاوني عفويا، على عكس النهج الأكثر رسميا الذي يتبعه LEMON.

مفردة

تصوير لنموذج بيانات المفردة

تعد المفردة عنصرا معجميا للغة، ككلمة أو عبارة أو بادئة (مفردة على ويكيبيديا). تعد المفردات مكونات بمعنىً في نموذج بيانات قاعدة الويكي. يتم وصف المفردة باستخدام المعلومات التالية:

  • معرف. تحتوي المفردات على معرفات تبدأ بحرف "L" متبوعا برقم طبيعي من 1 الى ما لا نهاية، على سبيل المثال. L3746552. هذه المعرفات فريدة داخل المستودع الذي يدير المفردة. يمكن دمج المعرف مع مسار "URI" لقاعدة المستودع لتشكيل مسار "URI" فريد للمفردة.
  • مدخل لاستخدامه كتمثيل يمكن قراءته من قبل الإنسان للمفردة، على سبيل المثال "جرى".
  • اللغة التي تنتمي إليها المفردة. تشير إلى عنصر ملموس، على سبيل المثال. Q13955 للغة العربية.
  • التصنيف المعجمي الذي تنتمي إليها المفردة. يتم تقديم هذا التصنيف كإشارة إلى عنصر ملموس، على سبيل المثال. Q34698 للصفة.
  • قائمة البيانات لوصف خصائص المفردة والتي هي ليست خاصةً بالصيغة أو المعنى (على سبيل المثال. مشتق من أو الجنس النحوي أو الوظيفة النحوية).
  • قائمة الصيغ، عادةً صيغة لكل مجموعة ذات صلة من الميزات النحوية، مثل صيغة المخاطب / صيغة المفرد / الزمن الماضي.
  • قائمة المعاني، تصف المعاني المختلفة للمفردة (على سبيل المثال، "مؤسسة مالية" و"edge of a body of water" للاسم الإنجليزي bank أو "حشرة تنتج العسل" للاسم العربي نحلة).

Editorial Note: يجب أن نقدم بعض التلميحات فيما يتعلق بكيفية نمذجة الجنس النحوي باستخدام البيانات.

بيانات المفردة

نموذج من

في ويكي بيانات يتم استخدام عموما التصنيف المعجمي الأكثر شيوعا على سبيل المثال. اللاحقة ثم بدلا من وصف نوع تلك اللاحقة يتم استخدام بيان مع خاصية نموذج من.

أمثلة الاستخدام

في ويكي بيانات قرر المجتمع أن يكون لديه أمثلة على استخدام المفردة في مكان واحد لأنهم يعرفون أين يبحثون عنها بعد ذلك. لديهم خاصيتان توضيحيتان d:Property:P5830 و d:Property:P6072 للربط بالمعنى والصيغة الصحيحتين. يمكن أن تكون هناك أمثلة متعددة على فترات زمنية مختلفة. على سبيل المثال. كلمات قرون مختلفة لصيغ رسمية أو غير رسمية ومكتوبة أو منطوقة.

مدخل المدخل هو تمثيل يمكن قراءته من قبل الإنسان للمفردة (انظر مدخل على ويكيبيديا.) عادة، الصيغة المعيارية للمفردة (مثل صيغة المصدر للأفعال) ستستخدم كمدخل (انظر أيضا lemon:الصيغة المعيارية). المداخل ليست نصوص بسيطة، ولكنها قيم نصية متعددة اللغات، نظرا لأن نفس المدخل قد يكون له تهجئات متعددة. هذا مهم بشكل خاص للغات التي تستخدم كتابات متعددة مثل الصربية واليابانية.

Example: سيتضمن مدخل الاسم الإنجليزي "color" كلمة "color" للغة الإنجليزية البريطانية بالإضافة إلى كلمة "colour" للغة الإنجليزية الأمريكية.

لا يمكن أن يكون المدخل فارغا تماما، يجب توفير متغير واحد على الأقل.

ملاحظة: المداخل ليست فريدة من نوعها، وليست مزيجا من المدخل واللغة والتصنيف المعجمي. يمكن أن تكون هناك مفردتان مفترقتين لهما نفس التصنيف المعجمي في نفس اللغة إذا كانت لديهما بيانات مختلفة، فقد يكون نوع الجنس، وأصل الكلمة، والصرف (تصريف مختلف)، وما إلى ذلك.

Example: هناك اسمان ألمانيان للمدخل "See" ، يختلفان فقط في الجنس: "der See" تعني "البحيرة" و "die See" التي تعني "البحر". لا يمكن فهم هذين المعنيين على أنهما مفردة واحدة، لأن لهما صيغا مختلفة وفقا لجنسهما. An example where there would only be one Lexeme would be the German word "Schild", which for its meaning "Shield" can be either masculine or neutral gendered based on the region in Germany (neutral in the north and parts of central Germany).

صيغة

من المفهوم أن تصريف المفردة هي مجموعة من الصيغ. تحدد كل صيغة كيف تتغير المفردة استنادا إلى دورها التنظيمي الخاص أو الطريقة التي تتخذها في الجملة (انظر أيضا lemon:صيغة).

Example: يصبح الفعل الإنجليزي run بصيغة "running"في المضارع المستمر و "runs" في المفرد الغائب. ويصبح الفعل العربي كَانَ في صيغة المضارع المفرد المذكر يَكُونُ وفي صيغة المضارع المفرد المؤنث تَكُونُ.

يتم وصف الصيغة باستخدام المعلومات التالية:

  • معرف. تحتوي الصيغ على معرفات تبدأ بمعرف المفردة الذي تنتمي إليه، متبوعا بشرطة ("-") وحرف "F"، متبوعة بأرقام طبيعية: على سبيل المثال. L3746552-F7. هذه المعرفات فريدة داخل المستودع الذي يدير المفردة. يمكن دمج المعرف مع مسار URI لقاعدة المستودع لتكوين مسار URI فريد للصيغ.
  • التمثيل، تهجئة الصيغة بالكتابة.
  • قائمة بالميزات النحوية التي تحدد الدور النحوي الذي تنطبق عليه الصيغة المحددة. يتم تقديمها كإشارة لعناصر ملموسة، على سبيل المثال. Q814722 لاسم الفاعل.
  • قائمة البيانات التي تصف الصيغة أو علاقتها بالصيغ أو العناصر الأخرى (مثلا صوت النطق، والقوافي مع، المستخدمة، والمستخدمة في المنطقة)

Planned Feature:
قد نضيف تعبير "نوع الصيغة" الذي يحدد ما المعلومات التي تحتوي عليها الصيغة. يمكن أن يكون نوعا جديدا محتملا "غير موجود"، مما يسمح بتمثيل الصيغ التي من المعروف أنها غير موجودة (مثل صيغة المصدر للكلمة الإنجليزية "may"، أو صيغة الجمع للكلمة الألمانية "Schnee"). قد تحتوي صيغة "غير الموجودة" على بيانات وميزات نحوية، ولكن بدون تمثيلات.

تمثيل

تمثيل الصيغة هي كتابة الصيغة، كما يستخدم في النص (قارن lemon:writtenRep). تماما مثل المداخل، فإن التمثيلات ليست كتابات بسيطة، ولكنها قيم نصية متعددة، لأن نفس الصيغة قد يكون لها تهجئات متعددة، ربما في كتابات متعددة.

لا يمكن أن يكون التمثيل فارغا تماما، يجب توفير متغير واحد على الأقل.

يُسمح للصيغ المتعددة التي لديها نفس التمثيل بتمكين إضافة أمثلة الاستخدام توضيحا لكلاهما. مثال في ويكي بيانات

ميزة نحوية تُحدد ميزات الصيغة النحوية في ظل الحالات النحوية أو التي يتم فيها استخدام الدور النحوي لتلك الصيغة (انظر lexinfo:morphosyntacticProperty والتصنيف المعجمي على ويكيبيديا). يمكن دمج ميزات نحوية متعددة للتعبير عن الحالات التي تتطلب فيها قواعد اللغة صيغة معينة لاستخدامها. يتم تمثيل الميزات النحوية كإشارات بالعناصر.

Example: يمكن تعريف صيغة الجمع المتكلم في زمن المضارع من خلال ثلاث ميزات، يتم تمثيلها بواسطة عناصر ويكي بيانات: Q192613 (المضارع) و Q21714344 (المتكلم) و Q146786 (الجمع).

Editorial Note: كيف ننمذج "a" ضد "an"؟ ما العنصر الذي سنستخدمه كميزة لوصف هذا؟ هل نحتاج إلى نص إضافي لملاحظات الاستخدام بعد كل شيء؟

Editorial Note: يجب أن نلاحظ أن الصيغ الخاصة بالجنس مثل "baroness" يمكن التعامل معها على أنها صيغ، أو كمفردات منفصلة، حسب الحاجة.

معنى

إن معنى المفردة يختلف عن المعاني التي قد تمثلها في النص. تعطى للمعانى تعريفات اللغة الطبيعية أو تفسيرات (قارن تعريفات مقصودة على ويكيبيديا).

يتم وصف المعنى باستخدام المعلومات التالية:

  • معرف. المعاني لها معرفات تبدأ بمعرف المفردة الذي تنتمي إليه، متبوعا بشرطة ("-") وحرف "S"، متبوعة بأرقام طبيعية: على سبيل المثال. L3746552-S4. هذه المعرفات فريدة داخل المستودع الذي يدير المفردة. يمكن دمج المعرف مع مسار URI لقاعدة المستودع لتشكيل مسار URI فريد للمعنى.
  • تفسير، يحدد المعنى الذي تعنيه باستخدام اللغة الطبيعية.
  • قائمة البيانات التي تصف أيضا المعنى وعلاقاته بالمعاني والعناصر (على سبيل المثال، عنصر لهذا المعنى، المرادف، الضد، الدلالة، اللهجة الخاصة، المقصد). في ويكي بيانات، تمت إضافة الصورة لتوفير صورة ملائمة ثقافيا للمعنى، على سبيل المثال. صندوق الرسائل أو اللون الذي يمكن أن يختلف اختلافا كبيرا بين الثقافات.

Editorial Note: We should find a good place to address a common source of misunderstandings: Senses can be connected to Wikidata Items via an appropriate Statement they evoke or denote (compare lemon:denotes and lemon:evokes). However, such a connection should not be interpreted as the lexeme actually representing the concept defined by the item (compare lemon:LexicalSense and lemon:LexicalConcept). لا سيما، إذا كان لدى مفردتان معنان يشيران إلى نفس المفهوم بهذه الطريقة، فإن هذا لا يعني أن المفردتين مترادفتين.

مثال: يمكن أن يكون للمفردتان الإنجليزيتان صفة "ساخن hot" وصفة "بارد cold" معنى يشير إلى Q11466 (درجة الحرارة)، على الرغم من أنهما متضدتان.

Editorial Note: يجب أن نصف كيف يمكن وصف وظيفة الكلمة لأشياء مثل "إلى" أو "في"، باستخدام البيانات الموجودة على المفردة. يجب أن نوضح أيضا أن الكلمات الوظيفية لا ينبغي أن يكون لها معاني. هل نحتاج إلى نص إضافي لملاحظات الاستخدام؟

Planned Feature:
Lorem Ipsum

تفسير

للمعنى تفسير وهو تعريف طبيعي للمعنى (انظر تفسير على ويكيبيديا و skos:تعريف). لا يمكن الإشارة الى التفسيرات.

على غرار المداخل، فإن التفسيرات ليست كتابات بسيطة، ولكنها قيم نصية متعددة. ومع ذلك، فإن السبب لا يكمن في تقديم الدعم للاختلافات، ولكن للسماح بتقديم تفسير بلغات مختلفة تماما. على سبيل المثال. سيكون من المفيد جدا أن يكون لدى المتعلم الألماني للفرنسية تفسيرا ألمانيا للمعنى الفرنسي.

لا يمكن أن يكون التفسير فارغا تماما، يجب توفير لغة واحدة على الأقل. يوفر التفسير الجيد فاصلا صغيرا أو معدوما للالتباس حول المعنى. يجب أن تحتوي المفردات ذات المعاني المتعددة على تفسير يمكن تمييزه بسهولة عن بعضهم البعض.

يجب تجنب استخدام التفسيرات القصيرة التي تتكون من كلمة أو كلمات قليلة لأنها تترك فاصلا كبيرا جدا لتفسير المعنى.

غالبا ما تكون التفسيرات في ويكي بيانات مشابهة جدا للأوصاف المصممة بدقة للعناصر-Q. على سبيل المثال. بالنسبة إلى التفاح، يتم نسخ فاكهة من شجرة التفاح في وصف اللغة الإنجليزية على شكل تفسير عند استخدام أدوات مثل MachtSinn لمطابقة المفردات والعناصر معا وإنشاء المعاني المفقودة.

انظر أيضا