راهنما:ترجمه محتوا/ترجمه کردن/ترجمه ماشینی اولیه

From mediawiki.org
This page is a translated version of the page Help:Content translation/Translating/Initial machine translation and the translation is 40% complete.
PD توجه: شما در هنگام ویرایش این صفحه، موافق با انتشار مشارکت‌هایتان تحت CC0 هستید. صفحه‌های راهنمای مالکیت عمومی را برای اطلاعات بیشتر ببینید. PD

هنگام افزودن یک پاراگراف جدید به ترجمه، می‌توانید از ابتدا شروع کنید یا از ترجمهٔ خودکار به عنوان نقطهٔ شروع استفاده کنید. در صورت وجود، ترجمهٔ ماشینی به طور پیش فرض به عنوان ترجمه اولیه استفاده می‌شود. گزینه‌های مختلف، جزئیات در مورد در دسترس بودن آنها، و ملاحظات هنگام استفاده از ترجمه ماشینی در زیر توضیح داده شده است.

گزینه‌هایی برای ترجمه اولیه

گزینه‌های «ترجمه اولیه» در ستون ابزار به شما امکان می‌دهد محتوای اولیه را برای استفاده به عنوان نقطه شروع برای هر پاراگراف تعیین کنید. گزینه‌های موجود به شرح زیر است:

  • Use a machine translation service. This allows you to start with an automatically translated version of the original paragraph.

The number and name of these options will vary. Options such as "Use Apertium" or "Use Yandex" will be available depending on the supported languages for these services (more on this on the next section).

  • Copy original content. The original paragraph will be copied over into the translation.

Although content will remain in the original language, some elements are adapted to the target wiki. for example, links will point to the corresponding article in the target language, and templates will be converted into the equivalent ones. Translators still have to rewrite the content completely, but the adapted elements may be easier to reuse.

  • Start with an empty paragraph. Starting with an empty paragraph can be useful in cases where the alternative content requires more work than just typing it.

You can quickly switch between the different approaches independently on each paragraph, since each one may work best on different kinds of content. Switching between the different approaches preserves the changes you made on the paragraph. In this way, you can try a different approach even if you started editing the original one without the fear to lose your changes if you finally decide to go back to the original approach. Two additional options are relevant in this context:

  • The reset translation option is available when you made modifications to the initial content provided.

It allows you to restore the initial content by discarding the changes you made.

  • The mark as default option is available when you select an approach for a paragraph that is not the default.

It allows you to set the default approach for the next paragraphs that are added to the translation. This can be very convenient if you found that a particular translation service works generally better than the default one.

دسترس‌پذیری ترجمهٔ ماشینی

Content translation integrates several translation services, and each service supports a different set of languages. The services supported are listed below with a link to the list of languages they support:

The lists of languages above point to the configuration code to make sure that the information is in sync with the way the tool currently works. The lists show the language code for the source language at the initial indentation level and the codes of all the supported target languages below it.

You can also check the available services for a specific language pair using our APIs. In this example for the Spanish-Catalan pair, you can see that Apertium is the default service (first in the list) among the other services available.

Languages are enabled gradually, based on the observed results and community feedback. It is possible that machine translation for some languages has not been enabled yet, even if they are supported by the underlying services.

بهبود خدمات ترجمه موجود

When you publish a translation with Content Translation you are helping translation services improve. All the corrections you make to the initial machine translations are exposed through an API and data dumps and can be potentially used to improve existing services. In addition to that, some of the translation services listed above provide specific ways you can contribute to their projects.

MinT

The translations provided by MinT are based on translation models such as NLLB-200 and OpusMT. The training data compiled by the Opus project is resused by many translation models, and you can contribute to it in order to help improve the translation quality for your language.

OpusMT is an open source neural machine translation system that is trained with multilingual documents freely licensed and available online. This open corpus is used to train the translation system, and expanding the corpus will lead to better translations. The contents generated by using Content Translation are integrated automatically in the corpus, but you can contribute to expand the corpus further:

  • Propose new sources to be integrated in the open corpus. You can contact Jörg Tiedemann to propose a new data source to expand the corpus.

You can upload translated documents in various formats including translated webpages to be incorporated to the corpus.

  • Try language models locally with OPUS-CAT (available for Windows)
  • Contribute to other projects that contribute their translations to this open corpus such as Tatoeba, an on-line open community collecting translation for sentences in many languages.

OpusMT is based on MarianNMT which is also an open source project. People with technical knowledge and interested in machine learning can also contribute to improve it.

Apertium

Apertium is an open source rule-based translation system. You can contribute to the project by encoding the language rules of your language. This process requires both linguistic and advanced technical knowledge, but you can get support from the Apertium team to expand the translation support for a new language pair.

مترجم گوگل

مترجم گوگل یک پروژهٔ منبع باز نیست، اما هنوز هم راه‌هایی برای مشارکت کاربران وجود دارد:

گسترش پشتیبانی زبان با خدمات ترجمه جدید

ترجمهٔ محتوا به عنوان یک پلتفرم توسعه پذیر طراحی شده است. بنابراین امکان توسعه مشتریان جدید برای ادغام خدمات ترجمه اضافی وجود دارد. برخی ملاحظات در مورد نحوه ادغام خدمات ترجمه:

  • ترجمه‌های ماشینی و اصلاحات کاربر صورت گرفته به عنوان بخشی از داده‌های ترجمه‌های انتشاریافته منتشر می‌شود که می‌تواند منبع مفیدی برای ایجاد یا بهبود خدمات ترجمه شما باشد.
  • سرویس‌های خارجی ادغام شده فقط محتوای ویکی در دسترس عموم را دریافت می‌کنند و نسخه ترجمه شده‌ای از این محتوا را که با مجوزهای استفاده شده در ویکی سازگار است، برمی‌گرداند. هیچ اطلاعات شخصی با خدمات ترجمه به اشتراک گذاشته نمی‌شود.

بازخورد در مورد پشتیبانی ارائه شده برای هر زبان بسیار مفید است. لطفاً به ما اطلاع دهید که آیا پشتیبانی از برخی زبان‌ها را از دست داده اید یا گزینه‌های با کیفیت بالاتری برای آن موجود است. شما می‌توانید چنین بازخوردی را در صفحهٔ بحث پروژه یا در این تیکت ارائه دهید.


ملاحظات در مورد ترجمهٔ ماشینی

ترجمهٔ ماشینی زمانی که به عنوان یک نتیجهٔ نهایی در نظر گرفته شود، زیاد ایده آل نیست. با این حال، بسیاری از کاربران آن را به عنوان یک نقطهٔ آغاز بسیار مفید می‌دانند. لطفاً حتماً محتوا را از این منظرهای مختلف بررسی کنید:

  • مطمئن شوید که معنای اصلی حفظ شده است.
  • بررسی کنید که هیچ اطلاعاتی ناپدید نشده باشد، به خصوص برای عناصری مانند پیوندها، مراجع و الگوهایی که شامل اطلاعاتی هستند که همیشه در ظاهر قابل مشاهده نیستند.
  • محتوای ترجمه شده را بخوانید تا مطمئن شوید که به طور طبیعی به عنوان یک صفحهٔ مستقل خوانده می‌شود.

محدودیت‌ها با عناصر پیچیده

در برخی موارد ممکن است محتوا آنطور که انتظار می‌رود در ترجمه ظاهر نشود:

  • برخی از خدمات پشتیبانی‌شده فقط با متن ساده کار می‌کنند. این بدان معنی است که قالب‌بندی و عناصر محتوای غنی مانند پیوندها و نقل قول‌ها از مقالهٔ اصلی در ترجمه ناپدید می‌شوند و ترجمهٔ محتوا باید حدس بزند که آن موارد در متن ترجمه‌شده به کجا تعلق دارند. Re-adding those elements is not always perfect and some elements may be in the wrong position or applied to the wrong part of the text.
  • Complex elements such as references or templates may use a different structure in each language, which makes it hard to transfer the content from one language into the other.

Make sure to review the contents inside those elements to make sure there is no important information missing.

اجبار بازبینی برای ترجمه ماشینی

چندین مکانیزم خودکار برای اجبار بازبینی محتویات اولیه وجود دارد. به این ترتیب، ابزار اطمینان حاصل می‌کند که ترجمهٔ خودکار اولیه قبل از انتشار مطالب به اندازه کافی بررسی شده است.