Jump to content

Help:Content translation/Translating/Initial machine translation/anp

From mediawiki.org
This page is a translated version of the page Help:Content translation/Translating/Initial machine translation and the translation is 44% complete.
PD ध्यान दहो: जबै आपनै ई पन्ना क संपादित करै छियै, त आपनै अपनौ योगदान क CC0 के अंतर्गत द रहलौ छियै। जादे जानकारी वास्तें सार्वजनिक ज्ञानक्षेत्र पन्ना सहायता के सहायता ला। PD

जेखनी अनुवादौ मँ एगो नवका अनुच्छेद जोड़ै के होय छै, तोंय सुरू सँ आरंभ करि सकै छौ या एगो स्वचालित अनुवाद केरौ उपयोग एगो आरंभिक बिंदु केरौ रूप मँ करि सकै छौ। उपलब्ध रहला पँ, मशीनी अनुवाद केरौ उपयोग अपनै सँ एगो आरंभिक अनुवाद केरौ रूप मँ करलौ जाय छै। भांति-भांति विकल्प सिनी, ओकरौ उपलब्धता केरौ बारे मँ जानकारी, आरो मशीनी अनुवाद केरौ उपयोग करै समय ध्यान राखै वाला बात सिनी नीच्चँ देलौ गेलौ छै।

आरंभिक अनुवाद लेली विकल्प

टूल्स कॉलम मँ "आरंभिक अनुवाद" विकल्प सिनी तोरा ई तय करै केरौ क्षमता दै छै के हर अनुच्छेद केरौ लेली कोन आरंभिक सामग्री केरौ उपयोग एगो आरंभिक बिंदु केरौ रूप मँ करलौ जाय। उपलब्ध विकल्प सिनी देलौ गेलौ छै:

  • एगो मशीनी अनुवाद सेवा केरौ उपयोग करौ। ई तोरा मूल अनुच्छेद केरौ एगो अपनै सँ अनुवाद होलौ संस्करण केरौ साथ आरंभ करै केरौ छिमता दै छै। हैय विकल्प सिनी केरौ संख्या आरो नाम अलग-अलग होतै। विकल्प जेना "Use Apertium" या "Use Yandex" हैय सेवा सिनी केरौ लेली समर्थित भाषा सिनी केरौ आधार पँ उपलब्ध होतै (एकरौ बारे मँ बेसी जानकारी अगला भागौ मँ छै)।

मूल सामग्री क कॉपी करौ सँ मूल अनुच्छेद अनुवादौ मँ कॉपी करि देलौ जैतै। भले सामग्री मूल भाषा मँ बनलौ रहतै, कुछ तत्व सिनी क लक्ष्य विकि केरौ हिसाब सँ बदललौ जाय छै। उदाहरण केरौ लेली, लिंक सिनी लक्ष्य भाषा मँ संबंधित लेख केरौ ओरी इंकित करतै, आरो टेम्पलेट सिनी क ओकरौ बराबर वाला मँ बदलि देलौ जैतै। अनुवादक सिनी क तभियो सामग्री क पूरा पूरी फेर सँ लिखॅ पड़ै छै, पर बदललौ तत्व सिनी फेर सँ उपयोग करै मँ आसान होय सकै छै।

  • एगो खाली अनुच्छेद केरौ साथ आरंभ करौ एगो खाली अनुच्छेद केरौ साथ आरंभ करै के उ मामला मँ उपयोगी होय सकै छै जहाँ वैकल्पिक सामग्री क खाली टाइप करै सँ बेसी काम केरौ जरूरत होय छै।

तोंय हर अनुच्छेद पँ अलग-अगल तरीका सिनी केरौ बीच तेजी सँ बदलि सकै छौ, जबकि हर तरीका अलग-अलग तरह के सामग्री पँ सब्भे सँ निक्कौ काम करै सकै छै। अलग-अलग तरीका सिनी केरौ बीच बदलला सँ तोंय जे अनुच्छेद पँ बदलाव करलँही उ सुरक्षित रहै छै। हैय तरीका सँ, तोंय एगो अलग तरीका आजमाय सकै छौ, भले तोंय मूल वाला क संपादित करना सुरू करि देलहौ, बिना अपनौ बदलाव सिनी क खोनै केरौ डर सँ, यदि तोंय अंत मँ मूल तरीका पँ वापस जाय केरौ फैसला करै छौ। दुगो अतिरिक्त विकल्प सिनी हैय संदर्भ मँ प्रासंगिक छै:

  • अनुवाद क रीसेट करौ विकल्प तेखनी उपलब्ध होय छै जेखनी तोरौ देलौ गेलौ आरंभिक सामग्री मँ बदलाव करभौ। ई तोरा अपनौ करलौ बदलाव सिनी क मेटाय क आरंभिक सामग्री क फेरु सँ लानै केरौ क्षमता दै छै।

डिफ़ॉल्ट केरौ रूप मँ चिह्नित करौ विकल्प तेखनी उपलब्ध होय छै जेखनी तोंय एगो अनुच्छेद केरौ लेली ऐन्हौ तरीका चुनै छौ जे डिफ़ॉल्ट नाय छै। ई तोरा अगला अनुच्छेद सिनी केरौ लेली डिफ़ॉल्ट तरीका सेट करै केरौ छिमता दै छै जे अनुवाद मँ जोड़लौ जैतै। ई बहुत सुविधाजनक होय सकै छै यदि तोरा ई पता चललै के कोय खास अनुवाद सेवा डिफ़ॉल्ट वाला सँ आम तौर पँ बेसी निक्कौ काम करै छै।

यांत्रिक अनुवाद उपलब्धता

सामग्री अनुवाद कत्तेक अनुवाद सेवा सिनी क एकीकृत करै छै, आरो हर सेवा भाषा सिनी केरौ एगो अलग सेट केरौ समर्थन करै छै। समर्थित सेवा सिनी नीच्चँ हुनकौ द्वारा समर्थित भाषा सिनी केरौ सूची केरौ लिंक केरौ साथ देलौ गेलौ छै:

उप्पर देलौ भाषा सिनी केरौ सूची कॉन्फ़िगरेशन कोड केरौ ओरी इंकित करै छै ई सुनिश्चित करै केरौ लेली के जानकारी व तरीका केरौ साथ सिंक मँ छै जेना टूल वर्तमान मँ काम करै छै। सूची सिनी स्रोत भाषा केरौ लेली भाषा कोड क आरंभिक इंडेंटेशन स्तर पँ आरो ओकरौ नीच्चँ सब्भे समर्थित लक्ष्य भाषा सिनी केरौ कोड सिनी क देखाबै छै।

तोंय API सिनी केरौ उपयोग करि क एगो खास भाषा जोड़ै लेली उपलब्ध सेवा सिनी मात्र जाँचै सकै छौ। स्पेनिश-कैटलन जोड़ै लेली हैय उदाहरणौ मँ, तोंय लौकै सकै छौ के Apertium दोसरौ उपलब्ध सेवा सिनी केरौ बीच डिफ़ॉल्ट सेवा (सूची मँ पहिल) छेकै।

भाषा सिनी देखलौ गेलौ परिणाम सिनी आरो सामुदायिक प्रतिक्रिया केरौ आधार पँ धीरे-धीरे सक्षम करलौ जाय छै। ई संभव छै के कुछ भाषा सिनी केरौ लेली मशीनी अनुवाद एखनी तक सक्षम नाय करलौ गेलौ छै, भले उ सिनी अंतर्निहित सेवा सिनी द्वारा समर्थित छै।

वर्तमान अनुवाद सेवा सिनी मँ सुधार

When you publish a translation with Content Translation you are helping translation services improve. All the corrections you make to the initial machine translations are exposed through an API and data dumps and can be potentially used to improve existing services. In addition to that, some of the translation services listed above provide specific ways you can contribute to their projects.

MinT

The translations provided by MinT are based on translation models such as NLLB-200 and OpusMT. The training data compiled by the Opus project is resused by many translation models, and you can contribute to it in order to help improve the translation quality for your language.

OpusMT is an open source neural machine translation system that is trained with multilingual documents freely licensed and available online. This open corpus is used to train the translation system, and expanding the corpus will lead to better translations. The contents generated by using Content Translation are integrated automatically in the corpus, but you can contribute to expand the corpus further:

  • Propose new sources to be integrated in the open corpus. You can contact Jörg Tiedemann to propose a new data source to expand the corpus.

You can upload translated documents in various formats including translated webpages to be incorporated to the corpus.

  • Try language models locally with OPUS-CAT (available for Windows)
  • Contribute to other projects that contribute their translations to this open corpus such as Tatoeba, an on-line open community collecting translation for sentences in many languages.

OpusMT is based on MarianNMT which is also an open source project. People with technical knowledge and interested in machine learning can also contribute to improve it.

Apertium

Apertium is an open source rule-based translation system. You can contribute to the project by encoding the language rules of your language. This process requires both linguistic and advanced technical knowledge, but you can get support from the Apertium team to expand the translation support for a new language pair.

Google Translate

Google Translate is not an open source project, but there are still ways for users to contribute back:

Expanding language support with new translation services

Content translation has been designed as an extensible platform. So it is possible to develop new clients to integrate additional translation services. Some considerations about the way translation services are integrated:

  • Machine translations and the user corrections made are published as part of the data on published translations, which can provide a useful resource to create or improve your translation service.
  • External services integrated only receive publicly available wiki content, and return a translated version of such content that is compatible with the licenses used in the wiki.

No personal information is shared with the translation services.

Feedback on the support provided for each language is very useful. Please, let us know if you are missing support for some language, or whether higher quality options are available for it. You can provide such feedback on the project talk page or in this ticket.


Considerations on machine translation

Machine translation is far from perfect when intended as a final outcome. However, many users find it very useful as a starting point. Please make sure to review the content from these different perspectives:

  • Make sure the original meaning is preserved.
  • Check that there is no information missing, especially for elements such as links, references and templates that include information that is not always visible on the surface.
  • Read the translated content to make sure it reads naturally as an independent page.

Limitations with complex elements

In some cases the content may not appear in the translation as expected:

  • Some of the services supported only work with plain text.

This means that formatting and rich content elements such as links and citations from the original article are lost in the translation, and Content translation needs to guess where those belong in the translated text. Re-adding those elements is not always perfect and some elements may be in the wrong position or applied to the wrong part of the text.

  • Complex elements such as references or templates may use a different structure in each language, which makes it hard to transfer the content from one language into the other.

Make sure to review the contents inside those elements to make sure there is no important information missing.

Enforcing the review of machine translation

Several automatic mechanisms exist to enforce the review of the initial contents. In this way, the tool makes sure that the initial automatic translation is reviewed enough before the contents get published.