Content translation/Machine Translation/MinT/uk

MinT (від Machine in Translation, «машина в перекладі») — це служба перекладу, що базується на нейронних моделях машинного перекладу з відкритим кодом. Ця служба хоститься в інфраструктурі Фонду Вікімедіа і буде частиною переліку систем машинного перекладу, доступних для користувачів Перекладу вмісту та інших проєктів Фонду Вікімедіа. Надані переклади базуються на моделях перекладу NLLB-200 та OPUS, які були оптимізовані для продуктивності з використанням бібліотеки OpenNMT Ctranslate2 з метою уникнути потреби в прискоренні графічного процесора. Детальнішу інформацію ви можете знайти, переглянувши вихідний код, специфікацію API та тестову копію.



Ключові функції

 * Жодна непублічна інформація користувачів не надсилається у MinT. Доступ до системи машинного перекладу відбувається через API. Вміст статті (вільноліцензований) надсилається на сервер MinT і між користувачем та зовнішніми службами не відбувається жодної прямої комунікації, і жодна непублічна персональна інформація користувачів (IP, ім'я користувача) не надсилається у службу MinT. Клієнт, що зв'язується з MinT, має відкритий код, ви можете знайти його тут. Хоча служба MinT хоститься в інфраструктурі Фонду Вікімедіа, інтеграція відбувається за тими ж схемами, що й для інших зовнішніх служб (див. також діаграму цього технічного компонування укінці розділу).
 * Будь-яка інформація, що може бути застережена авторськими правами, надходить з MinT під вільною ліцензією. При використанні MinT отримується перекладена версія контенту Вікімедіа. Застережуваність авторських прав такого машиннозгенерованого контенту є відкритим юридичним питанням. В тому обсязі, який може підлягати застереженню авторськими правами, переклади MinT доступні під тією ж вільною ліцензією, що й контент Вікімедіа, який перекладається. Користувачі можуть змінювати й публікувати його у Вікіпедії без неузгоджень з наявними політиками. Кінцевий вміст, перекладений через MinT і з виправленнями користувачів, буде доступним під тією ж ліцензією, що й решта статей Вікіпедії.
 * Ширша перекладацька спільнота відкритого коду матиме користь. Отримані з MinT переклади та користувацькі виправлення будуть публічно доступними. Поредаговані переклади є особливо цікавими дослідницькій перекладацькій спільноті, яка може скористатися цим ресурсом для створення нових перекладацьких служб на підтримку мов, для яких іще не доступний машинний переклад з відкритим кодом. Це допоможе розробникам створювати й покращувати системи машинного перекладу.
 * Користувачі можуть його вимкнути. Автоматичний переклад є опціональним інструментом в Перекладі вмісту. Користувачі мають змогу вимкнути його, якщо з якоїсь причини він їм не корисний. Хоча багато користувачів Перекладу вмісту робили запит на служби перекладу, кінець кінцем кожен окремий користувач для себе вирішує, користуватися ними чи ні.

center|500x500px

Questions about this service
We have addressed some immediate questions about MinT in this section. This is also available in the Content Translation FAQ page.

What languages are being handled by MinT? Are there plans to add more?
MinT is designed to host multiple open translation models. The number of languages supported will depend on them. The list of machine translation (MT) systems available will include the most up-to-date list.

How is using MinT different than using Apertium or others?
As a user of Content Translation you will not feel any difference on the translation interface as MinT will display the translated content in the same way Apertium or other services currently do for the supported language pairs. Different services provide a different translation quality level depending on the language and the specific contents. You can try and change among the available services the one providing the best initial translation for a given paragraph.

How is the machine translation being done if I choose MinT?
When a user starts translating an article, the HTML content of each section of the source article is sent to MinT. The MinT service processes the request and uses one of the translation models available based on the supported language and configuration. A translated version is obtained and displayed on the respective translation column of Content Translation. Links and references are adapted as usual and users can modify the content as required.

This process continues for all the sections of the article being translated. For better performance, the translations for consecutive sections are pre-fetched. The user can save the unpublished translation (to work on it again at a later time), revise, or publish the article in the usual manner. The article is published on Wikipedia like any other normal article with appropriate attribution and licenses.

Here’s a diagram of the process.

Is MinT based on open source software?
The MinT service is open source and it integrates models that are released as open source:


 * The AI research team at Meta released the translation models used by NLLB-200 with an open source license and the dataset used for training as part of the No Language Left Behind project.
 * The OPUS project provides pre-trained neural translation models trained on OPUS data with an open source license.

These models have been optimized for performance using OpenNMT Ctranslate2 library which is also an open source library.

Content Translation evolved from a long-standing need to bridge the gap in the amount of content between Wikipedias in different languages. Like all other software used on Wikimedia sites, Content Translation is also open source. In this particular case as well, we are using an open source client to interact with the external service and import freely licensed content in order to help users expand our free knowledge. To use MinT we are not adding any proprietary software in the Content Translation code, or on the Wikimedia websites and servers.

Should I be worried about my personal information when using MinT?
Irrespective of the service being used, you can be sure that only Wikipedia content from existing articles is sent and only freely licensed content will be added back to the translation. Communication with those services happens at the server side, so they are isolated from the user device and they have no access to nonpublic personal information of users. Please refer to this diagram for more details.

What if MinT is the only machine translation tool available and I don't want to use it?
Machine Translation is an optional feature in Content Translation that you can easily disable at will. If more machine translation systems are added for your languages, you can choose to enable MT again and select the MT service of your choice.

Will the content translated by MinT be free for use in Wikipedia?
Yes. The content received from MinT is otherwise freely available on the web translation platform. For ease of use Content Translation receives it via an API to make it seamlessly available on the translation interface. This content can be modified by the users (if necessary) and used in Wikipedia articles under free licenses.

Can this content be used for improving machine translation systems in general?
Yes. Translations made in Content Translation are saved in our database. This information will be made publicly available for anyone to use as translation examples to improve their translation services (from University research groups, open source projects to commercial companies, anyone!). The content can be accessed via the Content Translation API. Please note, only information related to translated text is publicly available. This includes – source and translated text, source and target language information and an identifier for the segment of text.