Content translation/Machine Translation/MinT/uk

MinT (від Machine in Translation, «машина в перекладі») — це служба перекладу, що базується на нейронних моделях машинного перекладу з відкритим кодом. Ця служба хоститься в інфраструктурі Фонду Вікімедіа і буде частиною переліку систем машинного перекладу, доступних для користувачів Перекладу вмісту та інших проєктів Фонду Вікімедіа. Надані переклади базуються на моделях перекладу NLLB-200 та OPUS, які були оптимізовані для продуктивності з використанням бібліотеки OpenNMT Ctranslate2 з метою уникнути потреби в прискоренні графічного процесора. Детальнішу інформацію ви можете знайти, переглянувши вихідний код, специфікацію API та тестову копію.



Ключові функції

 * Жодна непублічна інформація користувачів не надсилається у MinT. Доступ до системи машинного перекладу відбувається через API. Вміст статті (вільноліцензований) надсилається на сервер MinT і між користувачем та зовнішніми службами не відбувається жодної прямої комунікації, і жодна непублічна персональна інформація користувачів (IP, ім'я користувача) не надсилається у службу MinT. Клієнт, що зв'язується з MinT, має відкритий код, ви можете [$1 знайти його тут]. Хоча служба MinT хоститься в інфраструктурі Фонду Вікімедіа, інтеграція відбувається за тими ж схемами, що й для інших зовнішніх служб (див. також діаграму цього технічного компонування укінці розділу). The MT system will be accessed via an API. Article content (freely licensed) is sent to the MinT server and no direct communication is happening between the user and external services and no nonpublic personal information of users (IP, username) is sent to the MinT service. The client contacting MinT is open source and you can check it here. Although the MinT service is hosted in Wikimedia infrastructure, the integration follows the same pattern as other external services (please also see a diagram of this technical setup at the end of the section).
 * Будь-яка інформація, що може бути застережена авторськими правами, надходить з MinT під вільною ліцензією. При використанні MinT отримується перекладена версія контенту Вікімедіа. Застережуваність авторських прав такого машиннозгенерованого контенту є відкритим юридичним питанням. В тому обсязі, який може підлягати застереженню авторськими правами, переклади MinT доступні під тією ж вільною ліцензією, що й контент Вікімедіа, який перекладається. Користувачі можуть змінювати й публікувати його у Вікіпедії без неузгоджень з наявними політиками. Кінцевий вміст, перекладений через MinT і з виправленнями користувачів, буде доступним під тією ж ліцензією, що й решта статей Вікіпедії.
 * Ширша перекладацька спільнота відкритого коду матиме користь. Отримані з MinT переклади та користувацькі виправлення будуть публічно доступними. Поредаговані переклади є особливо цікавими дослідницькій перекладацькій спільноті, яка може скористатися цим ресурсом для створення нових перекладацьких служб на підтримку мов, для яких іще не доступний машинний переклад з відкритим кодом. Це допоможе розробникам створювати й покращувати системи машинного перекладу.
 * Користувачі можуть його вимкнути. Автоматичний переклад є опціональним інструментом в Перекладі вмісту. Користувачі мають змогу вимкнути його, якщо з якоїсь причини він їм не корисний. Хоча багато користувачів Перекладу вмісту робили запит на служби перекладу, кінець кінцем кожен окремий користувач для себе вирішує, користуватися ними чи ні.

center|500x500px



Запитання щодо цієї служби
У цьому розділі ми відповідаємо на деякі негайні запитання щодо MinT. Ця інформація також доступна на сторінці частих запитань Перекладу вмісту.



З якими мовами працює MinT? Чи є плани додати більше?
MinT розроблений для роботи з багатьма відкритими моделями перекладу. Кількість підтримуваних мов залежатиме від них. Доступний перелік систем машинного перекладу, який міститиме найсвіжішу версію списку.



Чим використання MinT відрізняється від Apertium чи інших?
Як користувачі перекладу вмісту ви не помітите жодної різниці в інтерфейсі перекладу, оскільки MinT показуватиме перекладений вміст так само, як це зараз роблять Apertium чи інші служби у підтримуваних мовних парах. Різні служби надають різну якість перекладу залежно від мови і конкретного вмісту. Ви можете пробувати і міняти різні доступні служби у пошуках тої, що дасть найкращий початковий переклад для окремого абзацу.



Як відбувається машинний перекладу, коли я вибираю MinT?
Коли користувач починає перекладати статтю, HTML-вміст кожного розділу вихідної статті надсилається у MinT. Служба MinT обробляє запит і використовує одну з доступних моделей перекладу залежно від підтримуваної мови і конфігурації. Перекладена версія отримується і відображається у відповідній колонці з перекладом у Перекладі вмісту. Посилання та примітки адаптуються, як завжди, і користувач може редагувати вміст за потреби.

Цей процес продовжується для усіх розділів статті, які перекладаються. Для вищої продуктивності переклади послідовних розділів обробляються дещо наперед. Користувач може зберегти неопублікований переклад (щоб повернутися до роботи над ним пізніше), перевірити чи опублікувати статтю, як зазвичай. Стаття публікується у Вікіпедії як будь-яка інша звичайна стаття з відповідною атрибуцією і ліцензіями.

Ось діаграма цього процесу.



Чи базується MinT на програмному забезпеченні з відкритим кодом?
Служба MinT має відкритий код й інтегрує моделі з опублікованим відкритим кодом:


 * Команда дослідження ШІ у Meta опублікувала моделі перекладу, використовувані NLLB-200, під ліцензією відкритого коду і набір даних, що використовувався для тренування, у рамках проєкту No Language Left Behind.
 * Проєкт OPUS надає попередньо треновані нейронні моделі перекладу, треновані на даних OPUS під ліцензією відкритого коду.

Ці моделі було оптимізовано для кращої продуктивності з використанням бібліотеки OpenNMT Ctranslate2, яка також є бібліотекою з відкритим кодом.

Переклад вмісту розвинувся через довгочасну необхідність закрити прогалини в обсягах контенту між Вікіпедіями різними мовами. Як усе інше програмне забезпечення на сайтах Вікімедіа, Переклад вмісту також має відкритий код. У цьому конкретному випадку так само, ми використовуємо клієнт з відкритим кодом для взаємодії із зовнішньою службою й імпорту вільноліцензованого контенту, щоб допомогти користувачам розширювати наші вільні знання. Ми не додаємо жодного пропрієтарного програмного забезпечення, щоб використовувати MinT, ні до коду Перекладу вмісту, ні до вебсайтів чи серверів Вікімедіа.



Чи слід мені перейматися про свою персональну інформацію при використанні MinT?
Незалежно від того, які служби використовуються, ви можете бути впевнені, що надсилається лише вміст Вікіпедії з наявних статей і отримується назад лише вільноліцензований вміст, що буде додано до перекладу. Комунікація з цими службами відбувається на боці сервера, тобто вони ізольовані від пристрою користувача і не мають доступу до непублічних персональних даних користувачів. Більше деталей ви можете знайти на цій діаграмі.



Що якщо MinT є єдиним доступним інструментом машинного перекладу і я не хочу його використовувати?
Машинний переклад є необов'язковою функцією Перекладу вмісту, яку ви, за бажання, можете легко вимкнути. Якщо Для ваших мов буде додано більше систем машинного перекладу, ви можете обрати увімкнути машинний переклад знову і вибрати службу машинного перекладу на свій смак.



Чи буде вміст, перекладений у MinT, вільним для використання у Вікіпедії?
Так. Контент, отриманий з MinT, вільно доступний на вебплатформі перекладу. Для простоти використання Переклад вмісту отримує його через API, щоб він був безпроблемно доступним у перекладацькому інтерфейсі. Цей вміст користувачі можуть змінювати (за потреби) і використовувати у статтях Вікіпедії під вільними ліцензіями.



Чи може цей контент бути використаний для покращення систем машинного перекладу загалом?
Так. Переклади, які робляться у Перекладі вмісту, зберігаються у нашій базі даних. Ця інформація буде публічно доступною для будь-кого (від університетських дослідних груп, проєктів відкритого коду до комерційних компаній — справді будь-кого), щоб ці приклади перекладу можна було використати для покращення служб перекладу. Доступ до цього контенту здійснюється через API Перекладу вмісту. Зверніть, будь ласка, увагу, що публічно доступною є лише інформація, пов'язана з перекладеним текстом, тобто вихідний і перекладений текст, інформація про вихідну і цільову мову та ідентифікатор сегменту тексту.