Content translation/Machine Translation/Matxin/ru

Поддержка машинного перевода для инструментов Перевода текста была расширена. Помимо Apertium, Yandex и Youdao, мы добавили Matxin в список систем машинного перевода, доступных для пользователей. Это позволило нескольким языкам обрести средство машинного перевода.

Matxin был создан исследовательской группой из Университета Страны Басков при сотрудничестве с Elhuyar Foundation. Эта система машинного перевода первоначально была разработана для исследовательской группы университета, чтобы писать статьи Википедии на баскском и испанском языке. Различные команды Фонда Викимедиа и Matxin объединились, чтобы разработать соглашение, которое позволит использовать Matxin не нарушая при этом принципы Викимедиа на присвоение прав, конфиденциальность данных пользователей, а также образ бренда. Matxin это публичное программное обеспечение с открытым исходным кодом. Для лучшей работы с Matxin, мы используем наиболее подходящий API машинного перевода для удаленного доступа к сервису. "Вы можете ознакомиться с деталями соглашения ниже. Мы будем рады услышать выши вопросы, возникшие при использовании данного сервиса."

Ключевые особенности

 * Персональные данные пользователей не будут переданы Matxin Доступ к системе машинного перевода осуществляется при помощи ключа API. Тескт статьи, защищенной свободной лицензией, отправляется на сервер Matxin напрямую с серверов Фонда Викимедии. Между пользователем и сторонними сервисами не возникает прямого контакта. Персональная информация, такая как IP-адрес, имя пользователя, не передается Matxin. Код контакта пользователя с Matxin находится в открытом доступе. Вы можете посмотреть его перейдя по ссылке. Никакая часть сервиса Matxin или его кода не будет частью инфраструктуры Викимедиа или кодовой базы перевода контента. Для лучшего ознакомления, посмотрите диаграмму технической структуры в конце раздела.


 * Информация полученная от Matxin находится под действием свободной лицензии. При использовании Matxin, переведенная версия содержимого статей Викимедиа охватывается свободной лицензией. Пользователи могут изменить и опубликовать полученную информацию как часть Википедии. При этом не будет противоречий с правилами пользования ресурсом. Полученный контент, переведенный при помощи Matxin, а также правки пользователя будут доступны под такой же лицензией, которая используется для остальных статей в Википедии.


 * Приносит пользу широкому сообществу переводчиков. Переводы полученные при помощи Matxin, а также пользовательские версии будут находиться в открытом доступе. Отредактированные человеком машинные переводы имеют особый интерес со стороны сообщества изучения переводов(включая команду Matxin). Сообщество может использовать этот ресурс для создания новых сервисов по переводу поддерживающих языки, для которых машинный перевод с открытым кодом еще не доступен. Это поможет разработчикам создавать и улучшать системы машинного перевода.


 * Пользователи в праве отключить функцию автоматического перевода. Автоматический перевод это вспомогательное средство для перевода содержимого. Пользователи в праве отключить автоматический перевод, если он кажется им неподходящим по киким-либо причинам. Не смотря на это, многие пользователи обращаются к данной услуге по переводу. Каждый в отдельности пользователь может решить, будет ли он пользоваться данным сервисом или нет.



Обязательства со стороны Matxin

 * Предоставить бесплатный доступ к ключу API машинного перевода Matxin для Фонда Викимедии. А также позволить волонтерам сайтов Викимедии переводить статьи и набирать как минимум 10 миллионов знаков переведенного текста в день.

Обязательства со стороны Фонда Викимедии

 * Предоставлять отредактированные добровольцами версии перевода, чтобы команда Matxin могла улучшать собственные средства перевода.
 * Никакие персональные данные переводчиков не будут раскрыты или переданы.
 * Только исходный контент для перевода, его язык и язык на который делается перевод могут быть переданы по запросу Matxin.
 * Переводы, опубликованные переводчиками, с помощью средств машинного перевода или без них, могут быть предоставленны в форме Битекст API перевода содержания. Эти API будут постепенно развиваться и результаты будут находится в свободном доступе.

Важные замечания

 * Весь контент будет предоставляться по свободной лицензии CC BY-SA 3.0


 * Matxin не требует никакого обозначения продукта на сайтах Викимедии, помимо внесения Google Translate, как средства для перевода в список, находящийся в всплывающем меню.


 * Личная информация добровольцев не может быть передана или обменена.


 * Срок действия соглашения ограничен 1 годом, после чего мы можем пересмотреть наши потребности.


 * We are free to terminate the agreement for any reason, at any time (with 30 days notice)


 * Agreement is governed by US law

Questions about this service
We have addressed some immediate questions about Matxin in this section. This is also available in the Content Translation FAQ page.

What languages are being handled by Matxin? Are there plans to add more?
Matxin can be used to translate from Spanish to Basque. As more languages are added to the service by the developers of the Matxin team, we will include them.

How is using Matxin different than using other machine translation services?
As a user of Content Translation you will not feel any difference on the translation interface as Matxin will display the translated content in the same way other services currently do for the supported language pairs.

How is the machine translation being done if I choose Matxin?
Matxin provides an API key that allows websites and other services to use their translation system. Content Translation also uses that unique API key to access Matxin. When a user starts translating an article, the HTML content of each section of the source article is sent to Matxin and a translated version is obtained and displayed on the respective translation column of Content Translation. Links and references are adapted as usual and users can modify the content as required.

This process continues for all the sections of the article being translated. For better performance, the translations for consecutive sections are pre-fetched. The user can save the unpublished translation (to work on it again at a later time) or publish the article in the usual manner. The article is published on Wikipedia like any other normal article with appropriate attribution and licenses.

Here’s a diagram of the process.

Is Matxin based on open source software?
Yes! It is an open source software, similar to Apertium. It has been developed by a small team from the University of Basque country who developed this tool for their own need to translate Wikipedia articles. They are very much part of the Wikimedia community and we are happy to partner with them.

Should I be worried about my personal information when using Matxin?
Irrespective of the service being used, you can be assured that only Wikipedia content from existing articles is sent and only freely licensed content will be added back to the translation. No personal information is sent and communication with those services happen at the server side, so they are isolated from the user device. Please refer to this diagram for more details.

What if Matxin is the only machine translation tool available and I don't want to use it?
Machine Translation is an optional feature in Content Translation that you can easily disable at will. If more machine translation systems are added for your languages, you can choose to enable MT again and select the MT service of your choice.

Will the content translated by Matxin be free for use in Wikipedia?
Yes. The content received from Matxin is otherwise freely available on the web translation platform. It is an open source software. For ease of use Content Translation receives it via an API key to make it seamlessly available on the translation interface. This content can be modified by the users (if necessary) and used in Wikipedia articles under free licenses.

Can this content be used for improving machine translation systems in general?
Yes. Translations made in Content Translation are saved in our database. This information will be made publicly available for anyone to use as translation examples to improve their translation services (from University research groups, open source projects to commercial companies, anyone!). The content can be accessed via the Content Translation API. Please note, only information related to translated text is publicly available. This includes – source and translated text, source and target language information and an identifier for the segment of text.