Перевод содержимого/Машинный перевод/Matxin

From mediawiki.org
This page is a translated version of the page Content translation/Machine Translation/Matxin and the translation is 99% complete.

Поддержка машинного перевода для инструментов Перевода текста была расширена. Помимо Apertium, Yandex и Youdao, мы добавили Matxin в список систем машинного перевода, доступных для пользователей. Это позволило дополнительным нескольким языкам обрести поддержку машинного перевода.

Matxin был создан исследовательской группой из University of Basque Country в сотрудничестве с Elhuyar Foundation. Эта система машинного перевода первоначально была разработана для исследовательской группы университета, чтобы писать статьи Википедии на баскском и испанском языке. Различные команды Фонда Викимедиа и Matxin объединились, чтобы разработать соглашение, которое позволит использовать Matxin не нарушая при этом принципы Викимедиа на присвоение прав, конфиденциальность данных наших пользователей, а также использование бренда. Matxin это программное обеспечение с открытым исходным кодом. Для лучшей работы с Matxin, мы используем наиболее подходящий API машинного перевода для удаленного доступа к сервису. Вы можете ознакомиться с деталями соглашения ниже. Мы будем рады услышать любые вопросы, которые у вас могут быть относительно данного сервиса.

Ключевые особенности

  • Персональные данные пользователей не будут переданы Matxin Доступ к системе машинного перевода осуществляется при помощи ключа API. Тескт статьи, защищенной свободной лицензией, отправляется на сервер Matxin напрямую с серверов Фонда Викимедии. Между пользователем и сторонними сервисами не возникает прямого контакта. Персональная информация, такая как IP-адрес, имя пользователя, не передается Matxin. Клиентское соглашение с Matxin находится в открытом доступе. Вы можете посмотреть его перейдя по ссылке. Никакая часть сервиса Matxin или его кода не будет частью инфраструктуры Викимедиа или кодовой базы перевода контента. Для лучшего ознакомления, посмотрите диаграмму технической структуры в конце раздела.
  • Информация полученная от Matxin находится под действием свободной лицензии. При использовании Matxin, переведенная версия содержимого статей Викимедиа охватывается свободной лицензией. Пользователи могут изменить и опубликовать полученную информацию как часть Википедии. При этом не будет противоречий с правилами пользования ресурсом. Полученный контент, переведенный при помощи Matxin, а также правки пользователя будут доступны под такой же лицензией, которая используется для остальных статей в Википедии.
  • Приносит пользу широкому сообществу переводчиков. Переводы полученные при помощи Matxin, а также пользовательские модификации будут публично доступны. Отредактированные человеком машинные переводы имеют особый интерес со стороны сообщества изучения переводов (включая команду Matxin). Сообщество может использовать этот ресурс для создания новых сервисов для поддержки языков у которых машинный перевод с открытым кодом еще не доступен. Это поможет разработчикам создавать и улучшать системы машинного перевода.
  • Пользователи могут отключить это. Автоматический перевод это вспомогательное средство в дополнении Перевод содержимого. У пользователей есть возможность отключить автоматический перевод, если он кажется им неподходящим по каким-либо причинам. Не смотря на это, многие пользователи запрашивали данный сервис по переводу. Каждый в отдельности пользователь может решить, будет ли он пользоваться данным сервисом или нет.

Краткое содержание нашего соглашения с Matxin

Обязательства со стороны Matxin

  • Предоставить бесплатный доступ к ключу API машинного перевода Matxin для Фонда Викимедии. А также позволить волонтерам сайтов Викимедии переводить статьи и поддерживать как минимум 10 миллионов знаков переведенного текста в день.

Обязательства со стороны Фонда Викимедии

  • Предоставлять отредактированные добровольцами версии перевода, чтобы команда Matxin могла улучшать собственные средства перевода.
  • Никакие персональные данные переводчиков не будут раскрыты или переданы.
  • Только исходный контент для перевода, его язык и язык на который делается перевод могут быть переданы по запросу Matxin.
  • Переводы, опубликованные переводчиками, с помощью средств машинного перевода или без них, могут быть предоставленны в форме Битекст API перевода содержимого. Эти API будут постепенно развиваться и результаты будут находится в свободном доступе.

Важные замечания

  • Весь контент будет предоставляться по свободной лицензии CC BY-SA 3.0
  • Matxin не требует никакого обозначения продукта на сайтах Викимедии, помимо внесения Google Translate, как средства для перевода в список, находящийся в всплывающем меню.
  • Личная информация добровольцев не может быть передана или обменена.
  • Срок действия соглашения ограничен 1 годом, после чего мы можем пересмотреть наши потребности.
  • Мы в праве расторгнуть соглашение по любым причинам и в любое время, преждевременно за 30 дней уведомив об этом.
  • Данное соглашение регулируется в соответствии с законодательством Соединенных Штатов Америки.

Часто задаваемые вопросы об этой услуге

В этом разделе рассмотрены некоторые актуальные вопросы о Matxin. Ответы на них, также можно найти на странице часто задаваемых вопросов в разделе Перевода содержимого.

Какие языки доступны при использовании Matxin? Есть ли у вас в планах увеличить их число?

Matxin может быть использован для перевода текста с испанского языка на баскский. Как только разработчики Matxin добавят в приложение поддержку каких-либо других языков, мы тоже сможем их использовать.

В чем отличие использования Matxin от других сервисов машинного перевода?

Как пользователь инструментов Перевода содержимого, вы не почувствуете никаких координальных различий в интерфейсе, так как Matxin отображает переведенный текст в таком же виде как и другие средства машинного перевода отображают результат для поддерживаемых языковых пар.

Как будет происходить машинный перевод если я выберу Matxin?

Matxin имеет собственный ключ API, который позволяет веб-сайтам и другим сервисам использовать эту систему перевода. Инструменты Перевода содержимого также используют персональный ключ API для доступа к серверам Matxin. В то время, когда пользователь начинает переводить статью, HTML содержимое каждого раздела исходной статьи отправляется на сервера Matxin, после этого получается переведенная версия текста, которая отображается в соответствующем столбце перевода содеражания. При переводе ссылки и источники перестают быть активными и пользователи могут редактировать текст так, как нужно.

Этот процесс продолжается для всех разделов статьи, пока она не будет переведена полностью. Для лучшей производительности, переводы для последовательно идущих разделов проходят предварительную выборку. Пользователь может сохранить не опубликованный перевод, чтобы в последствиий вернуться к нему, или опубликовать статью как обычно. Статья публикуется на Википедии, точно также как и любая другая статья с сответсвующими атрибуциями и лицензиями.

Диаграмма процесса машинного перевода.

Matxin был разработан на программном обеспечении с открытым исходным кодом?

Да. Также как и Apertium, Matxin имеет открытый исходный код, доступный любым пользователям. It has been developed by a small team from the University of Basque country who developed this tool for their own need to translate Wikipedia articles. Команда является значимой частью сообщества Викимедии и мы счастливы сотрудничать с ними.

Стоит ли опасаться за конфиденциальность моих персональных данных при использовании Matxin?

Независимо от того какой сервис вы используете, только тект статей Википедии будет отправлен на серевра Matxin. С серверов возвращется только перевод, защищенный свободной лицензией. Коммуникация с сервисами происходит на серверах, которые работают удаленно от устроства пользователя. Вы можете увидеть дополнительную информацию на этой диаграмме.

Что делать если Matxin это единственный доступный сервис машинного перевода? Можно ли выбрать другой сервис машинного перевода?

Машинный перевод это дополнительная функция в инструментах Перевода содержимого, которую вы можете выключить в настройках. Если для вашего языка добавлена поддержка машинного перевода, вы можете заного включить его и выбрать подходящий вам сервис.

Будет ли контент, переведенный при помощи Matxin, свободным для использования в Википедии?

Да. Контент полученный от Matxin находится в свободном доступе на веб-платформе для перевода. Веб-платформа имеет открытый исходный код. Для простого использования инструменты Перевода содержимого получают перевод с помощью ключа API, чтобы сделать бесприпятственный доступ к интерфейсу перевода. Полученный перевод может быть отредактирован пользователями и использован в статьях Википедии. Отредактированная версия перевода будет находится под защитой свободной лицензии.

Можно ли использовать этот контент для улучшения систем машинного перевода в общем случае?

Да. Переводы сделанные при помощи инструментов Перевода содержимого сохраняются в базе данных. Эта информация является общедоступной и ее можно использовать в качестве примеров перевода для улучшения сервисов перевода, независимо кем он был разработан. Контент доступен при помощи API Перевода содержимого. Но нужно помнить, что только информация связанная с переведенным текстом находится в открытом доступе. Эта информация включает в себя исходный и переведенный текст, информацию о языках использованных при переводе, а ткаже идентификатор сегмента текста.