Content translation/Machine Translation/Yandex/ru

Начиная с 4-ого ноября 2015 года, система мишинного перевода разработанная Yandex стала доступной для пользователей Перевода содержания. Вследствии популярности среди русскоязычных пользователей Википедии, включение Яндекс переводчика в список сервисов машинного перевода было сделано на основе запросов пользователей. Изначально этот сервис был представлен, как инструмент для перевода статей Википедии с английского языка на русский. На данный момент сервис включает в себя поддержку всех доступных языков, предусмотренных Яндекс.

Яндекс переводчик разработан Яндекс - российской компанией в отрасли информационных технологий. Начиная с конца 2014 года, команда Фонда Викимедии и команда Яндекс объединились, чтобы разработать соглашение, которое позволит использовать Яндекс переводчик, не нарушая при этом политику Викимедии на присвоение прав, конфиденциальность данных пользователей, а также на реперезентацию бренда. Вы можете ознакомиться с деталями соглашения ниже. Мы будем рады услышать ваши вопросы, которые могут возникнуть при использовании данного сервиса.

Ключевые особенности

 * Никакая информация о пользователе не передается Яндекс. Доступ к системе машинного перевода осуществляется через общедоступный ключ API. Информация статьи, защищенная свободной лицензией, отправляется с серверов Фонда Викимедии на серевера Яндекс. При этом не возникает никакого внешнего взаимодействия между пользователем и сторонними сервисами. Также информация пользователя, а именно IP-адрес и имя пользователя, не передается серверам Яндекс. Контакт с Яндексом происходит на уровне открытого исходного кода, который вы можете просмотреть по этой ссылке. Никакая часть сервиса или кода Яндекс не будет частью архитектуры Викимедии или кодовой базы Перевода содержания.


 * Информация поступающая от Яндекс будет находиться под действием свободной лицензии. При использовании сервисов Яндекс, весь переведенный текст статей Википедии, охватывается свободной лицензией. Пользователи могут отредактировать перевод и опубликовать его как часть Википедии, не нарушая при этом политику пользования. Полученный перевод при помощи сервисов Яндекс, а также пользовательские версии перевода доступны под действием свободной лицензии, также как и обычные статьи Википедии.


 * Приносит пользу большому сообществу переводчиков. Переводы полчуенные при помощи Яндекс, а также пользовательские версии переводов будут находиться в открытом доступе. Впоследствии отредактированные пользователями машинные переводы имеют большой интерес со стороны сообщества, занимающимся исследованиями переводов. Эти сообщества могут опираться на эти переводы для создания новых систем перевода для поддержки языков, не имеющих машинного перевода. Это поможет разработчикам создавать и улучшать системы машинного перевода.


 * Пользователи могут отключить данную функцию. Автоматический перевод это дополнительная функция в инструментах Перевода содержания. Пользователи могут отключить функцию автоматического машинного перевода, если она им не нужна. Не смотря на это, многие русскоязычные пользователи используют эту функцию. Каждый пользователь сам для себя решает, будет он использовать данный сервис или нет.

Обязательства со стороны Яндекс

 * Предоставить ключ API Яндекс переводчика Фонду Викимадии на бесплатной основе, что позволить добровольцам переводить статьи Викимедии
 * Позволить переводить волонтерам до 10 миллионов знаков в день
 * Предоставить Викимедии статистику по количеству знаков в отправленных запросах

Обязательства со стороны Фонда Викимедии

 * Предоставлять версии перевода, созданные пользователями с помощью инструментов перевода, для того чтобы Яндекс мог улучшать сервис
 * Персональная информация пользователей не будет раскрыта.
 * На сервера Яндекса будет отправляться только информация связанная с текстом, а именно его оригинальное содержание, исходный язык, а также язык на который совершается перевод.
 * Переводы, опубликованные пользователями при помощи сервисов машинного перевода, а также без них, будут предоставляться в форме параллельного текста с помощью API Перевода содержания. Это API будет постепенно улучшаться и результаты будут доступны всем.

Важные замечания

 * Весь контент будет находиться под защитой свободной лицензии CC BY-SA 3.0
 * Яндекс не претендует на расположение лэйбла бренда на сайтах Викимедии, помимо указания Яндекс переводчика в списке средств машинного перевода, расположенного в раскрывающемся меню
 * Обмен личной информации пользователей происходить не будет
 * Срок соглашения составляет 1 год. В этот переиод мы можем поменять свои потребности.
 * Мы в праве расторгнуть соглашение по любому поводу, в любое время (за 30 дней от этом прийдет уведомление)
 * Данное соглашение регулируется в соответствии с законодательством США

Часто задаваемые вопросы об этой услуге
В этом разделе расположены часто задаваемые вопросы о Яндекс. Ответы на них также доступны на странице часто задаваемых вопросах о Переводе содержания.

Какие языки доступны при использовании Яндекс? Есть ли у вас в планах увеличить их число?
В настоящее время Яндекс имеет поддержку более чем 70 языков. Если Яндекс добавит поддержку других языков мы также будем иметь к ним доступ. Замечание: Машинный перевод Яндекса не доступен при создании страницы на английском языке.

В чем отличие использования Яндекса от других сервисов машинного перевода?
Как пользователь Перевода содержания, вы не почуствуете никаких координальных различий в интерфейсе, так как Яндекс переводчик отображает переведенный текст в таком же виде как и Apertium отображает результат для поддерживаемых 45 языковых пар.

Как будет происходить машинный перевод если я выберу Яндекс переводчик?
Яндекс предоставляет ключ API, который позволяет сайтам и другим сервисам использовать систему перевода Яндекс. Инструменты Перевода содержания также имеют собственный ключ API для доступа к данному сервису. В то время когда пользователь начинает переводить статью, HTML содержание каждого раздела исходной статьи отправляется на сервера Яндекс. Полученная переведенная версия выводится в соответствующий столбец в инструменте Перевода содержания. Ссылки, а также источники перестают быть активными и их можно редактировать как обычный текст.

This process continues for all the sections of the article being translated. For better performance, the translations for consecutive sections are pre-fetched. The user can save the unpublished translation (to work on it again at a later time) or publish the article in the usual manner. The article is published on Wikipedia like any other normal article with appropriate attribution and licenses.

You can view a diagram of the process.

Yandex is not based on open source software. Why are we using it?
Content Translation evolved from a long-standing need to bridge the gap in the amount of content between Wikipedias in different languages. Like all other software used on Wikimedia sites, Content Translation is also open source. In this particular case as well, we are using an open source client to interact with the external service and import freely licensed content in order to help users expand our free knowledge.

To use Yandex's machine translation system we are not adding any proprietary software in the Content Translation code, or on the Wikimedia websites and servers. The service is free of charge and available for everyone.

Only the freely available Wikipedia article content (in segments) is sent to the Yandex service and the obtained translated content is freely usable on Wikipedia pages. The translated content can be modified by users and this data is also available publicly under a free license through the Content Translation API. This is a valuable resource made available for the community to develop open source translation services for those languages where they don't exist yet.

After studying the implications carefully, we found the fact that the content was stored previously in a closed source service does not limit the freedom of our knowledge or our software in the present or the future. We have taken special care to make sure that the content provided is freely licensed to make sure it complies with Wikipedia policies. This includes a long process for legal and technical evaluation and compliance. The summary of the terms of use is also available.

From user feedback we have seen that machine translation support is really helpful for users and we want to support all languages in the best way. Guided by the principles of Wikimedia Foundation's resolution to support free and open source software, we will prioritise the integration of open source services whenever they are available for a language. Apertium has been a critical part of Content Translation since its inception, but currently it only provides machine translations for 45 of the numerous possible language combination that Wikipedia can support.

Should I be worried about my personal information when using Yandex?
Irrespective of the service being used, you can be sure that only Wikipedia content from existing articles is sent and only freely licensed content will be added back to the translation. No personal information is sent and communication with those services happen at the server side, so they are isolated from the user device. Please refer to this diagram for more details.

What if Yandex is the only machine translation tool available and I don't want to use it?
Machine Translation is an optional feature in Content Translation that you can easily disable at will. If more machine translation systems are added for your languages, you can choose to enable MT again and select the MT service of your choice.

Will the content translated by Yandex be free for use in Wikipedia?
Yes. The content received from Yandex is otherwise freely available on the Yandex web translation platform. Content Translation receives it via an API key to make it seamlessly available on the translation interface. This content can be modified by the users (if necessary) and used in Wikipedia articles under free licenses.

Can this content be used for improving machine translation systems in general?
Yes. Translations made in Content Translation are saved in our database. This information will be made publicly available for anyone to use as translation examples to improve their translation services (from University research groups, open source projects to commercial companies, anyone!). The content can be accessed via the Content Translation API. Please note, only information related to translated text is publicly available. This includes – source and translated text, source and target language information and an identifier for the segment of text.