Help:Content translation/Translating/Translation quality/ru

Когда создавая перевод, важно просмотреть его содержание перед его публикацией. Необходимо быть уверенным, что переведенный текст не искажает содержание оригинала, а также написан доступно и понятно на Вашем языке. Предоставленный первоначальный машинный перевод помогает ускорить процесс перевода с помощью полезной отправной точки, но инструмент поощряет пользователей просматривать и значительно редактировать исходное содержимое.

Различные механизмы гарантируют, что переводчики редактируют исходные переводы соответствующим образом. Редактор перевода отслеживает, насколько первоначальный перевод был изменен пользователем, и определяет различные ограничения, чтобы либо предотвратить публикацию, либо предупредить пользователей, чтобы поощрить их к дальнейшему просмотру содержимого.

Таким образом, этот инструмент позволяет пользователям использовать машинный перевод если они используют его хорошо, и в то же время предотвращает создание плохопроверенных переводов низкого качества. Более подробно о том, как работают эти ограничения, как они могут быть изменены в соответствии с потребностями каждого языка и как измерить качество контента, создаваемого с помощью этого инструмента, рассказывается ниже.



Ограничения для поощрения просмотра перевода
Перевод содержания инструмент измеряет процент модификаций, которые пользователи вносят в первоначальный предоставленный автоматический перевод. Таким образом, система знает, сколько слов было добавлено, удалено или изменено по сравнению с первоначальным переводом. Измерения проводятся на двух разных уровнях: для каждого абзаца и для всего перевода. На каждом уровне применяются свои ограничения, о чем подробнее говорится ниже.



Ограничения для всего перевода
Публикация блокируется, если 95% или более от всего документа состоит из не модифицированного, переведенного машиной содержимого. Это ограничение позволяет предотвратить практически "сырой" машинный перевод и обойти явный вандализм. Это также не позволяет пользователям просто добавлять контент, не редактируя часть машинного перевода. Как показано ниже, этот лимит может быть скорректирован для каждого языка.



Ограничения для каждого параграфа
Для каждого параграфа также измеряется процент пользовательских модификаций. Абзац считается проблемным, если он содержит более 85% исходного машинного перевода (или, при копировании содержимого из исходного документа, более 60% не модифицированного содержимого).

Редактор перевода покажет предупреждение для каждого абзаца, который считается проблемным, поощряя дальнейшее редактирование пользователем. В некоторых случаях пользователи по-прежнему могут публиковать переводы, но полученная страница может быть добавлена в категорию отслеживания потенциально не рецензируемых переводов для ознакомления с ними сообщества. В других случаях пользователям может быть вообще запрещено публиковать информацию.

Ниже перечислены некоторые факторы, учитываемые при определении того, разрешать или нет пользователям публикацию (некоторые из них еще находятся в стадии разработки):


 * Количество проблемных абзацев. Пользователям запрещено публиковать переводы, содержащие 50 и более проблемных абзацев. Публикация переводов, содержащих менее 50 проблемных абзацев, разрешается, однако переводы, содержащие от 10 до 49 проблемных абзацев, будут добавляться в категорию отслеживания потенциально не прошедших рецензирование переводов для рассмотрения сообществом.
 * Предыдущие удаленные переводы. Для предотвращения повторных проблем инструмент выявляет пользователей, чьи опубликованные переводы были удалены за последние 30 дней, и устанавливает гораздо более жесткие ограничения на их последующие переводы. Для пользователей этого класса переводы, содержащие 10 и более проблемных абзацев, не допускаются к публикации, а переводы с 9 и менее проблемными абзацами добавляются в категорию отслеживания потенциально не рецензируемых переводов, которые могут быть рассмотрены сообществом.
 * Подтверждение пользователя. Менее строгий порог рассматривается для абзацев, которые пользователь отмечает как решенные - это сигнал о том, что пользователь просмотрел и подтвердил статус перевода. Для абзацев, в которых отображается предупреждение о не модифицированном содержимом, но пользователь отмечает его как решенное, применяется менее строгий порог (принимается 95% машинного перевода или 75% исходного содержимого). Это позволит учесть случаи, когда автоматический перевод был исключительно качественным, но при этом избежать потенциального злоупотребления функцией (т.е. не следовать слепо за подтверждением пользователя).



Содержание, на которое не распространяются ограничения
Предполагается, что некоторые материалы не будут подвергаться существенному редактированию и поэтому не учитываются при применении описанных выше ограничений. Очень короткие названия разделов, цитаты или список литературы исключаются из рассмотрения. В противном случае пользователи могут получать вводящие в заблуждение предупреждения о переводе контента, которого не должно быть, например, названий книг, встречающихся в ссылках, или других собственных существительных.

Limits on the mobile experience
For the mobile experience the initial set of limits follow a simpler approach. At the moment, only the overall percentage of unmodified machine translation for the whole translation is considered. On mobile, the whole translation consist of just one section of the article.

In particular, a warning is shown when the percentage of unmodified machine translation is over 85% for the whole section, and publishing is prevented when the percentage of unmodified machine translation is over 95%.

Feedback on how the limits system work on the mobile context would be very useful to determine how to evolve this initial approach.



Настройка ограничений
Описанные выше ограничения представляют собой набор общих механизмов, однако они могут нуждаться в корректировке в зависимости от конкретных потребностей каждой вики. По результатам первоначальной оценки, объем модификаций, необходимых для первоначального машинного перевода, может составлять от 10% до 70% в зависимости от языковой пары. В некоторых вики-проектах установленные по умолчанию ограничения могут быть слишком строгими, создавая ненужный шум или не позволяя публиковать вполне корректные переводы. В других вики-проектах ограничения могут быть недостаточно строгими, что позволяет публиковать переводы, которые не были достаточно отредактированы.

Настройка различных пороговых значений позволяет каждой вики настроить ограничения инструмента в соответствии со своими конкретными потребностями. Обратная связь с носителями языка очень важна для правильной корректировки установленных ограничений. Если текущие ограничения кажутся вам не совсем подходящими, исходя из вашего опыта создания или проверки переводов, пожалуйста, поделитесь своим мнением, и мы сможем изучить, как лучше их скорректировать.

При предоставлении отзывов о настройке пороговых значений мы рекомендуем сначала создать несколько примеров переводов (обязательно отметьте опции публикации, если ваш тест не предназначен для публикации в качестве обычного контента). При проверке того, как работают ограничения для вашего языка, полезно иметь в виду следующее:


 * Проверьте оба варианта. Обязательно проверьте, как работают ограничения для обоих вариантов: для переводов, в которых контент недостаточно отредактирован, и для переводов, в которых он достаточно отредактирован. Таким образом, можно легче найти оптимальный баланс предельных возможностей инструмента. Проверка только одного типа проблем может привести к слишком большому смещению пороговых значений в противоположную сторону.
 * Проверьте различное содержание. Содержимое наших вики-сайтов очень разнообразно, и машинный перевод в одних случаях может работать гораздо лучше, чем в других. Например, контент, содержащий большое количество числовых данных или технических названий, может потребовать от пользователей меньшего объема редактирования, чем контент с более описательным текстом. Обязательно проводите тестирование, переводя статьи разных типов, разной длины, с разным содержанием.
 * Приготовьтесь к итерациям. Корректировка пороговых значений является итерационным процессом. Возможно, потребуется внести коррективы в пороговые значения или усовершенствовать общий подход. В любом случае, после каждого изменения может потребоваться дополнительное тестирование для проверки внесенных улучшений.

Корректировка лимитов в сотрудничестве с редакторами доказала свою эффективность. Например, первые результаты показывают, что индонезийское сообщество смогло значительно сократить количество получаемых проблемных переводов, ограничив публикацию переводов, более чем на 70% состоящих из не модифицированного машинного перевода. Аналогичные корректировки были сделаны для вики-проектов на языках телугу и ассамском. Не существует безошибочного автоматического инструмента, и эти ограничения не исключение.

Процесс рецензирования контента сообществом по-прежнему важен, но эти ограничения дают сообществам инструмент для уменьшения количества переводов, на которые они должны обратить внимание, что делает процесс рецензирования гораздо более эффективным. Пожалуйста, поделитесь своим мнением, и мы сможем понять, как лучше их настроить.



Отслеживание потенциально не рецензируемых переводов
Категория мониторинга с названием "cx-unreviewed-translation-category" предназначена для того, чтобы сообщества могли легко находить статьи, содержание которых превысило рекомендуемые пределы.

You can find this category in the list of tracking categories on each wiki. Using it, you can track articles that passed the limits preventing publication, but that still had some paragraphs that were edited less than expected. For example the Indonesian Wikipedia's category includes articles that have less than 40% of machine translation overall, but which have some paragraphs with more than 80% of unmodified machine translation.



Измерение качества перевода
Evaluating content quality automatically is not trivial. Deletion ratios provide a useful measure for estimating whether the content created was good enough for the community involved not to delete it. Based on the analysis of deletion ratios, articles that are created as translations are less likely to be deleted when compared with articles created from scratch. This suggests that it may not be practical to set the limits for participation through translating much higher than those set for other ways of article creation.



Найти опубликованные переводы
Content translation adds a contenttranslation edit tag to the published translations. This allows communities the ability to use Recent changes, and similar tools, to focus on pages created using the translation tool. In addition, data on published translations and the statistics for machine translation use are available for anyone to analyze.



Проверка конкретного перевода
The Translation debugger is a tool that allows the inspection of some metadata for a given translation, including the percentage of machine translation used for the whole document, and the translation service used for each paragraph. For specific types of content such as templates, the Content Translation Server API can be queried to check how templates will be transferred across languages.



Другие ограничения, основанные на опыте пользователя


Some wikis have implemented other restrictions for translating based on the user rights as a way to reduce the creation of low-quality translations. For example, English Wikipedia requires users to be extended confirmed, which means they need to make 500 edits on English Wikipedia before they are allowed to publish a translation as an article. Newer editors can still publish translated articles in the  or   namespaces, and then move the article to the mainspace.

This restriction was created before the system of limits described in this page was available, and it is not the recommended approach to encourage the creation of good quality translations.

Before adding restrictions that do not take into account the content created, consider going through the process of adjusting the limits of unmodified content as described above. The limits can be made as strict as needed to prevent low-quality translations, while still allowing publication by editors making good translations.