Help:Content translation/Translating/Translation quality/uk

Під час створення перекладу важливо переглядати вміст перед його публікацією. Слід переконатися, що вироблений вміст не змінює початкового значення, та перевірити, що він читається природно мовою призначення. Початковий машинний переклад надає допомогу у пришвидшенні процесу перекладу корисною відправною точкою, але інструмент заохочує користувачів переглядати та суттєво редагувати початковий вміст.

Різні механізми гарантують, що перекладачі редагують початкові переклади відповідним чином. Редактор перекладу відстежує, в якій мірі початковий переклад змінено користувачем, і визначає різні обмеження для запобігання публікації чи попередження користувачів для їх заохочення до подальшого перегляду вмісту.

Таким чином, інструмент уможливлює використання користувачами машинного перекладу, коли вони добре використовують його, водночас запобігаючи створенню злегка переглянутих низькоякісних перекладів. Більше подробиць про роботу цих обмежень, їх підлаштування під потреби кожної мови та вимірювання якості вмісту, виробленого інструментом, надано нижче.

Обмеження для заохочення перегляду перекладу
Переклад вмісту вимірює відсоток змін, які користувачі зробили до наданого початкового машинного перекладу. Таким чином, система знає, скільки слів було додано, видалено чи змінено з початкового перекладу. Ці вимірювання зроблені на двох різних рівнях: для кожного абзацу та для всього перекладу. На кожному рівні застосовуються різні обмеження, як описано нижче.

Обмеження для всього перекладу
Не можна опублікувати переклад із 99% чи більше незміненого вмісту для всього документу. Це обмеження призначене для блокування найчіткішого вандалізму. Це запобігає додаванню користувачами абзаців до перекладу та їх публікації взагалі без редагувань. Як описано нижче, це обмеження може пристосовуватися від мови до мови.

Обмеження для кожного абзацу
Для кожного абзацу також вимірюється відсоток користувацьких змін. Абзац вважається проблемним, коли він містить понад 85% початкового машинного перекладу (або, в разі копіювання вмісту з початкового документу, — понад 60% незміненого вмісту).

Редактор перекладу покаже попередження для кожного абзацу, який вважається проблемним, заохочуючи користувача редагувати його далі. У деяких випадках користувачі все ще здатні публікувати, але результатна сторінка може бути додана до категорії відстеження потенційних невичитаних перекладів для перегляду спільнотою. В інших випадках користувачам може не бути дозволено публікувати.

Для визначення того, чи дозволено користувачеві публікувати, чи ні, розглядаються деякі чинники (деякі з яких досі в розробці):


 * Кількість проблемних абзаців. Користувачам заважають публікувати переклади з 50 або більше проблемними абзацами. Користувачі все ще можуть опублікувати переклади з менш ніж 50 проблемними абзацами, але переклади з 10—49 проблемними абзацами будуть додані до категорії відстеження потенційно невичитаних перекладів для перегляду спільнотою.
 * Раніше вилучені переклади. Для користувачів із деякими перекладами, вилученими за останні 30 днів, обмеження будуть набагато суворішими для запобігання повторюваним проблемам. У таких випадках переклади з 10 проблемними абзацами або більше буде заборонено публікувати, тоді як з 9 або менше проблемними абзацами буде додано до категорії відстеження потенційно невичитаних перекладів для перегляду спільнотою.
 * Підтвердження користувача. Менш суворий поріг розглядається для абзаців, які користувачі позначили вирішеними, як сигнал того, що користувач переглянув і підтвердив статус перекладу. Для абзаців, для яких було показано попередження про незмінений вміст, але користувач позначив його вирішеним, ми застосовуємо менш суворий поріг (приймаючи 95% машинного перекладу чи 75% початкового вмісту). Це забезпечуватиме шлях до пристосування до випадків, коли автоматичний переклад був винятково добрим, але все ще уникатиме потенційного зловживання можливістю (тобто не слідувати сліпо підтвердженням користувача).

Вміст, на який не впливають обмеження
Деякий вміст не очікується суттєво редагувати, і він не розглядається при застосуванні вищеописаних обмежень. Закороткі заголовки розділів, цитування чи список виносок виключаються з перевірок. Інакше користувачі можуть отримати попередження, що вводять в оману, через такий вміст, як заголовки книг у своїх виносках, який вони не очікували перекладати.

Пристосування обмежень
Обмеження, описані вище, надають набір загальних механізмів, але вони можуть потребувати пристосувань до конкретних потреб кожної вікі. На основі початкових оцінювань, кількість змін, необхідних початковому машинному перекладу, може бути в діапазоні від 10% до 70% залежно від мовної пари. On some wikis the default limits may be too strict, generating unnecessary noise or preventing perfectly valid translations from publishing. On other wikis, the limits may not be strict enough, allowing the publication of translations that are not edited enough.

Adjusting the different thresholds allows to make these limits more or less strict according to the needs of each wiki. Feedback from native speakers is essential to adjust the limits properly. If the current limits don't seem to work well based on your experience creating or reviewing translations, please share your feedback and we can explore how to better adjust them.

When providing feedback about adjusting the thresholds we recommend trying to create several example translations (make sure to check the publishing options if your test is not intended to be published as regular content). When testing how the limits work for your language, it is useful to keep in mind the following:


 * Check for both cases. Make sure to check how the limits work for translations where the content has not been edited enough and also for those where the initial translation has been edited enough. In this way you can more easily find the right balance for the limits. Checking only one type of problem can lead you to suggest moving the thresholds too far in the opposite direction.
 * Check different contents. Content in a wiki is very diverse, and machine translation may work much better for some cases compared to others. For example, content full of numeric data or technical names may require less editing by users than content with more descriptive text. Make sure to test with different articles, making translations of different lengths and involving different types of content.
 * Prepare to iterate. Adjusting the thresholds is an iterative process. It may require to make a custom adjustment to the thresholds or improve the general approach. In any case, after each change further testing may be needed to verify the improvements.

Adjusting the limits in collaboration with editors has proven to be effective. For example, initial results show that the Indonesian community has reduced significantly the number of problematic translations by restricting the publication of translations with more than 70% of unmodified machine translation. Similar adjustments have been made for Telugu and Assamese There is no automatic tool that is infallible, and these limits are not an exception.

The process of content review by the community is still essential, but these limits provide communities with tools to reduce the number of translations they have to focus on, making the review process much more effective. Please share your feedback and we can explore how to better adjust them.

Відстеження потенційно непереглянутих перекладів
Категорія відстеження з назвою «cx-unreviewed-translation-category» надається спільноті для легшого пошуку статей, які були опубліковані з деяким вмістом, що перевищує рекомендовані обмеження.

Ви можете знайти цю категорію у списку категорій відстеження в кожній вікі. Там ви можете знайти статті, які пройшли обмеження, що запобігають публікації, але все ще мали деякі абзаци, які редагувалися менше за очікуване. Наприклад, індонезійська категорія містить статті з менш ніж 40% машинного перекладу загалом, але з деякими абзацами з понад 80% незміненого машинного перекладу.

Вимірювання якості перекладу
Автоматичне оцінювання якості вмісту не є тривіальним. Співвідношення видалення надає корисну оцінку того, чи був створений вміст достатньо добрим для спільноти дописувачів, аби не вилучати його. На основі аналізу співвідношень видалення статті, створені як перекладу, менш імовірно будуть вилучені порівняно з початковою версією статті, створеної з нуля. Це говорить про те, що може бути непрактично встановлювати обмеження на участь, перекладаючи набагато більше, ніж іншими способами створюючи статті.

Переклад вмісту додає тег редагування contenttranslation до опублікованих перекладів, аби спільноти мали змогу зосередитися на перекладах, створених інструментом, за допомогою «Нещодавніх змін» і подібних інструментів. На додачу, дані в опублікованих перекладах і статистика використання машинного перекладу доступні для кожного для аналізу.

Інші обмеження на основі користувацького досвіду


Some wikis have implemented other restrictions for translating based on the user rights as a way to reduce the creation of low quality translations. For example, English Wikipedia requires users to be extended confirmed, which means they need to make 500 edits on English Wikipedia before they are allowed to publish a translation as an article. Newer editors can still publish translated articles in the  or   namespaces, and then move the article to the mainspace.

This restriction was created before the system of limits described in this page was available, and it is not the recommended approach to encourage the creation of good quality translations.

Before adding restrictions that do not take into account the content created, consider going through the process of adjusting the limits of unmodified content as described above. The limits can be made as strict as needed to prevent low quality translations, while still allowing editors making good translations to publish them.