Help:Content translation/Translating/Translation quality/id

Ketika membuat sebuah terjemahan, sangat penting untuk meninjau kembali konten sebelum menerbitkannya. Anda perlu memastikan bahwa konten yang dibuat tidak mengubah arti asli, dan memeriksa apa konten tersebut dapat dibaca secara alami dalam bahasa tujuan. Terjemahan mesin awal memberikan bantuan untuk mempercepat proses penerjemahan dari titik awal yang berguna, tetapi alat ini mendorong para pengguna untuk menilai dan menyunting kebanyakan konten awal.

Mekanisme yang berbeda menjamin bahwa penerjemah menyunting terjemahan awal dengan tepat. Penyunting terjemahan melacak berapa terjemahan awal yang diubah oleh pengguna, dan menetapkan batas yang berbeda untuk mencegah penerbitan, atau memperingatkan pengguna untuk mendorong mereka untuk meninjau konten lebih lanjut.

Dengan begini, alat ini memungkinkan para pengguna menggunakan terjemahan mesin ketika mereka menggunakannya dengan baik, serta menahan pembuatan terjemahan berkualitas rendah yang minim ditinjau. Detail lebih lanjut mengenai cara kerja batasan ini, cara menyesuaikannya dengan kebutuhan masing-masing bahasa, dan cara mengukur kualitas konten yang dihasilkan oleh alat ini disediakan di bawah.

Batasan untuk mendorong peninjauan terjemahan
Terjemahan konten mengukur persentase pengubahan yang pengguna buat di terjemahan otomatis awal yang disediakan. Dengan begini, sistem tahu berapa banyak kata yang telah ditambahkan, dihapus, atau diubah dari terjemahan awal. Pengukuran ini dilakukan pada dua tingkat: untuk masing-masing paragraf dan untuk seluruh terjemahan. Batasan berbeda diterapkan kepada masing-masing tingkat, sebagaimana dijelaskan di bawah.

Batasan untuk seluruh terjemahan
Anda tidak bisa menerbitkan terjemahan berisi 99% atau lebih konten yang tidak diubah dalam seluruh komputer. Batasan ini dimaksudkan untuk menghentikan vandalisme yang sangat jelas. Ini menghentikan para pengguna dari sekadar menambahkan paragraf ke penerjemahan dan menerbitkan mereka tanpa disunting sama sekali. Sebagaimana dijelaskan di bawah, batas ini bisa disesuaikan berdasarkan bahasa.

Batasan untuk masing-masing paragraf
Untuk setiap paragraf, persentase pengubahan dari pengguna juga diukur. Suatu paragraf dianggap bermasalah ketika paragraf tersebut mengandung lebih dari 85% terjemahan mesin awal (atau, ketika menyalin konten dari dokumen sumber, mengandung lebih dari 60% konten yang tidak diubah).

Penyunting terjemahan akan menampilkan peringatan untuk setiap paragraf yang dianggap bermasalah, mendorong pengguna untuk terus menyuntingnya. Dalam beberapa kasus pengguna masih bisa menerbitkannya, tetapi halaman yang dihasilkan bisa ditambahkan ke kategori pelacak terjemahan yang berpotensi belum ditinjau agar bisa ditinjau oleh komunitas. Dalam kasus lainnya, pengguna tidak dibolehkan menerbitkannya.

Berikut adalah beberapa faktor yang dipertimbangkan ketika menentukan apakah pengguna diperbolehkan menerbitkan atau tidak (beberapa masih dalam pengembangan):


 * Banyak paragraf bermasalah. Pengguna dilarang menerbitkan terjemahan dengan 50 atau lebih paragraf bermasalah. Pengguna masih bisa menerbitkan terjemahan dengan kurang dari 50 paragraf bermasalah, tetapi terjemahan dengan 10 sampai 49 terjemahan bermasalah akan ditambahkan ke kategori pelacak terjemahan yang berpotensi belum ditinjau agar ditinjau oleh komunitas.
 * Terjemahan yang sebelumnya dihapus. Bagi para pengguna dengan beberapa terjemahan yang dihapus pada 30 hari terakhir, batasannya akan lebih ketat untuk menghentikan masalah yang berulang. Dalam kasus tersebut ,terjemahan dengan 10 paragraf bermasalah atau lebih akan dihentikan dari diterbitkan, sedangkan yang memiliki 9 atau lebih kecil paragraf bermasalah akan ditambahkan ke kategori pelacak terjemahan yang berpotensi belum ditinjau agar ditinjau oleh komunitas.
 * Konfirmasi pengguna. Batasan yang lebih ringan dipertimbangkan untuk paragraf yang ditandai pengguna sudah diselesaikan, sebagai penanda bahwa pengguna itu telah meninjau dan mengonfirmasi status terjemahan. Untuk paragraf di mana peringatan konten tidak diubah ditampilkan tetapi pengguna menandainya sudah diselesaikan, kami menerapkan batasan yang lebih ringan (menerima 95% terjemahan mesin atau 75% konten sumber). Ini akan memberikan cara untuk menghadapi kasus di mana terjemahan otomatisnya sangatlah bagus, tetapi tetap menghindari potensi penyalahgunaan fitur ini (tidak sembarangan mengikuti konfirmasi pengguna).

Konten yang tidak dipengaruhi oleh batasan
Beberapa konten diperkirakan tidak perlu disunting besar-besaran, dan mereka tidak dianggap ketika menerapkan batasan yang dijelaskan di atas. Judul bagian yang sangat pendek, catatan kaki, atau daftar referensi tidak dimasukkan dalam pemeriksaan. Jika tidak, pengguna bisa mendapatkan peringatan yang menyesatkan karena konten seperti judul buku dalam referensi yang mereka tidak harus terjemahkan.

Mengatur batasan-batasan
Batasan yang dijelaskan di atas memberikan mekanisme umumnya, tetapi batasan tersebut mungkin membutuhkan penyesuaian tergantung kebutuhan tertentu di masing-masing wiki. Berdasarkan evaluasi awal, banyak pengubahan yang diperlukan dari terjemahan mesin awal bisa dari 10% hingga 70% bergantung pada pasangan bahasanya. On some wikis the default limits may be too strict, generating unnecessary noise or preventing perfectly valid translations from publishing. On other wikis, the limits may not be strict enough, allowing the publication of translations that are not edited enough.

Adjusting the different thresholds allows to make these limits more or less strict according to the needs of each wiki. Feedback from native speakers is essential to adjust the limits properly. If the current limits don't seem to work well based on your experience creating or reviewing translations, please share your feedback and we can explore how to better adjust them.

When providing feedback about adjusting the thresholds we recommend trying to create several example translations (make sure to check the publishing options if your test is not intended to be published as regular content). When testing how the limits work for your language, it is useful to keep in mind the following:


 * Check for both cases. Make sure to check how the limits work for translations where the content has not been edited enough and also for those where the initial translation has been edited enough. In this way you can more easily find the right balance for the limits. Checking only one type of problem can lead you to suggest moving the thresholds too far in the opposite direction.
 * Check different contents. Content in a wiki is very diverse, and machine translation may work much better for some cases compared to others. For example, content full of numeric data or technical names may require less editing by users than content with more descriptive text. Make sure to test with different articles, making translations of different lengths and involving different types of content.
 * Prepare to iterate. Adjusting the thresholds is an iterative process. It may require to make a custom adjustment to the thresholds or improve the general approach. In any case, after each change further testing may be needed to verify the improvements.

Adjusting the limits in collaboration with editors has proven to be effective. For example, initial results show that the Indonesian community has reduced significantly the number of problematic translations by restricting the publication of translations with more than 70% of unmodified machine translation. Similar adjustments have been made for Telugu and Assamese There is no automatic tool that is infallible, and these limits are not an exception.

The process of content review by the community is still essential, but these limits provide communities with tools to reduce the number of translations they have to focus on, making the review process much more effective. Please share your feedback and we can explore how to better adjust them.

Tracking potentially unreviewed translations
A tracking category with the name "cx-unreviewed-translation-category" is provided for the community to easily find the articles that were published with some content exceeding the recommended limits.

You can find this category in the list of tracking categories on each wiki. There you can find the articles that passed the limits that prevent publishing but had still some paragraphs that have been edited less than expected. For example the Indonesian category includes articles that have less than 40% of machine translation overall but have some paragraphs with more than 80% of unmodified machine translation.

Mengukur kualitas terjemahan
Evaluating content quality automatically is not trivial. Deletion ratios provide a useful estimation on whether the content created was good-enough for the community of editors not to delete it. Based on the analysis of deletion ratios, articles that are created as translations are less likely to be deleted compared to an initial version of the article created from scratch. This suggests that it may not be practical to set the limits for participation by translating much higher than those set for other ways of article creation.

Find published translations
Content translation adds a contenttranslation edit tag to the published translations, for communities to be able to focus on the translations created with the tool using Recent changes and similar tools. In addition, data on published translations and the statistics for machine translation use are available for anyone to analyze.

Inspect a specific translation
The Translation debugger is a tool that allows to inspect some metadata for a given translation, including the percentage of machine translation used for the whole document or the translation service used for each paragraph.

Other limits based on user expertise


Some wikis have implemented other restrictions for translating based on the user rights as a way to reduce the creation of low quality translations. For example, English Wikipedia requires users to be extended confirmed, which means they need to make 500 edits on English Wikipedia before they are allowed to publish a translation as an article. Newer editors can still publish translated articles in the  or   namespaces, and then move the article to the mainspace.

This restriction was created before the system of limits described in this page was available, and it is not the recommended approach to encourage the creation of good quality translations.

Before adding restrictions that do not take into account the content created, consider going through the process of adjusting the limits of unmodified content as described above. The limits can be made as strict as needed to prevent low quality translations, while still allowing editors making good translations to publish them.