Help:Content translation/Translating/Translation quality/ku

Dema ku werger çêdibe, pêdivî ye ku meriv naverokê berî weşandina wan binirxîne. Pêdivî ye ku hûn pê ewle bin ku naveroka hatî hilberandin wateya orîjînal bi rengek nexwestî naguhezîne û kontrol bikin ku ew bi xwezayî bi zimanê armancê dixwîne. wergera makîneya destpêkê ya ku tê peyda kirin dibe alîkar ku pêvajoya wergerandinê bi xalek destpêkek kêrhatî bilezîne, lê amûr bikarhêneran teşwîq dike ku naveroka destpêkê binirxînin û bi girîngî biguherînin.

Mekanîzmayên cûrbecûr têne terxan kirin ku wergêr wergerên destpêkê bi guncaw biguherîne. Edîtorê wergerandinê dişopîne ka çiqas wergera destpêkê ji hêla bikarhêner ve hatî guheztin, û sînorên cûda destnîşan dike ku yan: pêşî li weşanê bigire, an jî bikarhêneran hişyar bike ku wan teşwîq bike ku bêtir naverokê binirxînin.

Bi vî rengî, amûr ji bikarhêneran re gengaz dike ku wergerek makîneya destpêkê baş bikar bînin, di heman demê de pêşî li afirandina encamên hûrgulî, bi kalîteya nizm digire. Zêdetir hûrgulî li jêr têne pêşkêş kirin ka ev sînor çawa dixebitin, ew çawa dikarin li gorî hewcedariyên her zimanî werin sererast kirin û meriv çawa qalîteya naveroka ku bi amûrê hatî hilberandin tê pîvandin.

Sînorên ji bo teşwîqkirina nirxandina wergerê
Wergera naverokê rêjeya guhertinan dipîve ku bikarhêner li wergera destpêkê ya otomatîkî hatiye pêşkêşkirin dikin. Bi vî awayî, pergal dizane ku çend peyv ji wergera destpêkê hatine zêdekirin, jêbirin an guherandin. Pîvandin di du astên cihê de têne çêkirin: ji bo her paragrafê û ji bo tevahiya wergerê. Di her astê de tixûbên cihêreng têne sepandin, wekî ku li jêr têne berfireh kirin.

Sînorên ji bo tevahiya wergerê
Weşan tê asteng kirin ger ji % 99 an zêdetir ji tevahiya belgeyê ji naveroka neguherbar, bi makîneya wergerandinê pêk tê. Ev tixûb pêşî li wergerên makîneya hema-raw digire û vandalîzma zelal ji holê radike. Di heman demê de ew rê dide bikarhêneran ku tenê naverok lê zêde bikin, bêyî ku beşa wergera makîneyê biguherînin. Wekî ku li jêr hatî berfireh kirin, ev sînor dikare li ser bingeha her zimanî were sererast kirin.

Sînorên her paragrafê
Rêjeya guhertinên bikarhêner ji bo her paragrafê jî tê pîvandin. Paragrafek dema ku ji % 85ê wergera makîneya destpêkê zêdetirî tê de pirsgirêk tê hesibandin (yan jî, dema ku naverokê ji belgeya çavkaniyê kopî dike, ew ji% 60-ê naveroka neguhêrbar vedihewîne).

Edîtorê wergerê dê ji bo her paragrafek ku pirsgirêk tê hesibandin hişyariyek nîşan bide, ji hêla bikarhêner ve guherandinên din teşwîq dike. Di hinek rewşan de, bikarhêner hêj jî dikarin biweşînin, lê rûpela encam dibe ku li kategoriyek şopandinê ya wergerên potansiyel nehatine vekolîn were zêdekirin ku civakê binirxîne. Di rewşên din de, dibe ku bikarhêner qet destûr nedin ku biweşînin.

Li jêr hin faktor hene ku ji bo destnîşankirina ka destûr bidin bikarhêneran ku weşan bikin an na (hin ji wan hîn di pêşkeftinê de ne) têne hesibandin:


 * Hejmara paragrafên bi pirsgirêk. Bikarhêner nikarin wergerên bi 50 an jî zêdetir paragrafên bi pirsgirêk çap bikin. Weşandina wergerên bi kêmtirî 50 paragrafên problematîk destûr e, lê yên ku ji 10 heta 49 paragrafên wan ên problematîk hene dê li kategoriya şopandina wergerên potansiyel nehatine vekolîn werin zêdekirin da ku civat lê binihêre.
 * Wergerên berê yên jêbirin. Ji bo pêşîgirtina pirsgirêkên dûbare, amûr bikarhênerên ku wergerên wan ên çapkirî di 30 rojên dawîn de hatine jêbirin, destnîşan dike û sînorên pir hişktir li ser hewldanên wan ên wergerê yên paşerojê ferz dike. Ji bo bikarhênerên vê polê, wergerên bi 10 paragrafên bi pirsgirêk an zêdetir ji weşanê tên asteng kirin, lê yên ku 9 paragrafên wan kêm an kêmtir pirsgirêk hene ji bo ku civakê binirxîne li kategoriyek şopandinê ya wergerên potansiyel nehatine nirxandin têne zêdekirin.
 * Piştrastkirina Bikarhêner. Ji bo paragrafên ku bikarhêner wekî çareserkirî nîşan dide, tixûbek kêmtir hişk tê hesibandin — wekî îşaretek ku bikarhêner rewşa wergerê nirxandiye û piştrast kiriye. Ji bo paragrafên ku hişyariya naveroka neguhêrbar tê xuyang kirin, lê bikarhêner wê wekî çareserkirî nîşan dide, bendek kêmtir hişk tê sepandin (qebûlkirina 95% ji wergera Makîneyê an% 75 ji naveroka çavkaniyê). Ev ê rêyek peyda bike da ku rewşên ku wergera otomatîkî bi taybetî baş bû peyda bike, lê dîsa jî ji destdirêjiya potansiyel a taybetmendiyê dûr bikeve (ango, ne kor li dû pejirandina bikarhênerek).

Naveroka ku ji sînoran nayê bandor kirin
Hinek naverok nayê hêvîkirin ku bi girîngî were guheztin, û ji ber vê yekê dema ku sînorên ku li jor hatine destnîşan kirin têne sepandin nayên hesibandin. Sernavên beşên pir kurt, navgîn, an navnîşa referansê ji lêkolînê têne derxistin. Wekî din, bikarhêner dikarin hişyariyên xapînok li ser wergerandina naverokê ya ku nabe wergirin, wek mînak sernavên pirtûkan ku di referans an navên din ên xwerû de xuya dibin.

Mîhengkirina sînoran
Sînorên ku li jor hatine diyar kirin komek mekanîzmayên gelemperî peyda dikin, lê dibe ku ew li gorî hewcedariyên taybetî yên her wiki-yê hewceyê sererastkirinê bin. Li ser bingeha nirxandina destpêkê, mêjera guheztina ku ji bo wergera makîneya destpêkê hewce dike dikare ji% 10 heya 70% be, li gorî cotê zimanî. Li ser hinek wikiyan, dibe ku sînorên xwerû pir hişk bin, dengek nehewce çêbike an jî rê li ber weşandina wergerên bêkêmasî yên derbasdar bigire. Di wîkiyên din de, dibe ku sînor bi têra xwe hişk nebin, ku destûrê dide weşandina wergerên ku têra xwe nehatine sererastkirin.

Mîhengkirina tixûbên cihêreng dihêle ku her wiki sînorên amûrê li gorî hewcedariyên xwe yên taybetî biguncîne. Bersiva ji axaftvanên xwemalî ji bo bi rêkûpêk verastkirina tixûbên hatine ferz kirin pêdivî ye. Ger ku sînorên heyî li gorî ezmûna we ya di afirandin an vekolîna wergeran de baş xuya nakin, ji kerema xwe nerînên xwe parve bikin, û em dikarin bikolin ka meriv çawa wan çêtir eyar bike.

When providing feedback about adjusting the thresholds, we recommend that you first create several example translations (make sure to check the publishing options if your test is not intended to be published as regular content). When testing how the limits work for your language, it is useful to keep in mind the following:

In this way, you can more easily find the right balance for the tool's limits feature. Checking only one type of problem can lead to moving the thresholds too far in the opposite direction. For example, content that is full of numeric data or technical names may require less editing by users than content with more descriptive text. Make sure to test by translating of a variety of different article types, of varying lengths, with disparate content. It may require custom adjustments to the thresholds or that you improve your general approach. In any case, after each change, further testing may be needed to verify the improvements made.
 * Check for both cases. Make sure to check how the limits work for both: translations where the content has not been edited enough, versus where it has been edited enough.
 * Check different content. Content in our wikis is highly diverse, and machine translation may work much better for some cases compared to others.
 * Prepare to iterate. Adjusting the thresholds is an iterative process.

Adjusting the limits in collaboration with editors has proven to be effective. For example, initial results show that the Indonesian community was able to significantly reduce the number of problematic translations they were receiving by restricting the publication of translations with more than 70% of unmodified machine translation content. Similar adjustments have been made for Telugu and Assamese language wikis. There is no automatic tool that is infallible, and these limits are not an exception.

The process of content review by the community is still essential, but these limits provide communities with a tool to reduce the number of translations they have to focus on, making the review process much more effective. Please share your feedback and we can explore how to better adjust them.

Tracking potentially unreviewed translations
A tracking category with the name "cx-unreviewed-translation-category" is provided for communities to easily find articles that have been published with some content exceeding the recommended limits.

You can find this category in the list of tracking categories on each wiki. Using it, you can track articles that passed the limits preventing publication, but that still had some paragraphs that were edited less than expected. For example the Indonesian Wikipedia's category includes articles that have less than 40% of machine translation overall, but which have some paragraphs with more than 80% of unmodified machine translation.

Measuring translation quality
Evaluating content quality automatically is not trivial. Deletion ratios provide a useful measure for estimating whether the content created was good enough for the community involved not to delete it. Based on the analysis of deletion ratios, articles that are created as translations are less likely to be deleted when compared with articles created from scratch. This suggests that it may not be practical to set the limits for participation through translating much higher than those set for other ways of article creation.

Find published translations
Content translation adds a contenttranslation edit tag to the published translations. This allows communities the ability to use Recent changes, and similar tools, to focus on pages created using the translation tool. In addition, data on published translations and the statistics for machine translation use are available for anyone to analyze.

Inspect a specific translation
The Translation debugger is a tool that allows the inspection of some metadata for a given translation, including the percentage of machine translation used for the whole document, and the translation service used for each paragraph. For specific types of content such as templates, the Content Translation Server API can be queried to check how templates will be transferred across languages.

Other limits based on user expertise


Some wikis have implemented other restrictions for translating based on the user rights as a way to reduce the creation of low-quality translations. For example, English Wikipedia requires users to be extended confirmed, which means they need to make 500 edits on English Wikipedia before they are allowed to publish a translation as an article. Newer editors can still publish translated articles in the  or   namespaces, and then move the article to the mainspace.

This restriction was created before the system of limits described in this page was available, and it is not the recommended approach to encourage the creation of good quality translations.

Before adding restrictions that do not take into account the content created, consider going through the process of adjusting the limits of unmodified content as described above. The limits can be made as strict as needed to prevent low-quality translations, while still allowing publication by editors making good translations.