Help:Content translation/Translating/Translation quality/sq

Kur të bëni përkthime, është e rëndësishme të rishikohet përmbajtja para se të publikohet. Sigurohuni që përmbajtja të mos devijojë nga kuptimi origjinal, dhe kontrolli që të jetë i lexueshëm në gjuhën e duhur. Makineria fillestare e përkthimit përmban ndihmën për të përshpejtuar procesin e përkthimit me një pike fillestare të vlefshme, por mjeti inkurajon përdoruesin ta rishikon dhe të redakton konsiderueshëm përmbajtjen fillestare.

Mekanizma të ndryshëm sigurojnë që përkthyesit kanë redaktuar përmbajtjen fillestare në mënyrë të duhur. Redaktori i përkthimeve përcjellë sa është modifikuar përmbajtja fillestare nga përdoruesi dhe përcakton limitet që ose e ndalon publikimin, ose e paralajmëron përdoruesin të rishikojë më mirë përmbajtjen.

Në këtë mënyrë, mjeti e bën të mundur që përdoruesi ta përdor makinën e përkthimit kur të jetë e nevojshme, përderisa e ndalon krijimin e rishikimeve me kualitet të dobët përkthimi. Më shumë detaje rreth asaj se si punojnë limitet, se si mund të ndryshohen në secilën gjuhë dhe si të matet kualiteti i përmbajtjes me mjetet e dhëna më poshtë.

Limitet që inkurajojnë rishikimin e përkthimit
Përkthimi i përmbajtjes e mat përqindjen e modfikimeve që bëjnë përdoruesit duke përfshirë përkthimin automatik fillestar. Në këtë mënyrë, sistemi e din sa fjalë janë shtuar, hequr, apo modifikuar nga përkthimi fillestar. Këto matje janë bërë në dy nivele të ndryshme: për çdo paragrafë dhe për të gjithë përkthimin. Limite të ndryshme janë vendosur për çdo nivel, siç detajon më poshtë.

Limitet për tërë përkthimin
Ju nuk mund të publikoni përkthimin me 99% ose më shumë përmbajtje të pamodifikuar në tërë dokumentin. Ky limit ka për qëllim të ndalojë vandalizmin e qartë. Kjo parandalon përdoruesin që të shtojë paragrafe në përkthim dhe ta publikojë atë pa bërë fare editim. Siç detajohet më poshtë, ky limit mund të rregullohet për secilën gjuhë.

Limitet për çdo paragrafë
Për çdo paragrafë, gjithashtu matet edhe përqindja e modifikimeve të përdoruesit. Një paragrafë konsiderohet problematik nëse përmban më shumë se 85% të përkthimit fillestar (ose, nëse kopjohet përmbajtja nga burimi i dokumentit, përmbanë më shumë se 60% përmbajtje të pamodifikuar).

Redaktori i përkthimit do të shfaq një paraljamërim për çdo paragrafë i cili konsiderohet problematik, duke inkurajuar përdoruesin të redaktojë më mirë. Në disa raste përdoruesit mund akoma të publikojnë, por faqja rezultuese mund të shtohet potencialisht tek kategoria e përkthimeve të pa rishikuara për komunitetin. Në raste tjera, përdoruesit nuk i lejohet të publikojë.

Këta janë disa faktorë të cilët konsiderohen për të vendosur nëse i lejohet përdoruesit ta publikojë apo jo (disa prej tyre janë akoma duke u përpunuar):


 * Numri i paragrafeve problematike. Përdoruesve iu ndalohet publikimi i përkthimeve me më shumë se 50 problematika në paragrafe. Përdoruesit mund akoma të publikojnë përkthimet me më pak se 50 problematika në paragrafe, por përkthimet me 10 deri në 49 problematike do të shtohen tek kategoria e përkthimeve të pa rishikuara për komunitetin.
 * Përkthimet e mëparshme të hequra. Për përdoruesit me disa përkthime të hequra gjatë 30 ditëve të fundit, limitet do jenë më strikte për parandalimin e ndodhjes së problemeve. Në ato raste, përkthimet me 10 apo më shumë problematika nuk do të publikohen, ndërsa ato me 9 apo më pak problematike në paragrafe do të shtohen te kategoria e përkthimeve të parishikuar për komunitetin.
 * Konfirmimi i përdoruesit. Një prag më pak strikt vlen për paragrafe që përdoruesi i ka markuar si të zgjidhura, si shenjë që përdoruesi e ka rishikuar dhe ka konfirmuar gjendjen e përkthimit. Për paragrafe në të cilat është shfaqur paralajmërimi por përdoruesi e ka markuar si të zgjidhur, ne aplikojmë më pak limite ( duke pranuar 95% nga përkthimi automatik prej burimit të informacionit). Kjo mundëson një mënyrë për të akumoduar rastet ku përkthimi është jashtëzakonisht i mirë, por prapë shmang mundësinë e abuzimit të vetive (p.sh. duke mos ndjekur konfirmimin e përdoruesit).

Përmbajtjet e pandikuara nga limitet
Disa përmbajtje nuk pritet që të redaktohen shumë, dhe nuk konsiderohen për aplikim e limiteve të përshkruara më lartë. Seksione titujsh të shkurt, citimie, ose lista e referencave janë të përjashtuara nga kontrollimi. Përndryshe, përdoruesit mund të gabojnë gjatë paralajmërive për shkak të përmbajtjes siç janë titujt e librave në referenca të cilat nuk përkthehen.

Përshtatja e limiteve
The limits described above provide a set of general mechanisms, but they may need adjustments to the particular needs of each wiki. Based on initial evaluations, the amount of modifications needed to the initial machine translation can range from 10% to 70% depending on the language pair. On some wikis the default limits may be too strict, generating unnecessary noise or preventing perfectly valid translations from publishing. On other wikis, the limits may not be strict enough, allowing the publication of translations that are not edited enough.

Adjusting the different thresholds allows to make these limits more or less strict according to the needs of each wiki. Feedback from native speakers is essential to adjust the limits properly. If the current limits don't seem to work well based on your experience creating or reviewing translations, please share your feedback and we can explore how to better adjust them.

When providing feedback about adjusting the thresholds we recommend trying to create several example translations (make sure to check the publishing options if your test is not intended to be published as regular content). When testing how the limits work for your language, it is useful to keep in mind the following:


 * Check for both cases. Make sure to check how the limits work for translations where the content has not been edited enough and also for those where the initial translation has been edited enough. In this way you can more easily find the right balance for the limits. Checking only one type of problem can lead you to suggest moving the thresholds too far in the opposite direction.
 * Check different contents. Content in a wiki is very diverse, and machine translation may work much better for some cases compared to others. For example, content full of numeric data or technical names may require less editing by users than content with more descriptive text. Make sure to test with different articles, making translations of different lengths and involving different types of content.
 * Prepare to iterate. Adjusting the thresholds is an iterative process. It may require to make a custom adjustment to the thresholds or improve the general approach. In any case, after each change further testing may be needed to verify the improvements.

Adjusting the limits in collaboration with editors has proven to be effective. For example, initial results show that the Indonesian community has reduced significantly the number of problematic translations by restricting the publication of translations with more than 70% of unmodified machine translation. Similar adjustments have been made for Telugu and Assamese There is no automatic tool that is infallible, and these limits are not an exception.

The process of content review by the community is still essential, but these limits provide communities with tools to reduce the number of translations they have to focus on, making the review process much more effective. Please share your feedback and we can explore how to better adjust them.

Tracking potentially unreviewed translations
A tracking category with the name "cx-unreviewed-translation-category" is provided for the community to easily find the articles that were published with some content exceeding the recommended limits.

You can find this category in the list of tracking categories on each wiki. There you can find the articles that passed the limits that prevent publishing but had still some paragraphs that have been edited less than expected. For example the Indonesian category includes articles that have less than 40% of machine translation overall but have some paragraphs with more than 80% of unmodified machine translation.

Measuring translation quality
Evaluating content quality automatically is not trivial. Deletion ratios provide a useful estimation on whether the content created was good-enough for the community of editors not to delete it. Based on the analysis of deletion ratios, articles that are created as translations are less likely to be deleted compared to an initial version of the article created from scratch. This suggests that it may not be practical to set the limits for participation by translating much higher than those set for other ways of article creation.

Content translation adds a contenttranslation edit tag to the published translations, for communities to be able to focus on the translations created with the tool using Recent changes and similar tools. In addition, data on published translations and the statistics for machine translation use are available for anyone to analyze.

Other limits based on user expertise


Some wikis have implemented other restrictions for translating based on the user rights as a way to reduce the creation of low quality translations. For example, English Wikipedia requires users to be extended confirmed, which means they need to make 500 edits on English Wikipedia before they are allowed to publish a translation as an article. Newer editors can still publish translated articles in the  or   namespaces, and then move the article to the mainspace.

This restriction was created before the system of limits described in this page was available, and it is not the recommended approach to encourage the creation of good quality translations.

Before adding restrictions that do not take into account the content created, consider going through the process of adjusting the limits of unmodified content as described above. The limits can be made as strict as needed to prevent low quality translations, while still allowing editors making good translations to publish them.