Help:Content translation/Translating/Translation quality/nl

Bij het creëren van een vertaling is het essentieel om eerst de inhoud te onderzoeken alvorens deze te publiceren. U moet er zeker van zijn dat de originele betekenis niet gewijzigd wordt in de vertaling en dat de vertaalde tekst leesbaar is. De initiële machinevertaling zorgt ervoor dat het vertalen sneller gaat door een bruikbaar begin te geven, maar het is wel de bedoeling dat de vertaler deze tekst kritisch bekijkt en het echt ziet als een beginpunt van de vertaling.

Er zijn wat mechanismes die ervoor zorgen dat de vertaler de initiële tekst goed aanpast. De vertaaleditor houdt bij hoeveel van de initiële vertaling is gewijzigd door de vertaler, en heeft bepaalde limieten voor het publiceren of het waarschuwen om de inhoud kritisch te beoordelen.

Op deze manier proberen we te zorgen dat de machinevertaling goed gebruikt wordt, als een beginpunt voor de vertaling. Hieronder staat aangegeven hoe deze limieten werken, hoe ze per taal aangepast kunnen worden en hoe de kwaliteit van de met het hulpmiddel aangemaakte vertalingen, beoordeeld kan worden.



Limiteren van het aanmoedigen tot het beoordelen van vertalingen
Hulpmiddel Contentvertaling meet het percentage wijzigingen dat gebruikers aanbrengen in de initiële automatische vertaling. Op deze manier weet het systeem hoeveel woorden zijn toegevoegd, verwijderd of gewijzigd ten opzichte van de eerste vertaling. Metingen worden gedaan op twee verschillende niveaus: voor elke alinea en voor de hele vertaling. Op elk niveau worden verschillende limieten toegepast, zoals hieronder beschreven.



Limieten voor de hele vertaling
Publicatie wordt geblokkeerd als 95% of meer van het hele document bestaat uit ongewijzigde, machinaal vertaalde inhoud. Deze limiet voorkomt ruwe machinevertalingen en omzeilt duidelijk vandalisme. Het voorkomt ook dat gebruikers alleen inhoud toevoegen, zonder het machinevertalingsgedeelte te bewerken. Zoals hieronder beschreven, kan deze limiet per taal worden aangepast.



Limieten voor elke alinea
Het percentage gebruikerswijzigingen wordt ook gemeten voor elke alinea. Een alinea wordt als problematisch beschouwd wanneer deze meer dan 85% van de oorspronkelijke machinevertaling bevat (of, bij het kopiëren van de inhoud uit het brondocument, meer dan 60% ongewijzigde inhoud bevat).

De vertaaleditor toont een waarschuwing voor elke alinea die als problematisch wordt beschouwd, om verdere bewerkingen door de gebruiker aan te moedigen. In sommige gevallen kunnen gebruikers nog steeds publiceren, maar de resulterende pagina kan worden toegevoegd aan een categorie van mogelijk niet-beoordeelde vertalingen die de community kan beoordelen. In andere gevallen mogen gebruikers mogelijk helemaal niet publiceren.

Hieronder volgen enkele van de factoren die in aanmerking worden genomen om te bepalen of gebruikers al dan niet mogen publiceren (waarvan sommige nog in ontwikkeling zijn):


 * Het aantal problematische alinea's. Gebruikers mogen geen vertalingen publiceren met 50 of meer problematische alinea's. Publicatie van vertalingen met minder dan 50 problematische paragrafen is toegestaan, maar vertalingen met 10 tot 49 problematische paragrafen worden toegevoegd aan een categorie van mogelijk niet-beoordeelde vertalingen die de gemeenschap kan beoordelen.
 * Eerdere verwijderde vertalingen. Om terugkerende problemen te voorkomen, identificeert het hulpmiddel gebruikers van wie de gepubliceerde vertalingen in de afgelopen 30 dagen zijn verwijderd en legt ze veel strengere beperkingen op aan hun toekomstige vertaalinspanningen. Bij deze gebruikers kunnen vertalingen met 10 problematische alinea's of meer niet worden gepubliceerd, terwijl vertalingen met 9 of minder problematische alinea's worden toegevoegd aan een categorie van mogelijk niet-beoordeelde vertalingen die de gemeenschap kan beoordelen.
 * Gebruikersbevestiging. Een minder strikte drempel wordt overwogen voor alinea's die een gebruiker als opgelost markeert, opgevat als een signaal dat de gebruiker de status van de vertaling heeft beoordeeld en bevestigd. Voor alinea's waarin de waarschuwing voor ongewijzigde inhoud wordt weergegeven, maar de gebruiker deze als opgelost markeert, wordt een minder strikte drempel toegepast (waarbij 95% van de machinevertaling of 75% van de broninhoud wordt geaccepteerd). Dit biedt een manier om tegemoet te komen aan gevallen waarin de automatische vertaling uitzonderlijk goed was, maar nog werkt om mogelijk misbruik van de functie te voorkomen (d.w.z. niet blindelings de bevestiging van een gebruiker te volgen).



Inhoud zonder limieten
Sommige inhoud zal naar verwachting niet significant worden bewerkt en wordt daarom niet in aanmerking genomen bij het toepassen van de hierboven beschreven limieten. Niet meegenomen in de meting worden zeer korte sectietitels, citaten en de lijst met referenties. Anders kunnen gebruikers misleidende waarschuwingen ontvangen over het vertalen van inhoud die dat niet zou moeten zijn, zoals boektitels die in referenties worden weergegeven of andere zelfstandige naamwoorden.

Limits on the mobile experience
For the mobile experience the initial set of limits follow a simpler approach. At the moment, only the overall percentage of unmodified machine translation for the whole translation is considered. On mobile, the whole translation consist of just one section of the article.

In particular, a warning is shown when the percentage of unmodified machine translation is over 85% for the whole section, and publishing is prevented when the when the percentage of unmodified machine translation is over 95%.

Feedback on how the limits system work on the mobile context would be very useful to determine how to evolve this initial approach.



Limieten aanpassen
The limits described above provide a set of general mechanisms, but they may need adjustment depending on the particular needs of each wiki. Based on initial evaluation, the amount of modification needed to initial machine translation can range from 10% to 70%, depending on the language pair. On some wikis, the default limits may be too strict, generating unnecessary noise or preventing perfectly valid translations from being published. On other wikis, the limits may not be strict enough, allowing the publication of translations that have not been edited enough.

Adjusting the different thresholds allows each wiki to tailor the tool's limits according to its particular needs. Feedback from native speakers is essential in properly adjusting the limits imposed. If the current limits don't seem to work well based on your experience in creating or reviewing translations, please share your feedback, and we can explore how to better adjust them.

When providing feedback about adjusting the thresholds, we recommend that you first create several example translations (make sure to check the publishing options if your test is not intended to be published as regular content). When testing how the limits work for your language, it is useful to keep in mind the following:

In this way, you can more easily find the right balance for the tool's limits feature. Checking only one type of problem can lead to moving the thresholds too far in the opposite direction. For example, content that is full of numeric data or technical names may require less editing by users than content with more descriptive text. Make sure to test by translating of a variety of different article types, of varying lengths, with disparate content. It may require custom adjustments to the thresholds or that you improve your general approach. In any case, after each change, further testing may be needed to verify the improvements made.
 * Check for both cases. Make sure to check how the limits work for both: translations where the content has not been edited enough, versus where it has been edited enough.
 * Check different content. Content in our wikis is highly diverse, and machine translation may work much better for some cases compared to others.
 * Prepare to iterate. Adjusting the thresholds is an iterative process.

Adjusting the limits in collaboration with editors has proven to be effective. For example, initial results show that the Indonesian community was able to significantly reduce the number of problematic translations they were receiving by restricting the publication of translations with more than 70% of unmodified machine translation content. Similar adjustments have been made for Telugu and Assamese language wikis. There is no automatic tool that is infallible, and these limits are not an exception.

The process of content review by the community is still essential, but these limits provide communities with a tool to reduce the number of translations they have to focus on, making the review process much more effective. Please share your feedback and we can explore how to better adjust them.



Mogelijk niet beoordeelde vertalingen volgen
A tracking category with the name "cx-unreviewed-translation-category" is provided for communities to easily find articles that have been published with some content exceeding the recommended limits.

You can find this category in the list of tracking categories on each wiki. Using it, you can track articles that passed the limits preventing publication, but that still had some paragraphs that were edited less than expected. For example the Indonesian Wikipedia's category includes articles that have less than 40% of machine translation overall, but which have some paragraphs with more than 80% of unmodified machine translation.



Kwaliteit van het vertalen meten
Evaluating content quality automatically is not trivial. Deletion ratios provide a useful measure for estimating whether the content created was good enough for the community involved not to delete it. Based on the analysis of deletion ratios, articles that are created as translations are less likely to be deleted when compared with articles created from scratch. This suggests that it may not be practical to set the limits for participation through translating much higher than those set for other ways of article creation.



Gepubliceerde vertalingen vinden
Content translation adds a contenttranslation edit tag to the published translations. This allows communities the ability to use Recent changes, and similar tools, to focus on pages created using the translation tool. In addition, data on published translations and the statistics for machine translation use are available for anyone to analyze.



Een bepaalde vertaling controleren
The Translation debugger is a tool that allows the inspection of some metadata for a given translation, including the percentage of machine translation used for the whole document, and the translation service used for each paragraph. For specific types of content such as templates, the Content Translation Server API can be queried to check how templates will be transferred across languages.



Andere limieten op basis van gebruikerservaringen


Some wikis have implemented other restrictions for translating based on the user rights as a way to reduce the creation of low-quality translations. For example, English Wikipedia requires users to be extended confirmed, which means they need to make 500 edits on English Wikipedia before they are allowed to publish a translation as an article. Newer editors can still publish translated articles in the  or   namespaces, and then move the article to the mainspace.

This restriction was created before the system of limits described in this page was available, and it is not the recommended approach to encourage the creation of good quality translations.

Before adding restrictions that do not take into account the content created, consider going through the process of adjusting the limits of unmodified content as described above. The limits can be made as strict as needed to prevent low-quality translations, while still allowing publication by editors making good translations.