Help:Content translation/Translating/Translation quality/de

Wenn Du eine Übersetzung erstellst, musst Du die Inhalte unbedingt überprüfen, bevor Du sie veröffentlichst. Du musst sicherstellen, dass der erstellte Inhalt die ursprüngliche Bedeutung nicht ändert und gleichzeitig in der Zielsprache flüssig gelesen werden kann. Die bereitgestellte maschinelle Erstübersetzung hilft dabei, den Übersetzungsprozess von einer sinnvollen Stelle aus zu beschleunigen. Das Tool fordert die Benutzer jedoch auf, die ursprünglichen Inhalte zu überprüfen und umfassend zu bearbeiten.

Verschiedene Features gewährleisten, dass die Übersetzer die Erstübersetzungen in geeigneter Weise bearbeiten. Der Übersetzungseditor verfolgt, wie sehr die ursprüngliche Übersetzung vom Benutzer geändert wurde und definiert unterschiedliche Grenzwerte, um entweder die Veröffentlichung zu verhindern oder die den Benutzer auffordern, die Inhalte näher zu überprüfen.

Auf diese Weise ermöglicht das Tool den Benutzern, maschinelle Übersetzungen zu verwenden, wenn sie diese gut verwenden, aber verhindert gleichzeitig die Erstellung von nur oberflächlich überprüften Übersetzungen von geringer Qualität. Weiter unten erfährst Du, wie diese Grenzwerte funktionieren, wie sie an die Anforderungen der einzelnen Sprachen angepasst werden können und wie Du die Qualität der mit dem Tool erstellten Inhalte bewerten kannst.

Grenzwerte zur Überprüfung der Übersetzung
Die Inhaltsübersetzung wird an dem Prozentsatz der Änderungen gemessen, die Benutzer an der bereitgestellten automatischen Erstübersetzung vornehmen. Auf diese Weise erkennt das System, wie viele Wörter der ursprünglichen Übersetzung hinzugefügt, daraus entfernt oder geändert worden sind. Diese Messungen werden auf zwei verschiedenen Ebenen durchgeführt: einmal für jeden Absatz und einmal für die gesamte Übersetzung. Auf jeder Ebene werden unterschiedliche Grenzwerte angewendet, wie im Folgenden beschrieben.

Grenzwerte für die gesamte Übersetzung
Du kannst keine Übersetzung veröffentlichen, die 99% oder mehr unveränderten Inhalt im gesamten Dokument enthält. Diese Begrenzung soll den offensichtlichsten Vandalismus verhindern. Auf diese Weise wird verhindert, dass Benutzer nur Absätze zur Übersetzung hinzufügen und diese ohne Änderungen veröffentlichen. Wie im Folgenden beschrieben, kann dieses Limit für jede Sprache angepasst werden.

Grenzwerte für jeden Absatz
Für jeden Absatz wird auch der Prozentsatz der Modifikationen, die der Autor vorgenommen hat, gemessen. Ein Absatz wird dann als problembehaftet angesehen, wenn der Absatz mehr als 80% der ursprünglichen maschinellen Übersetzung enthält (oder wenn der Inhalt aus dem Quelldokument kopiert wurde, er mehr als 60% des unveränderten Inhalts enthält).

Der Übersetzungseditor zeigt für jeden als problembehaftet geltenden Absatz einen Warnhinweis an, der den Benutzer auffordert, den Absatz weiter zu bearbeiten. In manchen Fällen können Benutzer zwar ihren Eintrag veröffentlichen, die resultierende Seite wird jedoch möglicherweise zu einer Tracking-Kategorie potenziell nicht überprüfter Übersetzungen hinzugefügt, die von der Community überprüft werden sollen. In anderen Fällen wird die Veröffentlichung durch den Benutzer verhindert.

Nachfolgend sind einige der Faktoren, die festlegen, ob der Benutzer veröffentlichen darf oder nicht (einige davon befinden sich noch in der Entwicklung):


 * Die Anzahl der problematischen Absätze. Benutzer können keine Übersetzungen mit 50 oder mehr problembehafteten Absätzen veröffentlichen. Benutzer können weiterhin Übersetzungen mit weniger als 50 problembehafteten Absätzen veröffentlichen. Übersetzungen mit 10 bis 49 problematischen Absätzen werden jedoch zu einer Nachverfolgungskategorie potenziell nicht überprüfter Übersetzungen hinzugefügt, die von der Community überprüft werden können.
 * Früher gelöschte Übersetzungen. Für Benutzer, deren Übersetzungen in den letzten 30 Tagen gelöscht wurden, sind die Grenzwerte sehr viel strenger, um wiederkehrende Probleme zu vermeiden. In diesen Fällen wird die Veröffentlichung von Übersetzungen mit 10 oder mehr problematischen Absätzen verhindert, während Übersetzungen mit 9 oder weniger problematischen Absätzen zu einer Tracking-Kategorie potenziell nicht überprüfter Übersetzungen hinzugefügt werden, die von der Community überprüft werden sollen.
 * Benutzerbestätigung. Ein weniger strenger Schwellenwert wird für Absätze angelegt, die von Benutzern als überprüft markiert wurden, als Signal, dass der Benutzer den Status der Übersetzung überprüft und bestätigt hat. Für Absätze, bei denen der Warnhinweis zum unveränderten Inhalt angezeigt wurde, der Benutzer sie jedoch als behoben markiert hat, wird ein weniger strenger Schwellenwert angewendet (womit 95% der maschinellen Übersetzung oder 75% des Quellinhalts akzeptiert werden). Dies bietet eine Möglichkeit Fälle zu berücksichtigen, in denen die automatische Übersetzung außergewöhnlich gut war, aber dennoch einem möglichen Missbrauch vorbeugt (d. h. es wird nicht blind der Benutzerbestätigung gefolgt).

Inhalte, die nicht von den Grenzwerten betroffen sind
Bei einigen Inhalten wird nicht erwartet, dass sie wesentlich bearbeitet werden, deshalb werden sie bei der Anwendung der oben beschriebenen Grenzwerte nicht berücksichtigt. Very short section titles, citations, or the list of references are excluded from the checks. Otherwise, users may get misleading warnings because of contents such as the book titles in their references that they were not expected to translate.

Adjusting the limits
The limits described above provide a set of general mechanisms, but they may need adjustments to the particular needs of each wiki. Based on initial evaluations, the amount of modifications needed to the initial machine translation can range from 10% to 70% depending on the language pair. On some wikis the default limits may be too strict, generating unnecessary noise or preventing perfectly valid translations from publishing. On other wikis, the limits may not be strict enough, allowing the publication of translations that are not edited enough.

Adjusting the different thresholds allows to make these limits more or less strict according to the needs of each wiki. Feedback from native speakers is essential to adjust the limits properly. If the current limits don't seem to work well based on your experience creating or reviewing translations, please share your feedback and we can explore how to better adjust them.

When providing feedback about adjusting the thresholds we recommend trying to create several example translations (make sure to check the publishing options if your test is not intended to be published as regular content). When testing how the limits work for your language, it is useful to keep in mind the following:


 * Check for both cases. Make sure to check how the limits work for translations where the content has not been edited enough and also for those where the initial translation has been edited enough. In this way you can more easily find the right balance for the limits. Checking only one type of problem can lead you to suggest moving the thresholds too far in the opposite direction.
 * Check different contents. Content in a wiki is very diverse, and machine translation may work much better for some cases compared to others. For example, content full of numeric data or technical names may require less editing by users than content with more descriptive text. Make sure to test with different articles, making translations of different lengths and involving different types of content.
 * Prepare to iterate. Adjusting the thresholds is an iterative process. It may require to make a custom adjustment to the thresholds or improve the general approach. In any case, after each change further testing may be needed to verify the improvements.

Adjusting the limits in collaboration with editors has proven to be effective. For example, initial results show that the Indonesian community has reduced significantly the number of problematic translations by restricting the publication of translations with more than 40% of unmodified machine translation. There is no automatic tool that is infallible, and these limits are not an exception.

The process of content review by the community is still essential, but these limits provide communities with tools to reduce the number of translations they have to focus on, making the review process much more effective. Please share your feedback and we can explore how to better adjust them.

Tracking potentially unreviewed translations
A tracking category with the name "cx-unreviewed-translation-category" is provided for the community to easily find the articles that were published with some content exceeding the recommended limits.

You can find this category in the list of tracking categories on each wiki. There you can find the articles that passed the limits that prevent publishing but had still some paragraphs that have been edited less than expected. For example the Indonesian category includes articles that have less than 40% of machine translation overall but have some paragraphs with more than 80% of unmodified machine translation.

Measuring translation quality
Evaluating content quality automatically is not trivial. Deletion ratios provide a useful estimation on whether the content created was good-enough for the community of editors not to delete it. Based on the analysis of deletion ratios, articles that are created as translations are less likely to be deleted compared to an initial version of the article created from scratch. This suggests that it may not be practical to set the limits for participation by translating much higher than those set for other ways of article creation.

Content translation adds a contenttranslation edit tag to the published translations, for communities to be able to focus on the translations created with the tool using Recent changes and similar tools. In addition, data on published translations and the statistics for machine translation use are available for anyone to analyze.

Other limits based on user expertise


Some wikis have implemented other restrictions for translating based on the user rights as a way to reduce the creation of low quality translations. For example, English Wikipedia requires users to be extended confirmed, which means they need to make 500 edits on English Wikipedia before they are allowed to publish a translation as an article. Newer editors can still publish translated articles in the  or   namespaces, and then move the article to the mainspace.

This restriction was created before the system of limits described in this page was available, and it is not the recommended approach to encourage the creation of good quality translations.

Before adding restrictions that do not take into account the content created, consider going through the process of adjusting the limits of unmodified content as described above. The limits can be made as strict as needed to prevent low quality translations, while still allowing editors making good translations to publish them.