Help:Content translation/Translating/Translation quality/de

Wenn Du eine Übersetzung erstellst, musst Du die Inhalte unbedingt überprüfen, bevor Du sie veröffentlichst. Du musst sicherstellen, dass der erstellte Inhalt die ursprüngliche Bedeutung nicht ändert und gleichzeitig in der Zielsprache flüssig gelesen werden kann. Die bereitgestellte maschinelle Erstübersetzung hilft dabei, den Übersetzungsprozess von einer sinnvollen Stelle aus zu beschleunigen. Das Tool fordert die Benutzer jedoch auf, die ursprünglichen Inhalte zu überprüfen und umfassend zu bearbeiten.

Verschiedene Features gewährleisten, dass die Übersetzer die Erstübersetzungen in geeigneter Weise bearbeiten. Der Übersetzungseditor verfolgt, wie sehr die ursprüngliche Übersetzung vom Benutzer geändert wurde und definiert unterschiedliche Grenzwerte, um entweder die Veröffentlichung zu verhindern oder die den Benutzer auffordern, die Inhalte näher zu überprüfen.

Auf diese Weise ermöglicht das Tool den Benutzern, maschinelle Übersetzungen zu verwenden, wenn sie diese gut verwenden, aber verhindert gleichzeitig die Erstellung von nur oberflächlich überprüften Übersetzungen von geringer Qualität. Weiter unten erfährst Du, wie diese Grenzwerte funktionieren, wie sie an die Anforderungen der einzelnen Sprachen angepasst werden können und wie Du die Qualität der mit dem Tool erstellten Inhalte bewerten kannst.

Grenzwerte zur Überprüfung der Übersetzung
Die Inhaltsübersetzung wird an dem Prozentsatz der Änderungen gemessen, die Benutzer an der bereitgestellten automatischen Erstübersetzung vornehmen. Auf diese Weise erkennt das System, wie viele Wörter der ursprünglichen Übersetzung hinzugefügt, daraus entfernt oder geändert worden sind. Diese Messungen werden auf zwei verschiedenen Ebenen durchgeführt: einmal für jeden Absatz und einmal für die gesamte Übersetzung. Auf jeder Ebene werden unterschiedliche Grenzwerte angewendet, wie im Folgenden beschrieben.

Grenzwerte für die gesamte Übersetzung
Du kannst keine Übersetzung veröffentlichen, die 99% oder mehr unveränderten Inhalt im gesamten Dokument enthält. Diese Begrenzung soll den offensichtlichsten Vandalismus verhindern. Auf diese Weise wird verhindert, dass Benutzer nur Absätze zur Übersetzung hinzufügen und diese ohne Änderungen veröffentlichen. Wie im Folgenden beschrieben, kann dieses Limit für jede Sprache angepasst werden.

Grenzwerte für jeden Absatz
Für jeden Absatz wird auch der Prozentsatz der Modifikationen, die der Autor vorgenommen hat, gemessen. Ein Absatz wird dann als problembehaftet angesehen, wenn der Absatz mehr als 85% der ursprünglichen maschinellen Übersetzung enthält (oder wenn der Inhalt aus dem Quelldokument kopiert wurde, er mehr als 60% des unveränderten Inhalts enthält).

Der Übersetzungseditor zeigt für jeden als problembehaftet geltenden Absatz einen Warnhinweis an, der den Benutzer auffordert, den Absatz weiter zu bearbeiten. In manchen Fällen können Benutzer zwar ihren Eintrag veröffentlichen, die resultierende Seite wird jedoch möglicherweise zu einer Tracking-Kategorie potenziell nicht überprüfter Übersetzungen hinzugefügt, die von der Community überprüft werden sollen. In anderen Fällen wird die Veröffentlichung durch den Benutzer verhindert.

Nachfolgend sind einige der Faktoren, die festlegen, ob der Benutzer veröffentlichen darf oder nicht (einige davon befinden sich noch in der Entwicklung):


 * Die Anzahl der problematischen Absätze. Benutzer können keine Übersetzungen mit 50 oder mehr problembehafteten Absätzen veröffentlichen. Benutzer können weiterhin Übersetzungen mit weniger als 50 problembehafteten Absätzen veröffentlichen. Übersetzungen mit 10 bis 49 problematischen Absätzen werden jedoch zu einer Nachverfolgungskategorie potenziell nicht überprüfter Übersetzungen hinzugefügt, die von der Community überprüft werden können.
 * Früher gelöschte Übersetzungen. Für Benutzer, deren Übersetzungen in den letzten 30 Tagen gelöscht wurden, sind die Grenzwerte sehr viel strenger, um wiederkehrende Probleme zu vermeiden. In diesen Fällen wird die Veröffentlichung von Übersetzungen mit 10 oder mehr problematischen Absätzen verhindert, während Übersetzungen mit 9 oder weniger problematischen Absätzen zu einer Tracking-Kategorie potenziell nicht überprüfter Übersetzungen hinzugefügt werden, die von der Community überprüft werden sollen.
 * Benutzerbestätigung. Ein weniger strenger Schwellenwert wird für Absätze angelegt, die von Benutzern als überprüft markiert wurden, als Signal, dass der Benutzer den Status der Übersetzung überprüft und bestätigt hat. Für Absätze, bei denen der Warnhinweis zum unveränderten Inhalt angezeigt wurde, der Benutzer sie jedoch als behoben markiert hat, wird ein weniger strenger Schwellenwert angewendet (womit 95% der maschinellen Übersetzung oder 75% des Quellinhalts akzeptiert werden). Dies bietet eine Möglichkeit Fälle zu berücksichtigen, in denen die automatische Übersetzung außergewöhnlich gut war, aber dennoch einem möglichen Missbrauch vorbeugt (d. h. es wird nicht blind der Benutzerbestätigung gefolgt).

Inhalte, die nicht von den Grenzwerten betroffen sind
Bei einigen Inhalten wird nicht erwartet, dass sie wesentlich bearbeitet werden, deshalb werden sie bei der Anwendung der oben beschriebenen Grenzwerte nicht berücksichtigt. Sehr kurze Abschnittsüberschriften, Zitate oder die Liste der Einzelnachweise sind von der Prüfung ausgeschlossen. Anderenfalls könnten Benutzer möglicherweise irreführende Warnhinweise erhalten, etwa bei Buchtiteln in den Einzelnachweisen, die von vornherein nicht übersetzt werden sollten.

Anpassung der Grenzwerte
Die oben beschriebenen Grenzwerte stellen eine Reihe allgemein gültiger Mechanismen bereit, müssen jedoch möglicherweise an die besonderen Anforderungen eines jeden Wikis angepasst werden. Basierend auf den ersten Erkenntnissen kann die Anzahl der Änderungen, gegenüber der ursprünglichen maschinellen Übersetzung, je nach Sprachpaar zwischen 10% und 70% liegen. In manchen Wikis können die Standardgrenzwerte zu streng sein, was zu unnötigem Reaktionen führen oder die Veröffentlichung einwandfreier Übersetzungen verhindern würde. In anderen Wikis sind die Grenzwerte möglicherweise nicht streng genug, sodass Übersetzungen veröffentlicht werden können, die nicht ausreichend bearbeitet wurden.

Durch Anpassen der verschiedenen Schwellenwerte können diese Grenzwerte je nach den Anforderungen des jeweiligen Wikis mehr oder weniger streng festgelegt werden. Ein Feedback von Muttersprachlern ist wichtig, um die Grenzwerte richtig einzustellen. Wenn die aktuellen Grenzwerte aufgrund Deiner Erfahrung mit dem Erstellen oder Überprüfen von Übersetzungen nicht gut zu funktionieren scheinen, teile uns dies bitte mit, worauf wir untersuchen können, wie Du sie besser anpassen kannst.

Wenn Du uns um ein Feedback zum Anpassen der Schwellenwerte bittest, empfehlen wir, mehrere Beispielübersetzungen zu erstellen (überprüfe die Veröffentlichungsoptionen), wenn Dein Test nicht als regulärer Inhalt veröffentlicht werden soll. Beachte beim Testen der Funktionsweise der Grenzwerte für Deine Sprache Folgendes:


 * Überprüfe beide Fälle. Überprüfe, wie die Grenzwerte für Übersetzungen funktionieren, bei denen der Inhalt nicht ausreichend bearbeitet wurde sowie für Übersetzungen, bei denen die ursprüngliche Übersetzung nicht ausreichend bearbeitet wurde. Auf diese Weise findest Du leichter die richtige Gewichtung für die Grenzwerte. Wenn Du nur einen der Grenzwerte überprüfst, kann es dazu führen, dass die Schwellenwerte zu weit in die entgegengesetzte Richtung verschoben werden.
 * Unterschiedliche Inhalte prüfen. Inhalte in einem Wiki sind sehr unterschiedlich, und die maschinelle Übersetzung funktioniert in manchen Fällen möglicherweise besser als in anderen. Beispielsweise sind für Inhalte mit numerischen Daten oder technischen Namen möglicherweise weniger Bearbeitungen durch Benutzer erforderlich, als für Inhalte mit mehr beschreibenden Text. Führe unbedingt Tests mit verschiedenen Artikeln durch, mit Übersetzungen unterschiedlicher Länge und mit unterschiedlichen Arten von Inhalten.
 * Sei auf Wiederholungen vorbereitet. Das Anpassen der Schwellenwerte ist ein mehrfach zu wiederholender Vorgang. Möglicherweise muss eine maßgeschneiderte Anpassung der Schwellenwerte vorgenommen oder die generellen Werte verbessert werden. Jedenfalls werden nach jeder Änderung weitere Tests erforderlich sein, um die Verbesserungen zu überprüfen.

Bei der Anpassung der Grenzwerte hat sich eine Zusammenarbeit mit Autoren als zielführend erwiesen. Erste Ergebnisse zeigen beispielsweise, dass die indonesische Gemeinschaft die Anzahl problematischer Übersetzungen erheblich reduziert hat, indem nur die Veröffentlichung von Übersetzungen, die mehr als 70% nicht modifizierte maschinelle Übersetzungen enthielten, eingeschränkt wurde. Similar adjustments have been made for Telugu and Assamese Es gibt kein unfehlbares automatisches Tool, und die Einstellung der Grenzwerte bildet da keine Ausnahme.

Der Prozess der Inhaltsüberprüfung durch die Community ist nach wie vor von entscheidender Bedeutung, aber die Grenzwerte bieten den Communitys Tools, mit denen sie die Anzahl der zu prüfenden Übersetzungen reduzieren können, wodurch der Überprüfungsaufwand effektiver wird. Bitte gib uns dein Feedback und wir können untersuchen, wie sie besser angepasst werden können.

Sichtung potentiell nicht überprüfter Übersetzungen
Die Community verfügt über eine Sichtungs-Kategorie mit dem Namen "cx-unreviewed-translation-category", mit der Artikel, deren Inhalt die empfohlenen Grenzwerte überschreitet, problemlos gefunden werden können.

Du findest diese Kategorie in der Liste der Sichtungs-Kategorien in jedem Wiki. Dort findest Du die Artikel, bei denen die Veröffentlichungsgrenzwerte überschritten wurden, in denen jedoch weniger Absätze als erwartet, bearbeitet wurden. Beispielsweise umfasst die indonesische Kategorie Artikel, die insgesamt weniger als 40% der maschinellen Übersetzung enthalten, in einigen Absätzen jedoch mehr als 80% der maschinellen Übersetzung enthalten.

Beurteilung der Übersetzungsqualität
Die automatische Bewertung der Qualität von Inhalten ist nicht trivial. Die Löschstatistik ist nützlich für die Einschätzung, ob der erstellte Inhalt für die Autoren-Community qualitativ gut genug war, um ihn nicht zu löschen. Basierend auf der Analyse der Löschstatistik ist es unwahrscheinlicher, dass Artikel, die als Übersetzungen erstellt wurden, gelöscht werden, als eine ursprünglichen Version des Artikels, die von Grund auf neu erstellt wurde. Dies legt nahe, dass es eher ungünstig sein dürfte, die Grenzwerte für Übersetzungen wesentlich höher anzusetzen, als für andere Arten der Artikelerstellung.

Die Inhaltsübersetzung fügt den veröffentlichten Übersetzungen ein Bearbeitungs-Tag "Inhaltsübersetzung" hinzu, damit die Communitys sich in den Tools "Letzte Änderungen" und ähnlichen, auf die mit dem Übersetzungs-Tool erstellten Übersetzungen hingewiesen werden. Darüber hinaus stehen Daten zu veröffentlichten Übersetzungen und die Statistiken für die maschinelle Übersetzung jedem zur Analyse zur Verfügung.

Andere, auf dem Sachverstand der Benutzer basierende Grenzwerte


Einige Wikis haben andere Einschränkungen für die Übersetzung basierend auf den Benutzerrechten eingeführt, um die Erstellung von Übersetzungen mit geringer Qualität zu reduzieren. Zum Beispiel erfordert das Übersetzungs-Tool in der Englischen Wikipedia, dass Benutzer eine erweiterte Bestätigung haben müssen, was bedeutet, dass sie 500 Änderungen in der englischen Wikipedia vorgenommen haben müssen, bevor sie eine Übersetzung als Artikel veröffentlichen dürfen. Neue Autoren können übersetzte Artikel weiterhin in ihrem Benutzernamensraum  oder   veröffentlichen und anschließend in den Artikelnamensraum verschieben.

Diese Einschränkung wurde erstellt, bevor das hier auf dieser Seite beschriebene Grenzwertsystem verfügbar war. Es wird nicht empfohlen, die Erstellung qualitativ hochwertiger Übersetzungen zu fördern.

Bevor Du Einschränkungen hinzufügst, die den erstellten Inhalt nicht berücksichtigen, solltest Du die oben beschriebenen Grenzwerte für den ursprünglichen Inhalt angepasst haben. Die Grenzwerte können so eng wie nötig festgelegt werden, um qualitativ minderwertige Übersetzungen zu vermeiden, während die Autoren weiterhin die Möglichkeit haben, gute Übersetzungen zu veröffentlichen.