Hilfe:Inhaltsübersetzung/Übersetzen/Erste maschinelle Übersetzung

From MediaWiki.org
Jump to navigation Jump to search
This page is a translated version of the page Help:Content translation/Translating/Initial machine translation and the translation is 43% complete.
Other languages:
Bahasa Indonesia • ‎Deutsch • ‎English • ‎Kanuri • ‎español • ‎français • ‎português • ‎português do Brasil • ‎svenska • ‎русский • ‎日本語

Wenn Sie der Übersetzung einen neuen Absatz hinzufügen, können Sie bei Null anfangen oder eine automatische Übersetzung als Ausgangspunkt verwenden. Wenn verfügbar, wird die maschinelle Übersetzung standardmäßig als Erstübersetzung verwendet. Die verschiedenen Optionen, die Einzelheiten zu ihrer Verfügbarkeit und die Überlegungen bei der Verwendung der maschinellen Übersetzung werden im Folgenden beschrieben.

Optionen für die Erstübersetzung

Die Optionen "Erstübersetzung" in der Spalte "Werkzeuge" ermöglichen es Ihnen, den anfänglichen Inhalt zu bestimmen, der als Ausgangspunkt für jeden Absatz verwendet werden soll. Folgende Optionen stehen zur Verfügung:

  • Einen maschinellen Übersetzungsdienst verwenden. Damit können Sie mit einer automatisch übersetzten Version des Originalabsatzes beginnen. Die Anzahl und Bezeichnung dieser Optionen wird variieren. Optionen wie "Apertium verwenden" oder "Yandex verwenden" werden je nach den für diese Dienste unterstützten Sprachen verfügbar sein (mehr dazu im nächsten Abschnitt).
  • Den ursprünglichen Inhalt kopieren. Der ursprüngliche Absatz wird in die Übersetzung übernommen. Obwohl der Inhalt in der Originalsprache bleibt, werden einige Elemente an das Ziel-Wiki angepasst. Beispielsweise verweisen Links auf den entsprechenden Artikel in der Zielsprache, und Vorlagen werden in die entsprechenden umgewandelt. Die Übersetzer müssen den Inhalt nach wie vor vollständig neu schreiben, aber die angepassten Elemente lassen sich möglicherweise leichter wiederverwenden.
  • Mit einem leeren Absatz beginnen. Mit einem leeren Absatz zu beginnen, kann in Fällen nützlich sein, in denen der alternative Inhalt mehr Arbeit als nur die Eingabe erfordert.

Sie können bei jedem Absatz schnell und unabhängig voneinander zwischen den verschiedenen Ansätzen wechseln, da jeder dieser Ansätze bei verschiedenen Arten von Inhalten am besten funktionieren kann. Wenn Sie zwischen den verschiedenen Ansätzen wechseln, bleiben die Änderungen, die Sie am Absatz vorgenommen haben, erhalten. Auf diese Weise können Sie einen anderen Ansatz ausprobieren, selbst wenn Sie mit der Bearbeitung des ursprünglichen Ansatzes begonnen haben, ohne die Angst haben zu müssen, Ihre Änderungen zu verlieren, wenn Sie sich schließlich entscheiden, zum ursprünglichen Ansatz zurückzukehren. In diesem Zusammenhang sind zwei zusätzliche Optionen relevant:

  • Die Option zum Zurücksetzen der Übersetzung steht zur Verfügung, wenn Sie Modifikationen am ursprünglich bereitgestellten Inhalt vorgenommen haben. Sie ermöglicht es, den ursprünglichen Inhalt wiederherzustellen, indem die von Ihnen vorgenommenen Änderungen verworfen werden.
  • Die Option Als Standard markieren ist verfügbar, wenn Sie einen Ansatz für einen Absatz wählen, der nicht der Standard ist. Sie ermöglicht es, den Standardansatz für die nächsten Absätze festzulegen, die der Übersetzung hinzugefügt werden. Dies kann sehr praktisch sein, wenn Sie festgestellt haben, dass ein bestimmter Übersetzungsdienst im Allgemeinen besser funktioniert als der Standarddienst.

Verfügbarkeit maschineller Übersetzungen

Die Inhaltsübersetzung integriert mehrere Übersetzungsdienste, und jeder Dienst unterstützt unterschiedliche Sprachen. Die unterstützten Dienste sind unten mit einem Link zu der Liste der von ihnen unterstützten Sprachen aufgeführt:

Die Liste der oben genannten Sprachen verweist auf den Konfigurationscode, um sicherzustellen, dass die Informationen mit der aktuellen Funktionsweise des Tools synchronisiert sind. The list show the language code for the source language at the initial indentation level and the codes of all the supported target languages below it.

Language enablement is done in a gradual way based on the observed results and the community feedback. It is possible that machine translation has not been enabled yet, even if they are supported by the underlying services.

Improving existing translation services

When you publish a translation with Content Translation you are already helping translation services to improve. All the corrections you make to the initial machine translations are exposed through an API and data dumps and can be potentially used to improve existing services. In addition to that, some of the translation services listed above provide specific ways you can contribute to their projects.

OpusMT

OpusMT is an open source neural machine translation system that is trained with multilingual documents freely licensed available online. This open corpus is used to train the translation system, and expanding the corpus will lead to better translations. The contents generated by using Content Translation are integrated automatically in the corpus, but you can contribute to expand the corpus further:

  • Propose new sources to be integrated in the open corpus. You can contact Jörg Tiedemann to propose a new data source to expand the corpus.
  • Submit documents directly (still a preliminary prototype). You can upload translated documents in various formats including translated webpages to be incorporated to the corpus.

OpusMT is based on MarianNMT which is also an open source project. People with technical knowledge and interested in machine learning can also contribute to improve it.

Apertium

Apertium is an open source rule-based translation system. You can contribute to the project by encoding the language rules of your language. This process requires both linguistic and advanced technical knowledge, but you can get support from the Apertium team to expand the translation support for a new language pair.

Google Translate

Google Translate is not an open source project, but there are still ways for users to contribute back:

Expanding the language support with new translation services

Content translation has been designed as an extensible platform. So it is possible to develop new clients to integrate additional translation services. Some considerations about the way translation services are integrated:

  • Machine translations and the user corrections made are publicly as part of the data on published translations, which can provide a useful resource to create or improve your translation service.
  • External services integrated only receive publicly available wiki content, and return a translated version of such content that is compatible with the licenses used in the wiki. No personal information is shared with the translation services.

Feedback on the support provided for each language is very useful. Please, let us know if you are missing support for some language, or whether higher quality options are available for it. You can provide such feedback on the project talk page or in this ticket.

Considerations on machine translation

Machine translation is far from perfect when intended as a final outcome. However, many users find it very useful as a starting point. Please make sure to review the content from these different perspectives:

  • Make sure the original meaning is preserved.
  • Check that there is no information missing, especially for elements such as links, references and templates that include information that is not always visible on the surface.
  • Read the translated content to make sure it reads natural as an independent page.

Limitations with complex elements

In some cases the content may not appear in the translation as expected:

  • Some of the services supported only work with plain text. This means that formatting and rich content elements such as links and citations from the original article are lost in the translation, and Content translation needs to guess where those belong in the translated text. Re-adding those elements is not always perfect and some elements may be in the wrong position or applied to the wrong part of the text.
  • Complex elements such as references or templates may use a different structure in each language, which makes it hard to transfer the content from one language into the other. Make sure to review the contents inside those elements to make sure there is no important information missing.

Enforcing the review of machine translation

Several automatic mechanisms exist to enforce the review of the initial contents. In this way, the tool makes sure that the initial automatic translation is reviewed enough before the contents get published.