Content translation/Machine Translation/MinT/de

MinT (Machine in Translation) ist ein Übersetzungsdienst, der auf quelloffenen neuronalen maschinellen Übersetzungsmodellen basiert. Der Dienst wird in der Infrastruktur der Wikimedia Foundation gehostet und wird Teil der Liste der maschinellen Übersetzungssysteme (MT) sein, die den Nutzern von Content Translation und anderen Wikimedia-Projekten zur Verfügung stehen. Die bereitgestellten Übersetzungen basieren auf NLLB-200 und OPUS Übersetzungsmodellen, die mit Hilfe der OpenNMT Ctranslate2 Bibliothek auf Leistung optimiert wurden, um die Notwendigkeit von GPU-Beschleunigung zu vermeiden. Für weitere Details kannst du den Quellcode, die API-Spezifikationen und eine Testinstanz lesen.



Hauptfunktionen

 * Es werden keine nicht-öffentlichen persönlichen Informationen der Nutzer an MinT gesendet. Der Zugriff auf das MT-System erfolgt über eine API. Der Inhalt der Artikel (frei lizenziert) wird an den MinT-Server gesendet, und es findet keine direkte Kommunikation zwischen dem Nutzer und externen Diensten statt, und es werden keine nicht-öffentlichen persönlichen Informationen der Nutzer (IP, Benutzername) an den MinT-Dienst gesendet. Der Client, der MinT kontaktiert, ist Open Source und du kannst ihn hier überprüfen. Obwohl der MinT-Dienst in der Wikimedia-Infrastruktur gehostet wird, folgt die Integration demselben Muster wie bei anderen externen Diensten (siehe auch das Diagramm dieses technischen Aufbaus am Ende des Abschnitts).
 * Alle urheberrechtsfähigen Informationen werden von MinT unter einer freien Lizenz zurückgegeben. Wenn MinT verwendet wird, erhält man eine übersetzte Version des Wikipedia-Inhalts. Die Urheberrechtsfähigkeit solcher maschinell erzeugter Inhalte ist eine offene rechtliche Frage. Soweit MinT-Übersetzungen urheberrechtsfähig sind, stehen diese Übersetzungen unter der gleichen freien Lizenz zur Verfügung wie der übersetzte Wikipedia-Inhalt. Benutzer können es ändern und als Teil von Wikipedia veröffentlichen, ohne dass Konflikte mit vorhandenen Regeln auftreten. Der resultierende Inhalt, der von MinT übersetzt wurde, und die Benutzeränderungen werden unter derselben Lizenz zur Verfügung gestellt, die auch für die übrigen Artikel in Wikipedia verwendet wird.
 * Nutzen für die breitere Open-Source-Übersetzungsgemeinschaft. Die aus MinT gewonnenen Übersetzungen und die Änderungen der Nutzer werden öffentlich zugänglich sein. Die nachbearbeiteten Übersetzungen sind von besonderem Interesse für die Übersetzungsforschungsgemeinschaft, die diese Ressource nutzen kann, um neue Übersetzungsdienste für Sprachen zu erstellen, für die es noch keine Open-Source-Maschinenübersetzung gibt. Dies wird Entwicklern helfen, maschinelle Übersetzungssysteme zu erstellen und zu verbessern.
 * Benutzer können sie deaktivieren. Die automatische Übersetzung ist ein optionales Tool in Content Translation. Die Benutzer haben die Möglichkeit, sie zu deaktivieren, wenn sie sie aus irgendeinem Grund nicht nützlich finden. Obwohl viele Nutzer von Content Translation Übersetzungsdienste angefordert haben, entscheidet letztendlich jeder einzelne Nutzer, ob er sie nutzen möchte oder nicht.

center|500x500px



Fragen zu diesem Dienst
Wir haben in diesem Abschnitt einige Fragen direkt zu MinT behandelt. Du findest sie auch auf der Seite Content Translation FAQ.

What languages are being handled by MinT? Are there plans to add more?
MinT is designed to host multiple open translation models. The number of languages supported will depend on them. The list of machine translation (MT) systems available will include the most up-to-date list.

How is using MinT different than using Apertium or others?
As a user of Content Translation you will not feel any difference on the translation interface as MinT will display the translated content in the same way Apertium or other services currently do for the supported language pairs. Different services provide a different translation quality level depending on the language and the specific contents. You can try and change among the available services the one providing the best initial translation for a given paragraph.

How is the machine translation being done if I choose MinT?
When a user starts translating an article, the HTML content of each section of the source article is sent to MinT. The MinT service processes the request and uses one of the translation models available based on the supported language and configuration. A translated version is obtained and displayed on the respective translation column of Content Translation. Links and references are adapted as usual and users can modify the content as required.

This process continues for all the sections of the article being translated. For better performance, the translations for consecutive sections are pre-fetched. The user can save the unpublished translation (to work on it again at a later time), revise, or publish the article in the usual manner. The article is published on Wikipedia like any other normal article with appropriate attribution and licenses.

Here’s a diagram of the process.

Is MinT based on open source software?
The MinT service is open source and it integrates models that are released as open source:


 * The AI research team at Meta released the translation models used by NLLB-200 with an open source license and the dataset used for training as part of the No Language Left Behind project.
 * The OPUS project provides pre-trained neural translation models trained on OPUS data with an open source license.

These models have been optimized for performance using OpenNMT Ctranslate2 library which is also an open source library.

Content Translation evolved from a long-standing need to bridge the gap in the amount of content between Wikipedias in different languages. Like all other software used on Wikimedia sites, Content Translation is also open source. In this particular case as well, we are using an open source client to interact with the external service and import freely licensed content in order to help users expand our free knowledge. To use MinT we are not adding any proprietary software in the Content Translation code, or on the Wikimedia websites and servers.

Should I be worried about my personal information when using MinT?
Irrespective of the service being used, you can be sure that only Wikipedia content from existing articles is sent and only freely licensed content will be added back to the translation. Communication with those services happens at the server side, so they are isolated from the user device and they have no access to nonpublic personal information of users. Please refer to this diagram for more details.

What if MinT is the only machine translation tool available and I don't want to use it?
Machine Translation is an optional feature in Content Translation that you can easily disable at will. If more machine translation systems are added for your languages, you can choose to enable MT again and select the MT service of your choice.

Will the content translated by MinT be free for use in Wikipedia?
Yes. The content received from MinT is otherwise freely available on the web translation platform. For ease of use Content Translation receives it via an API to make it seamlessly available on the translation interface. This content can be modified by the users (if necessary) and used in Wikipedia articles under free licenses.

Can this content be used for improving machine translation systems in general?
Yes. Translations made in Content Translation are saved in our database. This information will be made publicly available for anyone to use as translation examples to improve their translation services (from University research groups, open source projects to commercial companies, anyone!). The content can be accessed via the Content Translation API. Please note, only information related to translated text is publicly available. This includes – source and translated text, source and target language information and an identifier for the segment of text.