Content translation/Machine Translation/Youdao/de

Maschinenübersetzungsunterstützung in der Inhaltsübersetzung wurde jetzt erweitert. Zusätzlich zu Apertium und Yandex wird für Übersetzungen zwischen Chinesisch und Englisch, Französisch, Japanisch, Koreanisch, Portugiesisch, Russisch und Spanisch auch das Youdao-Maschinenübersetzungssystem angeboten. Vom 31. Oktober 2016 an ist das Youdao-Maschinenübersetzungssystem verfügbar und kann bei folgenden Sprachen bei der Übersetzung von Wikipedia-Seiten mittels Inhaltsübersetzung verwendet werden:

Youdao wird von NetEase angeboten, einer Internet-Dienstleistungsfirma aus China. Die Rechtsarbeitsgruppe der Wikimedia-Stiftung und NetEase erarbeiteten gemeinsam eine Übereinkunft, die die Nutzung von Youdao erlaubt, ohne Wikipedias Richtlinie für Namensnennungsrechte, Privatsphärenschutz für unsere Nutzer und Markendarstellung zu untergraben. Die Zusammenfassung der Bedingungen der Vereinbarung finden sich unten und wir freuen uns über eventuelle Fragen zu diesem Dienst. Dies wurde auch von der chinesischen Wikipedia-Gemeinschaft unterstützt. Wikimedia Foundation's Legal team and NetEase collaborated to work out an agreement that will allow the use of Youdao without compromising Wikipedia's policy of attribution of rights, privacy of our users and brand representation. The summary of terms of the agreement are below and we are happy to hear any questions you may have about this service. This has also been supported by the Chinese Wikipedia community.

Hauptfunktionen
The MT system will be accessed via a publicly accessible API key (contents of the linked page are written in Chinese). Article content (freely licensed) is sent to Youdao servers from Wikimedia Foundation servers. No direct communication is happening between the user and external services and no personal information (IP, username) is sent to Youdao’s servers along with the Wikipedia content. The client contacting Youdao servers is open source and you can check it here. No part of Youdao's service or code will be part of Wikimedia infrastructure or Content Translation codebase
 * Youdao sammelt keine persönlichen Informationen.: Auf das Maschinenübersetzungssystem wird unter Verwendung eines öffentlich zugänglichen API-Schlüssels zugegriffen. (Inhalte auf der verknüpften Seite ist in chinesischer Schrift.) (Frei lizenzierte) Artikelinhalte werden von Servern der Wikimedia-Stiftung zu den Youdao-Servern übertragen. Es findet keine direkte Kommunikation zwischen dem Benutzer und externen Diensten statt und es werden mit den Wikipedia-Inhalten keine persönlichen Informationen (IP, Benutzername) an Youdaos Server übertragen. Der Client für den Kontakt zu den Youdao-Servern ist quelloffen und kann hier eingesehen werden. Kein Teil von Youdaos Dienst oder Code wird Teil der Wikimedia-Infrastruktur oder Inhaltsübersetzungscode.
 * Von Youdao zurückübertragene Informationen stehen weiterhin unter freier Lizenz.: Bei der Nutzung von Youdaos Dienst gibt dieser eine übersetzte Version von Wikipedia-Inhalten aus, der weiterhin seiner freien Lizenz unterliegt. Benutzer können diese ohne Konflikte mit bestehenden Richtlinien verändern und als Teil von Wikipedia veröffentlichen. Die resultierenden Inhalte werden nach der Übersetzung von Youdao und den Benutzerbearbeitungen der selben Lizenz unterstehen wie die übrigen Artikel in Wikipedia.
 * Nutzt der weiteren Gemeinschaft rund um freie Übersetzungs-Software.: Von Youdao erhaltene Übersetzungen und Benutzerbearbeitungen werden öffentlich zugänglich gemacht. Die nachbearbeiteten Übersetzungen sind von besonderem Interesse für die Übersetzungsforschung, wo diese Ressource für die Erstellung neuer Übersetzungsdienste genutzt werden kann, für die noch keine freie Übersetzungs-Software verfügbar ist. Es hilft Entwicklern bei der Schaffung und Verbesserung von Maschinenübersetzungssystemen.
 * Automatische Übersetzung ist ein optionales Werkzeug innerhalb der Inhaltsübersetzung.: Benutzer können sie deaktivieren, wenn sie sie je nicht nützlich finden. Die Einstellungen ermöglichen Benutzern die Entscheidung für oder gegen die Benutzung dieses oder anderer für ihre Sprache verfügbarer oder garkeiner Maschinenübersetzungsdienste.



Bekannte Probleme
Youdaos Maschinenübersetzungsdienst übersetzt keinen formatierten Text wie HTML. Es nimmt nur einfache Textinhalte an und gibt eine Übersetzung als einfachen Text zurück. Das Inhaltsübersetzungswerkzeug fügt dieser Ausgabe gewöhnlich nachher wieder Textauszeichnungen hinzu, was jedoch für Chinesisch wegen komplizierter Tokenisierung von Sätzen zu Worten nicht möglich ist. Daher werden Übersetzer die Übersetzung nur als einfachen Text erhalten und müssen alle Verweise, Belege etc. bei der Übersetzunge von Hand erneut hinzufügen.

Youdaos Verpflichtungen

 * Freie Lizenzierung ihres API-Schlüssels an die Wikimedia-Stiftung, um Freiwilligen auf Wikimedia-Sites die Übersetzung von Artikeln zu ermöglichen
 * Freiwilligen pro Anfrage bis zu viertausend Zeichen und bis zu zehn Millionen Zeichen am Tag zu erlauben (weit mehr als ihre öffentlich zugängliche Option)
 * Wikimedia statistische Daten zur Anzahhl der gesendeten Zeichen und Anfragen zu geben

Verpflichtungen der Wikimedia-Stiftung

 * Zur Verfügung stellen der benutzerüberarbeiteten Versionen, damit Youdao sein Werkzeug verbessern kann.
 * Es werden keine persönlichen Daten der Übersetzer weitergegeben.
 * Derzeit werden in der Anfrage an Youdao nur der zu übersetzende ursprüngliche Inhalt, seine Sprache und die Zielsprache übertragen.
 * Die von Übersetzern veröffentlichten Übersetzungen, ob mit oder ohne maschinelle Unterstützung erstellt, werden von Inhaltsübersetzungs-APIs in Form paralleler Korpora zugänglich gemacht. Diese APIs werden schrittweise weiterentwickelt und die Ergebnisse werden der Allgemeinheit frei zugänglich sein, nicht nur Youdao,

Wichtige Anmerkungen

 * Sämtliche Inhalte unterliegen weiterhin CC by-sa 3.0
 * Youdao fordert keinerlei Eigenwerbung auf Wikimedia-Sites außer der Auflistung von Youdao als einen angebotenen Übersetzungsdienst im Aufklappmenü der Übersetzungsoberfläche.
 * Es findet keinerlei Austausch persönlicher Informationen von Benutzern statt.
 * Die Übereinkunft ist auf ein Jahr befristet und kann dann unseren Bedürfnissen angepasst werden.
 * Wir dürfen die Übereinkunft jederzeit (mit 30 Tagen Ankündigungsfrist) aus jeglichen Gründen beenden.
 * Die Übereinkunft unterliegt US-amerikanischem Recht.

Fragen zu diesem Dienst
Wir haben in diesem Abschnitt einige Fragen direkt zu Youdao behandelt. Weitere Informationen sind auch auf der Inhaltsübersetzungs-FAQ-Seite verfügbar.

What languages are being handled by Youdao? Are there plans to add more?
Youdao is available at present only for translations Chinese, and English, French, Japanese, Korean, Portuguese, Russian and Spanish, for users who will be creating pages through Content Translation. As Youdao’s language coverage expands we will consider enabling them for Content Translation. Please note: Youdao machine translation will not be available when creating pages from Chinese to English.

How is using Youdao different than using other machine translation systems?
As a user of Content Translation you will not feel any difference on the translation interface as the machine translation system of Youdao will display the translated content similar to Apertium or Yandex. However, due to Youdao's current limitation of not supporting rich text, links, references etc. will have to be adapted manually.

How is the machine translation being done if I choose Youdao?
Youdao provides a free for use API key that allows websites and other services to use their translation system. Content Translation also uses a unique API key to access this service on Youdao's server. When a user starts translating an article, the HTML content of each section of the source article is sent to the Youdao server and a translated version is obtained and displayed on the respective translation column of Content Translation. Links and references are adapted as usual and users can modify the content as required.

This process continues for all the sections of the article being translated. For better performance, the translations for consecutive sections are pre-fetched. The user can save the unpublished translation (to work on it again at a later time) or publish the article in the usual manner. The article is published on Wikipedia like any other normal article with appropriate attribution and licenses.

You can view a diagram of the process.

Youdao is not based on open source software. Why are we using it?
Content Translation evolved from a long-standing need to bridge the gap in the amount of content between Wikipedias in different languages. Like all other software used on Wikimedia sites, Content Translation is also open source. In this particular case as well, we are using an open source client to interact with the external service and import freely licensed content in order to help users expand our free knowledge.

Similar to Yandex, with Youdao's machine translation system we are not adding any proprietary software in the Content Translation code, or on the Wikimedia websites and servers. The service is free of charge and available for everyone.

Only the freely available Wikipedia article content (in segments) is sent to the Youdao service and the obtained translated content is also freely usable on Wikipedia pages. The translated content can be modified by users and this data also maintains its free license and is available publicly through the Content Translation API. This is a valuable resource made available for the community to develop open source translation services for those languages where they don't exist yet.

After studying the implications carefully, we found the fact that the content was stored previously in a closed source service does not limit the freedom of our knowledge or our software in the present or the future. We have taken special care to make sure that the content translated maintained its free license to make sure it complies with Wikipedia policies. This includes a long process for legal and technical evaluation and compliance. The summary of the terms of use is also available.

From user feedback we have seen that machine translation support is really helpful for users and we want to support all languages in the best way. Guided by the principles of Wikimedia Foundation's resolution to support free and open source software, we will prioritise the integration of open source services whenever they are available for a language. Apertium has been a critical part of Content Translation since its inception, and currently provides machine translations for nearly 70 of the numerous possible language combination that Wikipedia can support. Adding Yandex in November 2015 has helped a large group of users of nearly 70 more languages, who were unable to use this facility before with Content Translation.

Should I be worried about my personal information when using Youdao?
Irrespective of the service being used, you can be assured that only Wikipedia content from existing articles is sent and only freely licensed content will be added back to the translation. No personal information is collected and communication with those services happen at the server side, so they are isolated from the user device. Please refer to this diagram for more details.

What if Youdao is the only machine translation tool available and I don't want to use it?
Machine Translation is an optional feature in Content Translation that you can easily disable at will. If more machine translation systems are added for your languages, you can choose to enable MT again and select the MT service of your choice.

Will the content translated by Youdao be free for use in Wikipedia?
Yes. The Wikipedia content translated from Youdao is otherwise freely available on the Youdao web translation platform. Content Translation receives it via an API key to make it seamlessly available on the translation interface. This content can be modified by the users (if necessary) and used in other Wikipedia articles under free licenses.

Can this content be used for improving machine translation systems in general?
Yes. Translations made in Content Translation are saved in our database. This information will be made publicly available for anyone to use as translation examples to improve their translation services (from University research groups, open source projects to commercial companies, anyone!). The content can be accessed via the Content Translation API. Please note, only information related to translated text is publicly available. This includes – source and translated text, source and target language information and an identifier for the segment of text.