Content translation/Machine Translation/Yandex/nl

Sinds 4 november 2015 is het Yandex machinevertalingssysteem beschikbaar voor gebruikers van Content Translation. Vanwege de populariteit onder Russische Wikipedia-gebruikers, opname van de service Yandex.Translate was dit een gevraagde functie. Aanvankelijk werd het geïntroduceerd voor het vertalen van Wikipedia-pagina's van het Engels naar het Russisch. De service is nu echter uitgebreid voor alle talen die via Yandex worden geleverd.

Yandex.Translate wordt geleverd door Yandex – een Russisch internetbedrijf. Sinds eind 2014 hebben het juridische team van de Wikimedia Foundation en Yandex samengewerkt om een overeenkomst uit te werken die het gebruik van Yandex.Translate mogelijk maakt zonder het beleid van Wikipedia van toewijzing van rechten, privacy van onze gebruikers en merkvertegenwoordiging in gevaar te brengen. De voorwaarden van de overeenkomst staan hieronder en we horen graag eventuele vragen die u hierover heeft service.



Belangrijkste functies

 * Er wordt geen persoonlijke informatie naar Yandex verzonden. Het MT-systeem wordt benaderd via een openbaar beschikbare API met behulp van een sleutel. Artikelinhoud (met vrije licentie) wordt vanaf de servers van de Wikimedia Foundation naar Yandex-servers verzonden. Er vindt geen directe communicatie plaats tussen de gebruiker en externe diensten en er wordt geen persoonlijke informatie (IP, gebruikersnaam) naar yandex-servers verzonden. De client die contact opneemt met Yandex-servers is open source en u kunt het hier controleren. Geen enkel deel van Yandex's service of code zal deel uitmaken van de Wikimedia-infrastructuur of de codebase voor het vertalen van inhoud


 * Informatie wordt geretourneerd door Yandex onder een vrije licentie. Wanneer de Yandex-service wordt gebruikt, bieden ze een vertaalde versie van Wikipedia-inhoud onder een vrije licentie. Gebruikers kunnen het wijzigen en publiceren als onderdeel van Wikipedia zonder conflicten met bestaand beleid. De resulterende inhoud vertaald door Yandex en de gebruikerswijzigingen zullen beschikbaar zijn onder dezelfde licentie die wordt gebruikt voor de rest van de artikelen in Wikipedia.


 * Voordelen voor de bredere open source vertaalgemeenschap. Vertalingen verkregen van Yandex en gebruikerswijzigingen zullen openbaar beschikbaar zijn. De nabewerkte vertalingen zijn van bijzonder belang voor de vertaalonderzoeksgemeenschap die deze bron kan gebruiken om nieuwe vertaaldiensten te creëren ter ondersteuning van talen waarvoor open source machinevertaling nog niet beschikbaar is. Dit zal ontwikkelaars helpen bij het maken en verbeteren van machinevertalingssystemen.


 * Gebruikers kunnen het uitschakelen. Automatische vertaling is een optioneel hulpmiddel in Content Translation. Gebruikers hebben een optie om het uit te schakelen als ze het om de een of andere reden niet nuttig vinden. Hoewel veel gebruikers uit de Russische gemeenschap om deze service hebben gevraagd, beslist elke individuele gebruiker uiteindelijk of ze deze willen gebruiken of niet.



Samenvatting van de voorwaarden van de Yandex-overeenkomst


Verplichtingen van Yandex

 * Om hun Yandex.Translate API-sleutel gratis in licentie te geven aan de Wikimedia Foundation om vrijwilligers op Wikimedia-sites in staat te stellen artikelen te vertalen
 * Om vrijwilligers in staat te stellen tot tien miljoen tekens per dag te vertalen (veel meer dan hun openbaar beschikbare optie)
 * Om Wikimedia statistische gegevens te geven over het aantal tekens in de verzonden verzoeken



Verplichtingen van de Wikimedia Foundation

 * Om de door vrijwilligers geredigeerde versies van de door de vertaaltool vertaalde tekst te leveren, zodat Yandex hun tool kan verbeteren
 * Er worden geen persoonsgegevens van vertalers gedeeld.
 * Nu worden alleen de originele inhoud om te vertalen, de taal en de doeltaal van de vertaling in het verzoek naar Yandex verzonden.
 * De vertalingen die door vertalers worden gepubliceerd, met of zonder de hulp van machinevertalingsdiensten, worden geleverd in de vorm van parallel corpora door de API's voor inhoudsvertaling. Deze API's zullen stapsgewijs worden ontwikkeld en de resultaten zullen vrij beschikbaar zijn voor iedereen, niet alleen voor Yandex.



Belangrijke punten

 * All content will remain licensed under CC BY-SA 3.0
 * Yandex is not requiring any "branding" on Wikimedia Sites outside of listing Yandex.Translate as a translation tool option in the translation interface drop-down menu
 * There is no exchange of personal information of volunteers
 * The agreement is limited to 1 year, at which time we can reevaluate our needs
 * We are free to terminate the agreement for any reason, at any time (with 30 days notice)
 * Agreement is governed by US law

Questions about this service
We have addressed some immediate questions about Yandex in this section. This is also available in the Content Translation FAQ page.

What languages are being handled by Yandex? Are there plans to add more?
Yandex is available at present for more than 70 languages. As Yandex’s language coverage expands we will consider enabling them for Content Translation. Please note: Yandex machine translation will not be available when creating pages into English.

How is using Yandex different than using any other machine translation system?
As a user of Content Translation you will not feel any difference on the translation interface as the machine translation system of Yandex will display the translated content in the same way Apertium currently does for the supported 45 language pairs.

How is the machine translation being done if I choose Yandex?
Yandex provides a free for use API key that allows websites and other services to use their translation system. Content Translation also uses a unique API key to access this service on Yandex's server. When a user starts translating an article, the HTML content of each section of the source article is sent to the Yandex server and a translated version is obtained and displayed on the respective translation column of Content Translation. Links and references are adapted as usual and users can modify the content as required.

This process continues for all the sections of the article being translated. For better performance, the translations for consecutive sections are pre-fetched. The user can save the unpublished translation (to work on it again at a later time) or publish the article in the usual manner. The article is published on Wikipedia like any other normal article with appropriate attribution and licenses.

You can view a diagram of the process.

Yandex is not based on open source software. Why are we using it?
Content Translation evolved from a long-standing need to bridge the gap in the amount of content between Wikipedias in different languages. Like all other software used on Wikimedia sites, Content Translation is also open source. In this particular case as well, we are using an open source client to interact with the external service and import freely licensed content in order to help users expand our free knowledge.

To use Yandex's machine translation system we are not adding any proprietary software in the Content Translation code, or on the Wikimedia websites and servers. The service is free of charge and available for everyone.

Only the freely available Wikipedia article content (in segments) is sent to the Yandex service and the obtained translated content is freely usable on Wikipedia pages. The translated content can be modified by users and this data is also available publicly under a free license through the Content Translation API. This is a valuable resource made available for the community to develop open source translation services for those languages where they don't exist yet.

After studying the implications carefully, we found the fact that the content was stored previously in a closed source service does not limit the freedom of our knowledge or our software in the present or the future. We have taken special care to make sure that the content provided is freely licensed to make sure it complies with Wikipedia policies. This includes a long process for legal and technical evaluation and compliance. The summary of the terms of use is also available.

From user feedback we have seen that machine translation support is really helpful for users and we want to support all languages in the best way. Guided by the principles of Wikimedia Foundation's resolution to support free and open source software, we will prioritise the integration of open source services whenever they are available for a language. Apertium has been a critical part of Content Translation since its inception, but currently it only provides machine translations for 45 of the numerous possible language combination that Wikipedia can support.

Should I be worried about my personal information when using Yandex?
Irrespective of the service being used, you can be sure that only Wikipedia content from existing articles is sent and only freely licensed content will be added back to the translation. No personal information is sent and communication with those services happen at the server side, so they are isolated from the user device. Please refer to this diagram for more details.

What if Yandex is the only machine translation tool available and I don't want to use it?
Machine Translation is an optional feature in Content Translation that you can easily disable at will. If more machine translation systems are added for your languages, you can choose to enable MT again and select the MT service of your choice.

Will the content translated by Yandex be free for use in Wikipedia?
Yes. The content received from Yandex is otherwise freely available on the Yandex web translation platform. Content Translation receives it via an API key to make it seamlessly available on the translation interface. This content can be modified by the users (if necessary) and used in Wikipedia articles under free licenses.

Can this content be used for improving machine translation systems in general?
Yes. Translations made in Content Translation are saved in our database. This information will be made publicly available for anyone to use as translation examples to improve their translation services (from University research groups, open source projects to commercial companies, anyone!). The content can be accessed via the Content Translation API. Please note, only information related to translated text is publicly available. This includes – source and translated text, source and target language information and an identifier for the segment of text.