Traducción de contenidos/Traducción automática/Matxin

From mediawiki.org
Jump to navigation Jump to search
This page is a translated version of the page Content translation/Machine Translation/Matxin and the translation is 53% complete.

La compatibilidad con la traducción automática para la traducción de contenidos se ha ampliado aún más. Además de Apertium, Yandex y Youdao, ahora añadimos Matxin a la lista de sistemas de traducción automática (TA) disponibles para los usuarios de Content Translation. Esto dará lugar a un soporte adicional de traducción automática para algunos idiomas.

Matxin está a cargo de un equipo de la Universidad del País Vasco, en colaboración con la Fundación Elhuyar. Este sistema de traducción automática fue creado por este equipo principalmente para su propio uso en la redacción de artículos de Wikipedia en euskera y español. Varios equipos dentro de la Fundación Wikimedia han colaborado con el equipo de Matxin para elaborar un acuerdo que permita el uso de Matxin sin comprometer la política de atribución de derechos de Wikipedia, la privacidad de nuestros usuarios y la representación de la marca. Matxin es un software de código abierto. Para facilitar el uso, estamos utilizando la API de traducción automática, más conveniente, para acceder al servicio alojado por el equipo. A continuación encontrará más detalles del acuerdo y estaremos encantados de escuchar cualquier pregunta que pueda tener sobre este servicio.

Características principales

  • No se envía información personal a Matxin. Se accederá al sistema MT a través de una clave API. El contenido de los artículos (con licencia libre) se envía al servidor Matxin desde los servidores de la Fundación Wikimedia. No hay comunicación directa entre el usuario y los servicios externos y no se envía ninguna información personal (IP, nombre de usuario) al servicio Matxin. El cliente que contacta con Matxin es de código abierto y puedes comprobarlo aquí. Ninguna parte del servicio o código de Matxin formará parte de la infraestructura de Wikimedia o de la base de código de la Traducción de Contenidos. Al final de la sección también se puede ver un diagrama de esta configuración técnica.
  • La información se devuelve desde Matxin bajo una licencia libre. Cuando se utiliza Matxin, se obtiene una versión traducida del contenido de Wikipedia bajo licencia libre. Los usuarios pueden modificarlo y publicarlo como parte de la Wikipedia sin crear conflictos con las políticas existentes. El contenido resultante traducido por Matxin y las modificaciones de los usuarios estarán disponibles bajo la misma licencia que se utiliza para el resto de los artículos de Wikipedia.
  • Beneficia a la comunidad de traductores de código abierto en general. Las traducciones obtenidas de Matxin y las modificaciones de los usuarios estarán disponibles públicamente. Las traducciones post-editadas son de especial interés para la comunidad de investigadores de la traducción (incluido el equipo de Matxin), que pueden utilizar este recurso para crear nuevos servicios de traducción que den soporte a los idiomas para los que aún no está disponible la traducción automática de código abierto. Esto ayudará a los desarrolladores a crear y mejorar los sistemas de traducción automática.
  • Los usuarios pueden desactivarla. La traducción automática es una herramienta opcional en la Traducción de Contenidos. Los usuarios tienen la opción de desactivarla si no la encuentran útil por alguna razón. Aunque muchos usuarios de Content Translation han solicitado este servicio de traducción, cada usuario individual decide finalmente si desea utilizarlo o no.

Cx-mt.png

Resumen de nuestro acuerdo con Matxin

Las obligaciones de Matxin

  • Permitir el uso gratuito de su clave API de traducción automática a la Fundación Wikimedia para que los voluntarios de los sitios de Wikimedia puedan traducir artículos y apoyar al menos 10 millones de caracteres de contenido de traducción al día.

Obligaciones de la Fundación Wikimedia

  • Proporcionar las versiones editadas por voluntarios del texto traducido por la herramienta de traducción para que Matxin pueda mejorar su herramienta.
  • No se compartirán los datos personales de los traductores.
  • Solo el contenido original a traducir, su idioma, y el idioma de destino de la traducción serán enviados en la solicitud a Matxin.
  • Las traducciones publicadas por los traductores, con o sin ayuda de los servicios de traducción automática, serán proporcionadas en forma de texto paralelo por las API de traducción de contenidos. Estas API se desarrollarán de forma incremental y los resultados estarán disponibles de forma gratuita para todos, no solo para Matxin.

Notas importantes

  • Todo el contenido permanecerá bajo licencia CC BY-SA 3.0
  • Matxin no requiere ninguna "marca" en los sitios de Wikimedia, aparte de la inclusión de Matxin como opción de herramienta de traducción en el menú desplegable de la interfaz de traducción.
  • No hay intercambio de información personal de los voluntarios.
  • El acuerdo está limitado a 1 año, momento en el que podemos reevaluar nuestras necesidades.
  • Somos libres de rescindir el contrato por cualquier motivo, en cualquier momento (con 30 días de preaviso).
  • El acuerdo se rige por la legislación estadounidense.

Preguntas sobre este servicio

We have addressed some immediate questions about Matxin in this section. This is also available in the Content Translation FAQ page.

What languages are being handled by Matxin? Are there plans to add more?

Matxin can be used to translate from Spanish to Basque. As more languages are added to the service by the developers of the Matxin team, we will include them.

How is using Matxin different than using other machine translation services?

As a user of Content Translation you will not feel any difference on the translation interface as Matxin will display the translated content in the same way other services currently do for the supported language pairs.

How is the machine translation being done if I choose Matxin?

Matxin provides an API key that allows websites and other services to use their translation system. Content Translation also uses that unique API key to access Matxin. When a user starts translating an article, the HTML content of each section of the source article is sent to Matxin and a translated version is obtained and displayed on the respective translation column of Content Translation. Links and references are adapted as usual and users can modify the content as required.

This process continues for all the sections of the article being translated. For better performance, the translations for consecutive sections are pre-fetched. The user can save the unpublished translation (to work on it again at a later time) or publish the article in the usual manner. The article is published on Wikipedia like any other normal article with appropriate attribution and licenses.

Is Matxin based on open source software?

Yes! It is an open source software, similar to Apertium. It has been developed by a small team from the University of Basque country who developed this tool for their own need to translate Wikipedia articles. They are very much part of the Wikimedia community and we are happy to partner with them.

Should I be worried about my personal information when using Matxin?

Irrespective of the service being used, you can be assured that only Wikipedia content from existing articles is sent and only freely licensed content will be added back to the translation. No personal information is sent and communication with those services happen at the server side, so they are isolated from the user device. Please refer to this diagram for more details.

What if Matxin is the only machine translation tool available and I don't want to use it?

Machine Translation is an optional feature in Content Translation that you can easily disable at will. If more machine translation systems are added for your languages, you can choose to enable MT again and select the MT service of your choice.

Will the content translated by Matxin be free for use in Wikipedia?

Yes. The content received from Matxin is otherwise freely available on the web translation platform. It is an open source software. For ease of use Content Translation receives it via an API key to make it seamlessly available on the translation interface. This content can be modified by the users (if necessary) and used in Wikipedia articles under free licenses.

Can this content be used for improving machine translation systems in general?

Yes. Translations made in Content Translation are saved in our database. This information will be made publicly available for anyone to use as translation examples to improve their translation services (from University research groups, open source projects to commercial companies, anyone!). The content can be accessed via the Content Translation API. Please note, only information related to translated text is publicly available. This includes – source and translated text, source and target language information and an identifier for the segment of text.