Content translation/Machine Translation/MinT/fr

MinT (Machine in Translation) est un service de traduction basé sur des modèles de traduction automatique neuronale open source. Le service est hébergé dans l’infrastructure de la Wikimedia Foundation et fera partie de la liste des systèmes de traduction automatique (MT) disponibles pour les utilisateurs de Traduction de contenu et d’autres projets Wikimedia. Les traductions fournies sont basées sur des modèles de traduction NLLB-200 et OPUS qui ont été optimisés pour les performances à l’aide de la bibliothèque OpenNMT Ctranslate2 afin d’éviter le besoin d’accélération du processeur graphique. Pour plus de détails, vous pouvez consulter le code source, la spécification de l’API et une instance de test.



Caractéristiques principales

 * Aucune information personnelle non publique des utilisateurs n’est envoyée à MinT. Le système MT sera accessible via une API. Le contenu de l’article (en licence libre) est envoyé au serveur MinT et aucune communication directe n’a lieu entre l’utilisateur et les services externes et aucune information personnelle non publique des utilisateurs (adresse IP, nom d’utilisateur) n’est envoyée au service MinT. Le client contactant MinT est en source ouverte et vous pouvez le vérifier ici. Bien que le service MinT soit hébergé dans l’infrastructure Wikimedia, l’intégration suit le même schéma que les autres services externes (veuillez également consulter un schéma de cette configuration technique à la fin de la section).
 * Toute information protégée par le droit d’auteur est renvoyée par MinT sous une licence gratuite. Lorsque MinT est utilisée, une version traduite du contenu de Wikipedia est obtenue. Le « droit d’auteur » d’un tel contenu généré par une machine est une question juridique ouverte. Dans la mesure où les traductions MinT sont protégées par le droit d’auteur, ces traductions sont disponibles sous la même licence gratuite que le contenu de Wikipedia en cours de traduction. Les utilisateurs peuvent le modifier et le publier dans le cadre de Wikipedia sans entrer en conflit avec les politiques existantes. Le contenu résultant traduit par MinT et les modifications de l’utilisateur seront disponibles sous la même licence que celle utilisée pour le reste des articles de Wikipedia.
 * Profite à la communauté élargie des traducteurs open source. Les traductions obtenues auprès de MinT et les modifications des utilisateurs seront accessibles publiquement. Les traductions post-éditées présentent un intérêt particulier pour la communauté de recherche en traduction qui peut utiliser cette ressource pour créer de nouveaux services de traduction prenant en charge les langues pour lesquelles la traduction automatique open source n’est pas encore disponible. Cela aidera les développeurs à créer et à améliorer les systèmes de traduction automatique.
 * Les utilisateurs peuvent le désactiver. La traduction automatique est un outil optionnel dans la Traduction de contenu. Les utilisateurs ont la possibilité de le désactiver s’ils ne le trouvent pas utile pour une raison quelconque. Bien que de nombreux utilisateurs de Traduction de contenu ont demandé des services de traduction, chaque utilisateur décide finalement s’il souhaite les utiliser ou non.

center|500x500px



Questions relatives à ce service
Nous avons abordé quelques questions immédiates sur MinT dans cette section. Ceci est également disponible dans la page FAQ sur la traduction de contenu.



Quelles langues sont gérées par MinT ? Est-il prévu d’en ajouter de nouvelles ?
MinT est conçue pour héberger plusieurs modèles de traduction ouverts. Le nombre de langues prises en charge en dépendra. La liste des systèmes de traduction automatique (MT) disponibles comprendra la liste la plus à jour.



En quoi l’utilisation de MinT diffère-t-elle de Apertium et des autres services de traduction automatisés ?
As a user of Content Translation you will not feel any difference on the translation interface as MinT will display the translated content in the same way Apertium or other services currently do for the supported language pairs. Different services provide a different translation quality level depending on the language and the specific contents. You can try and change among the available services the one providing the best initial translation for a given paragraph.



Comment est réalisée la traduction si je choisis MinT ?
When a user starts translating an article, the HTML content of each section of the source article is sent to MinT. The MinT service processes the request and uses one of the translation models available based on the supported language and configuration. A translated version is obtained and displayed on the respective translation column of Content Translation. Links and references are adapted as usual and users can modify the content as required.

This process continues for all the sections of the article being translated. For better performance, the translations for consecutive sections are pre-fetched. The user can save the unpublished translation (to work on it again at a later time), revise, or publish the article in the usual manner. The article is published on Wikipedia like any other normal article with appropriate attribution and licenses.

Here’s a diagram of the process.



Est-ce que MinT est un logiciel libre ?
The MinT service is open source and it integrates models that are released as open source:


 * The AI research team at Meta released the translation models used by NLLB-200 with an open source license and the dataset used for training as part of the No Language Left Behind project.
 * The OPUS project provides pre-trained neural translation models trained on OPUS data with an open source license.

These models have been optimized for performance using OpenNMT Ctranslate2 library which is also an open source library.

Content Translation evolved from a long-standing need to bridge the gap in the amount of content between Wikipedias in different languages. Like all other software used on Wikimedia sites, Content Translation is also open source. In this particular case as well, we are using an open source client to interact with the external service and import freely licensed content in order to help users expand our free knowledge. To use MinT we are not adding any proprietary software in the Content Translation code, or on the Wikimedia websites and servers.



Dois-je m'inquiéter au sujet de mes données personnelles quand j'utilise MinT ?
Irrespective of the service being used, you can be sure that only Wikipedia content from existing articles is sent and only freely licensed content will be added back to the translation. Communication with those services happens at the server side, so they are isolated from the user device and they have no access to nonpublic personal information of users. Please refer to this diagram for more details.



Que faire si MinT est le seul outil de traduction automatique disponible et que je ne veux pas l'utiliser ?
Machine Translation is an optional feature in Content Translation that you can easily disable at will. If more machine translation systems are added for your languages, you can choose to enable MT again and select the MT service of your choice.



Le texte traduit avec MinT sera-t-il de libre d'utilisation dans Wikipédia ?
Yes. The content received from MinT is otherwise freely available on the web translation platform. For ease of use Content Translation receives it via an API to make it seamlessly available on the translation interface. This content can be modified by the users (if necessary) and used in Wikipedia articles under free licenses.



Est-ce que ce contenu peut être utilisé pour améliorer les systèmes de traduction automatique en général ?
Yes. Translations made in Content Translation are saved in our database. This information will be made publicly available for anyone to use as translation examples to improve their translation services (from University research groups, open source projects to commercial companies, anyone!). The content can be accessed via the Content Translation API. Please note, only information related to translated text is publicly available. This includes – source and translated text, source and target language information and an identifier for the segment of text.