Content translation/Machine Translation/MinT/it

MinT (Machine in Translation) è un servizio di traduzione basato su modelli di traduzione automatica neurale open source. Il servizio è ospitato nell'infrastruttura della Wikimedia Foundation e farà parte dell'elenco dei sistemi di traduzione automatica (MT) disponibili per gli utenti di Content Translation e di altri progetti Wikimedia. Le traduzioni fornite si basano sui modelli di traduzione NLLB-200 e OPUS che sono stati ottimizzati per le prestazioni utilizzando la libreria OpenNMT Ctranslate2 al fine di evitare la necessità di accelerazione GPU. Per maggiori dettagli puoi consultare il codice sorgente, le [$specifiche API] e un'istanza di test.



Caratteristiche principali

 * Nessuna informazione personale non pubblica degli utenti viene inviata a MinT. L'accesso al sistema MT avviene tramite un'API. Il contenuto dell'articolo (con licenza libera) viene inviato al server MinT e non avviene alcuna comunicazione diretta tra l'utente e i servizi esterni e nessuna informazione personale non pubblica degli utenti (IP, nome utente) viene inviata al servizio MinT. Il client che contatta MinT è open source e può essere controllato qui. Sebbene il servizio MinT sia ospitato nell'infrastruttura Wikimedia, l'integrazione segue lo stesso schema di altri servizi esterni (si veda anche un diagramma di questa configurazione tecnica alla fine della sezione).
 * Tutte le informazioni soggette a copyright vengono restituite da MinT con licenza libera. Quando si usa MinT, si ottiene una versione tradotta dei contenuti di Wikipedia. La possibilità di assoggettare a copyright i contenuti generati da una macchina è una questione legale aperta. Sino all'eventuale punto in cui le traduzioni di MinT fossero assoggettabili a copyright, queste traduzioni sono disponibili con la stessa licenza libera del contenuto di Wikipedia tradotto. Gli utenti possono modificarli e pubblicarli come parte di Wikipedia senza conflitti con le policy vigenti. Il contenuto risultante tradotto da MinT e le modifiche apportate dagli utenti saranno disponibili con la stessa licenza utilizzata per il resto degli articoli di Wikipedia.
 * Benefici per la più ampia comunità di traduzione open source. Le traduzioni ottenute da MinT e le modifiche apportate dagli utenti saranno disponibili pubblicamente. Le traduzioni post-modificate sono di particolare interesse per la comunità di ricerca sulla traduzione, che può utilizzare questa risorsa per creare nuovi servizi di traduzione a supporto di lingue per le quali la traduzione automatica open source non è ancora disponibile. Ciò aiuterà gli sviluppatori a creare e migliorare sistemi di traduzione automatica.
 * 'Gli utenti possono disabilitarla. La traduzione automatica è uno strumento opzionale della Content Translation. Gli utenti hanno la possibilità di disattivarla se per qualsiasi motivo non la trovano utile. Anche se molti utenti di Content Translation hanno richiesto i servizi di traduzione, alla fine è ogni singolo utente che decide se utilizzarli o meno.

center|500x500px



Domande su questo servizio
In questa sezione abbiamo affrontato alcune domande immediate su MinT. Questo è disponibile anche nella pagina delle FAQ sulla traduzione dei contenuti.



Quali lingue sono gestite da MinT? Ci sono progetti per aggiungerne altre?
MinT è progettato per ospitare più modelli di traduzione aperti. Il numero di lingue supportate dipenderà da esse. La lista dei sistemi di traduzione automatica (MT) disponibili includerà l'elenco più aggiornato.



In che modo l'utilizzo di MinT è diverso da quello di Apertium o di altri?
L'utente di Content Translation non percepirà alcuna differenza nell'interfaccia di traduzione, poiché MinT visualizzerà il contenuto tradotto nello stesso modo in cui Apertium o altri servizi lo fanno attualmente per le coppie di lingue supportate. I diversi servizi offrono diversi livelli di qualità di traduzione a seconda della lingua e dei contenuti specifici. Puoi provare e scegliere tra i servizi disponibili quello che fornisce la migliore traduzione iniziale per un determinato paragrafo.



Come viene effettuata la traduzione automatica se si sceglie MinT?
Quando un utente inizia a tradurre una voce, il contenuto HTML di ogni sezione della voce originaria viene inviato a MinT. Il servizio MinT elabora la richiesta e utilizza uno dei modelli di traduzione disponibili in base alla lingua e alla configurazione supportate. La versione tradotta viene ottenuta e visualizzata nella rispettiva colonna di traduzione della Traduzione dei contenuti. I link e i riferimenti sono adattati come di consueto e gli utenti possono modificare il contenuto come richiesto.

This process continues for all the sections of the article being translated. For better performance, the translations for consecutive sections are pre-fetched. The user can save the unpublished translation (to work on it again at a later time), revise, or publish the article in the usual manner. The article is published on Wikipedia like any other normal article with appropriate attribution and licenses.

Here’s a diagram of the process.

Is MinT based on open source software?
The MinT service is open source and it integrates models that are released as open source:


 * The AI research team at Meta released the translation models used by NLLB-200 with an open source license and the dataset used for training as part of the No Language Left Behind project.
 * The OPUS project provides pre-trained neural translation models trained on OPUS data with an open source license.

These models have been optimized for performance using OpenNMT Ctranslate2 library which is also an open source library.

Content Translation evolved from a long-standing need to bridge the gap in the amount of content between Wikipedias in different languages. Like all other software used on Wikimedia sites, Content Translation is also open source. In this particular case as well, we are using an open source client to interact with the external service and import freely licensed content in order to help users expand our free knowledge. To use MinT we are not adding any proprietary software in the Content Translation code, or on the Wikimedia websites and servers.

Should I be worried about my personal information when using MinT?
Irrespective of the service being used, you can be sure that only Wikipedia content from existing articles is sent and only freely licensed content will be added back to the translation. Communication with those services happens at the server side, so they are isolated from the user device and they have no access to nonpublic personal information of users. Please refer to this diagram for more details.

What if MinT is the only machine translation tool available and I don't want to use it?
Machine Translation is an optional feature in Content Translation that you can easily disable at will. If more machine translation systems are added for your languages, you can choose to enable MT again and select the MT service of your choice.

Will the content translated by MinT be free for use in Wikipedia?
Yes. The content received from MinT is otherwise freely available on the web translation platform. For ease of use Content Translation receives it via an API to make it seamlessly available on the translation interface. This content can be modified by the users (if necessary) and used in Wikipedia articles under free licenses.

Can this content be used for improving machine translation systems in general?
Yes. Translations made in Content Translation are saved in our database. This information will be made publicly available for anyone to use as translation examples to improve their translation services (from University research groups, open source projects to commercial companies, anyone!). The content can be accessed via the Content Translation API. Please note, only information related to translated text is publicly available. This includes – source and translated text, source and target language information and an identifier for the segment of text.