Content translation/Machine Translation/MinT/nl

From mediawiki.org
This page is a translated version of the page Content translation/Machine Translation/MinT and the translation is 100% complete.

MinT (Machine in Translation) is een machine vertaaldienst gebaseerd op open source neurale machine vertaalmodellen. De dienst wordt gehost in de infrastructuur van de Wikimedia Foundation en zal deel uitmaken van de lijst van beschikbare systemen voor machinevertaling (MT) voor gebruikers van Content Translation en andere Wikimedia-projecten. De vertalingen zijn gebaseerd op NLLB-200, OPUS, IndicTrans2 en Softcatalà vertalingsmodellen die zijn geoptimaliseerd voor de prestaties met behulp van OpenNMT Ctranslate2 bibliotheek om te voorkomen dat de GPU-versnelling nodig is. Voor meer informatie kunt u de broncode, de API-specificatie en een testinstantie raadplegen.

Belangrijkste functies

  • Er wordt geen niet-openbare persoonlijke informatie van gebruikers naar MinT gestuurd. Het MT-systeem wordt via een API benaderd. Artikelinhoud (vrij gelicentieerd) wordt naar de MinT-server verzonden en er vindt geen directe communicatie plaats tussen de gebruiker en externe diensten en er worden geen niet-publieke persoonsgegevens van gebruikers (IP, gebruikersnaam) naar de MinT-service verzonden. De cliënt die contact met MinT heeft is open source en u kunt die source hier bekijken. Hoewel de MinT-dienst wordt gehost in de Wikimedia-infrastructuur, volgt de integratie hetzelfde patroon als andere externe diensten (zie ook een diagram van deze technische opstelling aan het einde van het gedeelte).
  • Alle auteursrechtelijk beschermde informatie wordt geretourneerd door MinT onder een vrije licentie. Wanneer MinT wordt gebruikt, wordt een vertaalde versie van de Wikipedia-inhoud verkregen. De auteursrechtelijkheid van dergelijke door machines gegenereerde inhoud is een open juridische vraag. Voor zover MinT-vertalingen auteursrechtelijk zijn, zijn deze vertalingen beschikbaar onder dezelfde vrije licentie als de inhoud van Wikipedia die wordt vertaald. Gebruikers kunnen het wijzigen en publiceren als onderdeel van Wikipedia zonder conflicten met bestaande beleid. De inhoud die wordt vertaald door MinT en de gebruikerswijzigingen zullen beschikbaar zijn onder dezelfde licentie die wordt gebruikt voor de rest van de artikelen in Wikipedia.
  • Komt ten goede aan de bredere open source-vertaalgemeenschap. Vertalingen verkregen van MinT en gebruikerswijzigingen zullen openbaar beschikbaar zijn. De nabewerkte vertalingen zijn van bijzonder belang voor de vertaalonderzoeksgemeenschap, die deze bron kan gebruiken om nieuwe vertaaldiensten te creëren ter ondersteuning van talen waarvoor nog geen open source machinevertaling beschikbaar is. Dit zal ontwikkelaars helpen bij het maken en verbeteren van machinevertalingssystemen.
  • Gebruikers kunnen het uitschakelen. Automatische vertaling is een optioneel hulpmiddel bij het vertalen van inhoud. Gebruikers hebben een optie om het uit te schakelen als ze het om de een of andere reden niet nuttig vinden. Hoewel veel gebruikers van Content Translation hebben gevraagd om vertaaldiensten, beslist elke individuele gebruiker uiteindelijk of ze deze willen gebruiken of niet.

Communicatie diagram van MinT-client

Vragen over deze service

In dit artikel hebben wij enkele vragen over de MinT behandeld. Dit is ook beschikbaar op de pagina met veelgestelde vragen over Content Translation.

Welke talen worden door MinT verwerkt? Zijn er plannen om er meer toe te voegen?

MinT is ontworpen om meerdere open vertaalmodellen te hosten. Het aantal ondersteunde talen hangt van de modellen af. De lijst van beschikbare systemen voor machinevertaling (MT) bevat de meest actuele lijst.

Wat is het verschil tussen het gebruik van MinT en het gebruik van Apertium of anderen?

Als gebruiker van Content Translation zult u geen verschil voelen op de vertaalinterface, omdat MinT de vertaalde inhoud weergeeft op dezelfde manier als Apertium of andere diensten dat nu voor de ondersteunde taalparen doen. Verschillende diensten bieden een ander niveau van kwaliteit van de vertaling, afhankelijk van de taal en de specifieke inhoud. U kunt proberen de best beschikbare vertaling voor een bepaalde alinea te vinden, door de dienst te veranderen.

Hoe wordt de machinevertaling gedaan als ik voor MinT kies?

Wanneer een gebruiker begint met het vertalen van een artikel, wordt de HTML-inhoud van elk deel van het bronartikel naar MinT gestuurd. De MinT-service verwerkt de aanvraag en maakt gebruik van een van de beschikbare vertaalmodellen op basis van de ondersteunde taal en configuratie. Een vertaalde versie wordt verkregen en weergegeven in de betreffende vertaalkolom van Content Translation. Links en verwijzingen worden zoals gewoonlijk aangepast en gebruikers kunnen de inhoud naar wens aanpassen.

Dit proces gaat door voor alle delen van het artikel die worden vertaald. Voor een betere prestatie worden de vertalingen voor opeenvolgende delen vooraf al opgehaald. De gebruiker kan de ongepubliceerde vertaling opslaan (om er later weer aan te werken), het artikel herzien of op de gebruikelijke manier publiceren. Het artikel wordt op Wikipedia gepubliceerd zoals elk ander normaal artikel met passende toeschrijving en licenties.

Een diagram van het proces.

Is MinT gebaseerd op open source software?

De MinT-service is open source en integreert modellen die als open source zijn uitgebracht:

Deze modellen zijn geoptimaliseerd voor de prestaties met behulp van OpenNMT Ctranslate2 bibliotheek die ook een open source bibliotheek is.

Content Translation is ontstaan uit een langdurige behoefte om de kloof in de hoeveelheid inhoud tussen Wikipedia's in verschillende talen te overbruggen. Net als alle andere software die op Wikimedia-sites wordt gebruikt, is Content Translation ook open source. Ook in dit specifieke geval gebruiken we een open source client om te communiceren met de externe dienst en om vrij gelicentieerde content te importeren om gebruikers te helpen onze vrije kennis uit te breiden. Om MinT te gebruiken voegen we geen eigen software toe in de Content Translation code, of op de Wikimedia-websites en servers.

Moet ik me zorgen maken over mijn persoonlijke gegevens bij het gebruik van MinT?

Ongeacht de dienst die wordt gebruikt, kunt u er zeker van zijn dat alleen Wikipedia-inhoud van bestaande artikelen wordt verzonden en dat alleen inhoud met een vrije licentie weer aan de vertaling wordt toegevoegd. Communicatie met die diensten vindt plaats aan de serverzijde, dus ze zijn geïsoleerd van het apparaat van de gebruiker en ze hebben geen toegang tot niet-openbare persoonlijke informatie van gebruikers. Raadpleeg dit diagram voor meer informatie.

Wat als MinT het enige beschikbare hulpmiddel voor automatische vertaling is en ik het niet wil gebruiken?

Machinevertaling is een optionele functie in Content Translation die u eenvoudig naar uw keuze kunt uitschakelen. Als er meer automatische vertaalsystemen voor uw talen worden toegevoegd, kunt u ervoor kiezen om MT opnieuw in te schakelen en de MT-service van uw keuze te selecteren.

Is de door MinT vertaalde inhoud vrij voor gebruik in Wikipedia?

Ja. De inhoud die van MinT wordt ontvangen, is vrij beschikbaar op het vertalingsplatform. Om het gebruik te vergemakkelijken ontvangt Content Translation het via een API om het naadloos beschikbaar te maken op de vertaalinterface. Deze inhoud kan door de gebruikers worden gewijzigd (indien nodig) en gebruikt in Wikipedia-artikelen onder vrije licenties.

Kan deze inhoud worden gebruikt voor het verbeteren van automatische vertaalsystemen in het algemeen?

Ja. Vertalingen die in Content Translation worden gemaakt, worden opgeslagen in onze database. Deze informatie zal openbaar worden gemaakt zodat iedereen deze kan gebruiken als vertaalvoorbeelden om hun vertaaldiensten te verbeteren (van universitaire onderzoeksgroepen, open source-projecten tot commerciële bedrijven, wie dan ook!). De inhoud is toegankelijk via de API voor het vertalen van inhoud. Houd er rekening mee dat alleen informatie met betrekking tot vertaalde tekst openbaar beschikbaar is. Dit omvat: bron- en vertaalde tekst, bron- en doeltaalinformatie en een identificatie voor het tekstsegment.