Content translation/Machine Translation/Matxin/cs

Podpora strojového překladu pro Content Translation byla nyní dále rozšířena. Kromě Apertium, Yandex a Youdao nyní přidáváme Matxin do seznamu systémů strojového překladu (MT) dostupných pro uživatele Content Translation. Výsledkem bude další podpora strojového překladu pro několik jazyků.

Matxin poskytuje tým z University of Basque Country ve spolupráci s Elhuyar Foundation. Tento systém strojového překladu byl vytvořen tímto týmem především pro vlastní použití pro psaní článků Wikipedie v baskičtině a španělštině. Různé týmy uvnitř nadace Wikimedia Foundation spolupracovaly s týmem Matxin při vypracování dohody, která umožní používání Matxinu, aniž by byla ohrožena politika Wikipedie týkající se přidělování práv, soukromí našich uživatelů a zastoupení značky. Matxin je software s otevřeným zdrojovým kódem. Pro snadnější použití používáme pohodlnější strojové překladové API pro přístup ke službě hostované týmem. Níže naleznete více podrobností o dohodě a jsme rádi, když uslyšíme jakékoli dotazy týkající se této služby.

Klíčové vlastnosti

 * Do Matxinu nejsou zasílány žádné osobní informace. K systému MT bude přistupováno pomocí klíče API. Obsah článku (volně licencovaný) je odeslán na server Matxin ze serverů Wikimedia Foundation. Mezi uživatelem a externími službami nedochází k přímé komunikaci a do služby Matxin nejsou zasílány žádné osobní informace (IP, uživatelské jméno). Klient kontaktující Matxin je open source a můžete to zkontrolovat zde. Žádná část služby nebo kódu Matxinu nebude součástí Wikimedia infrastruktury nebo kódové základny pro překlad obsahu. Viz také schéma tohoto technického nastavení na konci této sekce.


 * Informace jsou vráceny z Matxinu na základě bezplatné licence. Když je použit Matxin, získá se přeložená verze obsahu Wikipedie na základě bezplatné licence. Uživatelé ji mohou upravovat a publikovat jako součást Wikipedie bez konfliktů s existujícími zásadami. Výsledný obsah přeložený Matxinem a jeho uživatelské úpravy budou k dispozici pod stejnou licencí, jaká se používá pro zbývající články na Wikipedii.


 * Výhody širší otevřené překladatelské komunity. Překlady získané z Matxinu a uživatelských úprav budou veřejně dostupné. Post-editované překlady jsou zvlášť zajímavé pro komunitu pro výzkum překladů (včetně týmu Matxin), kteří mohou tento zdroj použít k vytvoření nových překladatelských služeb na podporu jazyků, pro které ještě není k dispozici strojový překlad otevřených zdrojů. To pomůže vývojářům vytvářet a zlepšovat systémy strojového překladu.


 * Uživatelé to mohou zakázat. Automatický překlad je volitelný nástroj v překladu obsahu.Uživatelé mají možnost jej deaktivovat, pokud to z nějakého důvodu nepovažují za užitečné. Přestože mnoho překladatelů obsahu požadovalo tuto překladatelskou službu, každý jednotlivý uživatel se nakonec rozhodne, zda jej chce nebo nemá použít.



Povinnosti Matxinu

 * Umožnit bezplatné použití jejich klíče strojového překladu API do nadace Wikimedia Foundation, aby dobrovolníci na stránkách Wikimedia mohli překládat články a podporovat nejméně 10 milionů znaků obsahu překladu denně.

Povinnosti nadace Wikimedia Foundation

 * Poskytovat dobrovolně upravené verze textu přeloženého překladatelským nástrojem, aby Matxin mohl vylepšovat svůj nástroj
 * Žádné osobní údaje překladatelů nebudou sdíleny.
 * Na žádost bude zaslán Matxin pouze původní obsah, který se má překládat, jeho jazyk a cílový jazyk překladu.
 * Překlady publikované překladateli, s pomocí nebo bez pomoci služeb strojového překladu, budou poskytovány ve formě parallel corpora prostřednictvím API pro překlad obsahu. Tato API budou vyvíjena postupně a výsledky budou volně dostupné pro všechny, nejen pro Matxin.

Důležité poznámky

 * Veškerý obsah bude nadále licencován podle CC BY-SA 3.0
 * Matxin nevyžaduje žádné "branding" na stránkách Wikimedia mimo seznam Matxin jako možnost nástroje pro překlad v rozbalovací nabídce rozhraní překladů
 * Neexistuje žádná výměna osobních údajů dobrovolníků
 * Dohoda je omezena na 1 rok, kdy můžeme přehodnotit naše potřeby
 * Jsme oprávněni ukončit smlouvu z jakéhokoli důvodu a kdykoli (s 30denní výpovědní lhůtou)
 * Dohoda se řídí právem USA

Otázky k této službě
V této sekci jsme se zabývali několika okamžitými otázkami o matxinu. K dispozici je také na stránce Časté dotazy týkající se Content Translation.

Které jazyky ovládá Matxin? Plánujete přidat další?
Matxin lze použít k překladu ze španělštiny do baskičtiny. Protože vývojáři týmu Matxin přidávají do služby více jazyků, zahrneme je.

Jak se liší používání Matxinu než jiných služeb strojového překladu?
Jako uživatel obsahu překladu nebudete cítit žádný rozdíl v překladovém rozhraní, protože Matxin zobrazí přeložený obsah stejným způsobem jako ostatní služby, které v současné době pro podporované jazykové páry pracují.

Jak se provádí strojový překlad, když zvolím Matxin?
Matxin poskytuje klíč API, který umožňuje webům a dalším službám používat jejich překladový systém. Content Translation také používá tento jedinečný klíč API pro přístup k Matxinu. Když uživatel začne překládat článek, obsah HTML každé části zdrojového článku se odešle do Matxinu a získá se přeložená verze a zobrazí se v příslušném překladu ve sloupci Překlad obsahu. Články a odkazy jsou upraveny jako obvykle a uživatelé mohou obsah podle potřeby upravovat.

Tento proces pokračuje u všech částí přeloženého článku. Pro lepší výkon jsou překlady po sobě jdoucích sekcí předem načteny. Uživatel může nepublikovaný překlad uložit (aby na něm znovu pracoval) nebo publikovat článek obvyklým způsobem. Článek je publikován na Wikipedii jako jakýkoli jiný normální článek s odpovídajícím uvedením autora a licencí.

Zde je schéma procesu.

Je Matxin založen na open source softwaru?
Ano! Jedná se o software s otevřeným zdrojovým kódem, podobný programu Apertium. Byl vyvinut malým týmem z University of Basque country, který tento nástroj vyvinul pro vlastní potřebu překládat články z Wikipedie. Jsou součástí komunity Wikimedia a jsme rádi, že s nimi spolupracujeme.

Should I be worried about my personal information when using Matxin?
Irrespective of the service being used, you can be assured that only Wikipedia content from existing articles is sent and only freely licensed content will be added back to the translation. No personal information is sent and communication with those services happen at the server side, so they are isolated from the user device. Please refer to this diagram for more details.

What if Matxin is the only machine translation tool available and I don't want to use it?
Machine Translation is an optional feature in Content Translation that you can easily disable at will. If more machine translation systems are added for your languages, you can choose to enable MT again and select the MT service of your choice.

Will the content translated by Matxin be free for use in Wikipedia?
Yes. The content received from Matxin is otherwise freely available on the web translation platform. It is an open source software. For ease of use Content Translation receives it via an API key to make it seamlessly available on the translation interface. This content can be modified by the users (if necessary) and used in Wikipedia articles under free licenses.

Can this content be used for improving machine translation systems in general?
Yes. Translations made in Content Translation are saved in our database. This information will be made publicly available for anyone to use as translation examples to improve their translation services (from University research groups, open source projects to commercial companies, anyone!). The content can be accessed via the Content Translation API. Please note, only information related to translated text is publicly available. This includes – source and translated text, source and target language information and an identifier for the segment of text.