Content translation/Machine Translation/Matxin/cs

Podpora strojového překladu pro Content Translation byla nyní dále rozšířena. Kromě Apertium, Yandex a Youdao nyní přidáváme Matxin do seznamu systémů strojového překladu (MT) dostupných pro uživatele Content Translation. Výsledkem bude další podpora strojového překladu pro několik jazyků.

Matxin poskytuje tým z University of Basque Country ve spolupráci s Elhuyar Foundation. Tento systém strojového překladu byl vytvořen tímto týmem především pro vlastní použití pro psaní článků na Wikipedii v baskičtině a španělštině. Různé týmy v rámci Wikimedia Foundation spolupracovaly s týmem Matxin na vypracování dohody, která umožní používání Matxin, aniž by byla ohrožena pravidla Wikipedie týkající se připisování práv, soukromí našich uživatelů a zastoupení značky. Matxin je software s otevřeným zdrojovým kódem. Pro snadné použití používáme pro přístup ke službě hostované týmem pohodlnější API pro strojový překlad. Více podrobností o smlouvě naleznete níže a rádi vyslechneme vaše případné dotazy ohledně této služby.

Klíčové vlastnosti

 * Do Matxinu nejsou zasílány žádné osobní informace. Systém MT bude přístupný pomocí klíče API. Obsah článku (volně licencovaný) je odesílán na server Matxin ze serverů Wikimedia Foundation. Mezi uživatelem a externími službami neprobíhá žádná přímá komunikace a do služby Matxin nejsou odesílány žádné osobní údaje (IP, uživatelské jméno). Klient kontaktující Matxin je open source a můžete jej zkontrolovat zde. Žádná část služby nebo kódu Matxin nebude součástí infrastruktury Wikimedie nebo kódové základny Content Translation. Podívejte se také na schéma tohoto technického nastavení na konci této části.
 * Informace jsou vráceny z Matxinu na základě bezplatné licence. Při použití Matxinu se získá přeložená verze obsahu Wikipedie pod bezplatnou licencí. Uživatelé jej mohou upravovat a publikovat jako součást Wikipedie bez konfliktů se stávajícími zásadami. Výsledný obsah přeložený Matxinem a uživatelské úpravy budou dostupné pod stejnou licencí, která se používá pro zbytek článků na Wikipedii.
 * Výhody širší otevřené překladatelské komunity. Překlady získané z Matxinu a uživatelské úpravy budou veřejně dostupné. Dodatečně editované překlady jsou zvláště zajímavé pro komunitu překladatelského výzkumu (včetně týmu Matxin), která může tento zdroj použít k vytvoření nových překladatelských služeb na podporu jazyků, pro které zatím není dostupný strojový překlad s otevřeným zdrojovým kódem. To pomůže vývojářům vytvářet a zlepšovat systémy strojového překladu.
 * Uživatelé jej mohou zakázat. Automatický překlad je volitelný nástroj v překladu obsahu. Uživatelé mají možnost jej zakázat, pokud to z nějakého důvodu nepovažují za užitečné. Ačkoli mnoho uživatelů Content Translation (překladu obsahu) požádalo o tuto překladatelskou službu, každý jednotlivý uživatel se nakonec rozhodne, zda ji chce používat nebo ne.



Povinnosti Matxinu

 * Umožnit bezplatné používání jejich klíče API strojového překladu pro Wikimedia Foundation, aby mohli dobrovolníci na stránkách Wikimedie překládat články a podporovat alespoň 10 milionů znaků překladatelského obsahu denně.

Povinnosti nadace Wikimedia Foundation

 * Poskytovat dobrovolně upravené verze textu přeloženého překladatelským nástrojem, aby Matxin mohl vylepšovat svůj nástroj.
 * Nebudou sdíleny žádné osobní údaje překladatelů.
 * V žádosti společnosti Matxin bude zaslán pouze původní obsah k překladu, jeho jazyk a cílový jazyk překladu.
 * Překlady publikované překladateli, s pomocí nebo bez pomoci služeb strojového překladu, budou poskytovány ve formě paralelních korpusů pomocí rozhraní Content Translation API. Tato API budou vyvíjena postupně a výsledky budou volně dostupné pro každého, nejen pro Matxin.

Důležité poznámky

 * Veškerý obsah bude nadále licencován podle CC BY-SA 3.0.
 * Matxin nevyžaduje žádné "označení" (branding) na stránkách Wikimedie kromě uvedení Matxinu jako možnosti překladatelského nástroje v rozbalovací nabídce rozhraní překladu.
 * Nedochází k výměně osobních údajů dobrovolníků.
 * Smlouva je omezena na 1 rok, po tuto dobu můžeme přehodnotit naše potřeby.
 * Můžeme ukončit smlouvu z jakéhokoli důvodu a kdykoli (s 30denní výpovědní lhůtou).
 * Smlouva se řídí právem USA.

Otázky k této službě
V této sekci jsme se zabývali několika bezprostředními otázkami o Matxinu. Toto je také k dispozici na stránce Časté dotazy k překladu obsahu.

Které jazyky ovládá Matxin? Plánujete přidat další?
Matxin lze použít k překladu ze španělštiny do baskičtiny. Jakmile vývojáři týmu Matxin do služby přidají další jazyky, zahrneme je.

Jak se liší používání Matxinu než jiných služeb strojového překladu?
Jako uživatel obsahu překladu nepoznáte žádný rozdíl v překladovém rozhraní, protože Matxin zobrazí přeložený obsah stejným způsobem jako ostatní služby, které pracují v současné době pro podporované jazykové páry.

Jak se provádí strojový překlad, když zvolím Matxin?
Matxin poskytuje klíč API, který umožňuje webům a dalším službám používat jejich překladový systém. Content Translation také používá tento jedinečný klíč API pro přístup k Matxinu. When a user starts translating an article, the HTML content of each section of the source article is sent to Matxin and a translated version is obtained and displayed on the respective translation column of Content Translation. Links and references are adapted as usual and users can modify the content as required.

Tento proces pokračuje u všech částí přeloženého článku. For better performance, the translations for consecutive sections are pre-fetched. The user can save the unpublished translation (to work on it again at a later time) or publish the article in the usual manner. The article is published on Wikipedia like any other normal article with appropriate attribution and licenses.

Zde je schéma procesu.

Je Matxin založen na open source softwaru?
Ano! Jedná se o software s otevřeným zdrojovým kódem, podobný programu Apertium. It has been developed by a small team from the University of Basque country who developed this tool for their own need to translate Wikipedia articles. They are very much part of the Wikimedia community and we are happy to partner with them.

Měl bych se bát o své osobní údaje při používání Matxinu?
Bez ohledu na používanou službu si můžete být jisti, že bude odeslán pouze obsah z existujících článků z Wikipedie a do překladu bude přidán pouze volně licencovaný obsah. No personal information is sent and communication with those services happen at the server side, so they are isolated from the user device. Please refer to this diagram for more details.

Co když je Matxin jediný dostupný strojový překladový nástroj a já ho nechci používat?
Strojový překlad je volitelná funkce v překladu obsahu, kterou můžete snadno libovolně zakázat. If more machine translation systems are added for your languages, you can choose to enable MT again and select the MT service of your choice.

Bude obsah přeložený Matxinem zdarma pro použití na Wikipedii?
Ano. Obsah přijatý od Matxinu je jinak volně dostupný na platformě webového překladu. It is an open source software. For ease of use Content Translation receives it via an API key to make it seamlessly available on the translation interface. This content can be modified by the users (if necessary) and used in Wikipedia articles under free licenses.

Lze tento obsah použít ke zlepšení systémů strojového překladu obecně?
Ano. Překlady provedené v překladu obsahu jsou uloženy v naší databázi. This information will be made publicly available for anyone to use as translation examples to improve their translation services (from University research groups, open source projects to commercial companies, anyone!). The content can be accessed via the Content Translation API. Please note, only information related to translated text is publicly available. This includes – source and translated text, source and target language information and an identifier for the segment of text.