Překlad obsahu/strojový překlad/Matxin

From mediawiki.org
This page is a translated version of the page Content translation/Machine Translation/Matxin and the translation is 100% complete.

Podpora strojového překladu pro Content Translation byla nyní dále rozšířena. Kromě Apertium, Yandex a Youdao nyní přidáváme Matxin do seznamu systémů strojového překladu (MT) dostupných pro uživatele Content Translation. Výsledkem bude další podpora strojového překladu pro několik jazyků.

Matxin poskytuje tým z University of Basque Country ve spolupráci s Elhuyar Foundation. Tento systém strojového překladu byl vytvořen tímto týmem především pro vlastní použití pro psaní článků na Wikipedii v baskičtině a španělštině. Různé týmy v rámci Wikimedia Foundation spolupracovaly s týmem Matxin na vypracování dohody, která umožní používání Matxin, aniž by byla ohrožena pravidla Wikipedie týkající se připisování práv, soukromí našich uživatelů a zastoupení značky. Matxin je software s otevřeným zdrojovým kódem. Pro snadné použití používáme pro přístup ke službě hostované týmem pohodlnější API pro strojový překlad. Více podrobností o smlouvě naleznete níže a rádi vyslechneme vaše případné dotazy ohledně této služby.

Klíčové vlastnosti

  • Do Matxinu nejsou zasílány žádné osobní informace. Systém MT bude přístupný pomocí klíče API. Obsah článku (volně licencovaný) je odesílán na server Matxin ze serverů Wikimedia Foundation. Mezi uživatelem a externími službami neprobíhá žádná přímá komunikace a do služby Matxin nejsou odesílány žádné osobní údaje (IP, uživatelské jméno). Klient kontaktující Matxin je open source a můžete jej zkontrolovat zde. Žádná část služby nebo kódu Matxin nebude součástí infrastruktury Wikimedie nebo kódové základny Content Translation. Podívejte se také na schéma tohoto technického nastavení na konci této části.
  • Informace jsou vráceny z Matxinu na základě bezplatné licence. Při použití Matxinu se získá přeložená verze obsahu Wikipedie pod bezplatnou licencí. Uživatelé jej mohou upravovat a publikovat jako součást Wikipedie bez konfliktů se stávajícími zásadami. Výsledný obsah přeložený Matxinem a uživatelské úpravy budou dostupné pod stejnou licencí, která se používá pro zbytek článků na Wikipedii.
  • Výhody širší otevřené překladatelské komunity. Překlady získané z Matxinu a uživatelské úpravy budou veřejně dostupné. Dodatečně editované překlady jsou zvláště zajímavé pro komunitu překladatelského výzkumu (včetně týmu Matxin), která může tento zdroj použít k vytvoření nových překladatelských služeb na podporu jazyků, pro které zatím není dostupný strojový překlad s otevřeným zdrojovým kódem. To pomůže vývojářům vytvářet a zlepšovat systémy strojového překladu.
  • Uživatelé jej mohou zakázat. Automatický překlad je volitelný nástroj v překladu obsahu. Uživatelé mají možnost jej zakázat, pokud to z nějakého důvodu nepovažují za užitečné. Ačkoli mnoho uživatelů Content Translation (překladu obsahu) požádalo o tuto překladatelskou službu, každý jednotlivý uživatel se nakonec rozhodne, zda ji chce používat nebo ne.

Cx-mt.png

Shrnutí naší dohody s Matxinem

Povinnosti Matxinu

  • Umožnit bezplatné používání jejich klíče API strojového překladu pro Wikimedia Foundation, aby mohli dobrovolníci na stránkách Wikimedie překládat články a podporovat alespoň 10 milionů znaků překladatelského obsahu denně.

Povinnosti nadace Wikimedia Foundation

  • Poskytovat dobrovolně upravené verze textu přeloženého překladatelským nástrojem, aby Matxin mohl vylepšovat svůj nástroj.
  • Nebudou sdíleny žádné osobní údaje překladatelů.
  • V žádosti společnosti Matxin bude zaslán pouze původní obsah k překladu, jeho jazyk a cílový jazyk překladu.
  • Překlady publikované překladateli, s pomocí nebo bez pomoci služeb strojového překladu, budou poskytovány ve formě paralelních korpusů pomocí rozhraní Content Translation API. Tato API budou vyvíjena postupně a výsledky budou volně dostupné pro každého, nejen pro Matxin.

Důležité poznámky

  • Veškerý obsah bude nadále licencován podle CC BY-SA 3.0.
  • Matxin nevyžaduje žádné "označení" (branding) na stránkách Wikimedie kromě uvedení Matxinu jako možnosti překladatelského nástroje v rozbalovací nabídce rozhraní překladu.
  • Nedochází k výměně osobních údajů dobrovolníků.
  • Smlouva je omezena na 1 rok, po tuto dobu můžeme přehodnotit naše potřeby.
  • Můžeme ukončit smlouvu z jakéhokoli důvodu a kdykoli (s 30denní výpovědní lhůtou).
  • Smlouva se řídí právem USA.

Otázky k této službě

V této sekci jsme se zabývali několika bezprostředními otázkami o Matxinu. Toto je také k dispozici na stránce Časté dotazy k překladu obsahu.

Které jazyky ovládá Matxin? Plánujete přidat další?

Matxin lze použít k překladu ze španělštiny do baskičtiny. Jakmile vývojáři týmu Matxin do služby přidají další jazyky, zahrneme je.

Jak se liší používání Matxinu než jiných služeb strojového překladu?

Jako uživatel obsahu překladu nepoznáte žádný rozdíl v překladovém rozhraní, protože Matxin zobrazí přeložený obsah stejným způsobem jako ostatní služby, které pracují v současné době pro podporované jazykové páry.

Jak se provádí strojový překlad, když zvolím Matxin?

Matxin poskytuje klíč API, který umožňuje webům a dalším službám používat jejich překladový systém. Content Translation také používá tento jedinečný klíč API pro přístup k Matxinu. Když uživatel začne překládat článek, obsah HTML každé části zdrojového článku se odešle do Matxinu a přeložená verze se získá a zobrazí se v příslušném sloupci překladu Content Translation. Odkazy a reference jsou upraveny jako obvykle a uživatelé mohou obsah upravovat podle potřeby.

Tento proces pokračuje u všech částí přeloženého článku. Pro lepší výkon jsou překlady pro po sobě jdoucí sekce načteny předem. Uživatel si může nepublikovaný překlad uložit (aby na něm mohl pracovat později) nebo článek publikovat obvyklým způsobem. Článek je publikován na Wikipedii jako každý jiný normální článek s příslušným uvedením zdroje a licencemi.

Schéma procesu je zde.

Je Matxin založen na open source softwaru?

Ano! Jedná se o software s otevřeným zdrojovým kódem, podobný programu Apertium. Byl vyvinut malým týmem z University of Basque country, který tento nástroj vyvinul pro vlastní potřebu překládat články na Wikipedii. Jsou velkou součástí komunity Wikimedie a jsme rádi, že s nimi můžeme spolupracovat.

Měl bych se bát o své osobní údaje při používání Matxinu?

Bez ohledu na používanou službu si můžete být jisti, že bude odeslán pouze obsah z existujících článků z Wikipedie a do překladu bude přidán pouze volně licencovaný obsah. Nejsou odesílány žádné osobní informace a komunikace s těmito službami probíhá na straně serveru, takže jsou izolovány od zařízení uživatele. Další podrobnosti naleznete na tomto diagramu.

Co když je Matxin jediný dostupný strojový překladový nástroj a já ho nechci používat?

Strojový překlad je volitelná funkce v Content Translation, kterou můžete snadno libovolně zakázat. Pokud je pro vaše jazyky přidáno více systémů strojového překladu, můžete znovu povolit MT a vybrat službu MT podle vašeho výběru.

Bude obsah přeložený Matxinem pro použití na Wikipedii zdarma?

Ano. Obsah přijatý od Matxinu je jinak volně dostupný na platformě webového překladu. Jedná se o software s otevřeným zdrojovým kódem. Pro snadné použití jej Content Translation přijímá prostřednictvím API klíče, aby byl bez problémů dostupný v překladovém rozhraní. Tento obsah mohou uživatelé (v případě potřeby) upravit a použít v článcích Wikipedie na základě bezplatných licencí.

Lze tento obsah použít ke zlepšení systémů strojového překladu obecně?

Ano. Překlady provedené v Content Translation jsou uloženy v naší databázi. Tyto informace budou veřejně dostupné komukoli, aby je mohl použít jako příklady překladů ke zlepšení svých překladatelských služeb (od univerzitních výzkumných skupin, open source projektů až po komerční společnosti, kdokoli!). K obsahu lze přistupovat prostřednictvím Content Translation API. Upozorňujeme, že veřejně dostupné jsou pouze informace týkající se přeloženého textu. To zahrnuje – zdrojový a přeložený text, informace o zdrojovém a cílovém jazyce a identifikátor segmentu textu.