Help:内容翻译/翻译/内置机器翻译

From mediawiki.org
This page is a translated version of the page Help:Content translation/Translating/Initial machine translation and the translation is 73% complete.
PD 注意:當您編輯本頁面時,即同意以CC0協議授權您的貢獻。您可以在公有領域帮助页面找到更多信息。 PD

在翻译中添加新段落时,您可以从头开始或使用自动翻译作为起点。 如果可用,机器翻译的结果将作为默认的初始翻译。 下文描述了不同的选项、其可用性的详细信息以及使用机器翻译时的注意事项。

内置翻译的选项

工具栏中的“初始翻译”选项允许您决定将初始内容用作每个段落的起点。 可用选项如下:

  • 使用机器翻译服务这使你可以从原段落的自动翻译版本开始翻译。 这些选项的数量和名称会有所不同。 “使用 Apertium”或“使用 Yandex”等选项将根据这些服务所支持的语言提供(有关更多信息,请参阅下一节)。
  • 复制原内容。 原始段落将被复制到翻译中。 虽然内容将保留原始语言,但一些元素会适应目标 wiki。 例如,链接将指向目标语言的相应文章,模板将被转换为等效的模板。 翻译人员仍然需要完全重写内容,但改编的元素可能更容易重用。
  • 从空段落开始。在替换内容比重新键入更费力时,从空段落开始会很有用。

考虑到不同的内容可能适用不同的翻译方法,你可以对各段落快速切换不同的方法,而彼此相互独立。 在不同方法之间切换时,会保留在段落中所做的更改。 即使已经开始编辑原段落,也可以通过这种方式尝试不同的翻译方法,而不必担心决定使用最初的翻译方法时丢失原先编辑的段落。 在这种场合下,还有两个相关的附加选项:

  • 重置翻译选项在修改初始内容后可用。 通过这个选项可以丢弃所做的更改来重置原内容。
  • 设为默认选项在已选定当前非默认的翻译方法时可用。 通过这个选项可以设置翻译后续所有段落的默认方法。 如果你发现某个翻译服务总体上来说效果更好,这个选项会很方便。

机器翻译可用性

内容翻译集成了多种翻译服务,每项服务都支持一组不同的语言。 下面列出支持的服务,并附有它们支持的语言列表的链接:

上面的语言列表指向配置代码,以确保信息与工具当前的工作方式同步。 这些列表显示了初始缩进级别的源语言的语言代码,以及其下所有受支持的目标语言的代码。

还可以使用我们的 API 检查特定语言对的可用服务。 在这个西班牙语-加泰罗尼亚语对的示例中,您可以看到Apertium 是其他可用服务中的默认服务(列表中的第一个)。

根据观察到的结果和社区反馈,各语言将逐步可用。 某些语言的机器翻译可能暂时不可用,即使底层服务支持。

改善现有的翻译服务

使用“内容翻译”进行翻译,将帮助翻译服务改进。 对初始机器翻译所做的所有更正都将记录于 API 和数据转储中,并可能用于改进现有服务。 不仅如此,你还可以通过翻译服务提供的特定方法来为他们的项目做出贡献。

MinT

The translations provided by MinT are based on translation models such as NLLB-200 and OpusMT. The training data compiled by the Opus project is resused by many translation models, and you can contribute to it in order to help improve the translation quality for your language.

OpusMT 是一个开源的神经网络机器翻译系统,它基于网络上自由许可的多语言文档训练。 这个开放的语料库用于训练翻译系统,扩展语料库将带来更好的翻译。 使用内容翻译生成的内容会自动集成到语料库中,但您可以进一步扩展语料库:

  • 提出将新来源整合到开放语料库中。您可以联系 Jörg Tiedemann,提出一个新的数据源来扩展语料库。
  • 直接提交文档(还在初始原型阶段)。 你可以通过多种格式上传翻译的文档(如翻译的网页)来拓展语料库。
  • 在本地试试OPUS-CAT 的语言模型(Windows 可用)
  • 为其他项目做出贡献,为这个开放语料库提供翻译,如Tatoeba,这是一个在线开放社区,收集多种语言的句子翻译。

OpusMT 基于同样是开源项目的 MarianNMT 。 拥有技术知识且对机器学习感兴趣的人也可以为改进机器学习做出贡献。

Apertium

Apertium 是一个开源的基于规则的翻译系统。 你可以通过编码你的语言的相关规则来为项目做出贡献。 这个过程需要语言和高级技术知识,但你可以获得 Apertium 团队的支持,以扩大对新语言对的翻译支持。

Google 翻译

Google 翻译不是一个开源项目,但用户仍然有办法贡献:

通过新的翻译服务扩大语言支持

内容翻译被设计成一个可扩展的平台。 因此,可以开发新客户端来整合额外的翻译服务Some considerations about the way translation services are integrated:

  • Machine translations and the user corrections made are published as part of the data on published translations, which can provide a useful resource to create or improve your translation service.
  • External services integrated only receive publicly available wiki content, and return a translated version of such content that is compatible with the licenses used in the wiki.

No personal information is shared with the translation services.

Feedback on the support provided for each language is very useful. Please, let us know if you are missing support for some language, or whether higher quality options are available for it. You can provide such feedback on the project talk page or in this ticket.


Considerations on machine translation

Machine translation is far from perfect when intended as a final outcome. However, many users find it very useful as a starting point. Please make sure to review the content from these different perspectives:

  • Make sure the original meaning is preserved.
  • Check that there is no information missing, especially for elements such as links, references and templates that include information that is not always visible on the surface.
  • Read the translated content to make sure it reads naturally as an independent page.

Limitations with complex elements

In some cases the content may not appear in the translation as expected:

  • Some of the services supported only work with plain text.

This means that formatting and rich content elements such as links and citations from the original article are lost in the translation, and Content translation needs to guess where those belong in the translated text. Re-adding those elements is not always perfect and some elements may be in the wrong position or applied to the wrong part of the text.

  • Complex elements such as references or templates may use a different structure in each language, which makes it hard to transfer the content from one language into the other.

Make sure to review the contents inside those elements to make sure there is no important information missing.

Enforcing the review of machine translation

Several automatic mechanisms exist to enforce the review of the initial contents. In this way, the tool makes sure that the initial automatic translation is reviewed enough before the contents get published.