MinT

From mediawiki.org
This page is a translated version of the page MinT and the translation is 92% complete.
Outdated translations are marked like this.

MinT(機器輔助翻譯)是基於開放原始碼的神經機器翻譯模型開發的機器翻譯服務。 該服務托管於維基媒體基金會的基礎設施,运行其他組織發布的開源協議翻譯模型。 開放的機器翻譯服務是打造自由知識生態系统的重要基礎設施的關鍵環節。 此頁面會介紹擴大服務適用範圍方面的舉措。

您可以在個別專案如 translatewiki.net 和安裝內容翻譯功能的專案中試用 MinT 功能,也可以直接在測試實例中使用。

關於 MinT

MinT 採用多個機器翻譯模型提供語言翻譯。 初始版本使用的模型如下:

MinT 支援 200 多種語言,包括 50 多種其他同類服務不支援的語言(其中有 27 種維基百科尚未支援的語言)。 您可以進一步了解 MinT 的最初發布版本,並在服務的簡介頁面查看一些常見問題。

技術細節

翻譯模型使用 OpenNMT Ctranslate2 程式庫進行了效能最佳化,以減少 GPU 加速需求。 這讓組織與個人更容易建立並執行自己的實例。 如需更多詳情,請查看原始程式碼API 明細以及測試樣品

MinT 提供執行多個翻譯模型的平臺。 為了支援各種情況,語句分節語言偵測、內容的預先/後期處理以及富文字支援等方面優先於純文字模型開發。

參與其中

歡迎隨時在討論頁面分享意見回饋。 Phabricator 收集了各種改進計畫(更多資訊),您可以回報錯誤行為提供改進方案、追蹤工作進度並分享個人觀點。 您也可以在下方查看成品的狀態情報

譯者用 MinT

在行動裝置使用 MinT 翻譯

在維基媒體生態系統中,掌握多門語言的使用者經常透過翻譯的手段貢獻內容。 機器翻譯可以為使用者提供有參考價值的譯文,經審核與改進後即可實際使用。 編輯流程中提供了語言團隊開發的翻譯工具,可整合各種機器翻譯服務的譯文,提升翻譯效率。 MinT 功能推出後,自然要將其與這些工具整合,以進一步增強輔助功效。 支援 MinT 功能的有以下幾個專案:

維基百科讀者用 MinT

讀者可以從維基百科上了解的話題數量與資訊量取決於他們掌握的語言。 機器翻譯可以協助人們在他們不掌握的語言中了解感興趣的話題。

此方案探討了如何在維基百科條目中呈現 MinT 的機器翻譯協助,以便:

  • 讓讀者可以從其他語言中進一步了解感興趣的話題
  • 明確區分社群建立的內容和自動產生的內容。
  • 鼓勵使用者在能力範圍內為社群建立更多內容。

語言團隊此時正在進行專案的設計與研發工作,尋找在維基百科上呈現 MinT 的最好方式,並對服務在此場合的實用進行技術探索。

擴大 MinT 適用範圍

研究先前的方案有助於改善與加強系統。 目前,MinT API 僅支援維基媒體產品。 系統就緒後,我們將考慮擴大支援範圍。 为社群提供能够以創新方式使用的服務亦是为社区提供強大助力。 未來,這裡會介绍更多有关擴大 MinT 適用範圍方面的新举措。 屆時,請隨時設定並試驗自己的 MinT 实例。

狀態情報

2024年2月

2024年1月

2023年12月

2023年11月

2023年10月

  • Launched the Language Identification service to automatically detect in which language is written a given text. The service supports the detection of 201 languages, and anyone can access the API to use the service or read the model card for more details. Machine Learning team completed the last checks after deploying to LiftWing and evaluating that the service can "easily withstand a high amount of traffic".
  • Basic support for rich text translation by supporting transferring of markup to apply styling such as words in bold from the source text into the equivalent ones in the machine translation (which lacks format since translation models operate with plain-text).
  • Completed the process to enable MinT for languages with no Wikipedia yet . Translation models in MinT support 25 languages for which there is no Wikipedia. These can be tested in MinT's test instance for speakers of those languages to assess quality, and ensures that translation tools are well-equipped once wikis are created for those languages (as it has been the case with the recent graduation of Fon Wikipedia out of incubator).
  • Completed the process to enable MinT for closely-related languages based on Community input . For some languages where machine translation is not available, Wikipedia editors have asked to have access to machine translation in Content Translation using a related language instead of having no support at all. With this enablement translators of Gan (gan) Wikipedia will have machine translation based on the traditional script variant of Chinese as a starting point.
  • Analysis of translation activity on 55 languages for which MinT provides machine translation for the first time shows how (a) translations have increased 2X since MinT is available, and (b) deletion rates have not increased. Activity levels for these 55 wikis changed from ~500 translations/month, to 1K+ translations/month after MinT was enabled. For example, a recent peak of 2.15K translations were published in August 2023 when MinT was available for those languages, which is a significant increase from 225 translations in August 2022 when MinT was not available for them.
  • Better visibility of translation quality by including a tag in translations where unedited machine translation is close to the limits. This will facilitate analysis about translation quality and limits.

2023年9月

2023年8月

2023年7月