Jump to content

MinT

From mediawiki.org
This page is a translated version of the page MinT and the translation is 100% complete.


MinT(ミンティー:Machine in Translation)は、オープンソースのニューラル機械翻訳モデルに基づく機械翻訳サービスです。 当サービスはウィキメディア財団のインフラ上にホストされており、他の組織がリリースしたオープンソース・ライセンスの翻訳モデルを実行します。 無料の知識エコシステムのインフラにとって公開の機械翻訳サービスは鍵となります。 このページでは、サービスを拡大し、この翻訳装置をより広く使えるようにするための始め方を記録します。

MinT は、コンテンツ翻訳translatewiki.net のようなプロジェクトの一環として試用したり、テストインスタンスで直接試用したりできます。

MinT イニシアティブの概要

機械翻訳は様々な文脈で有用になりえます。 より多くの製品が異なる目的のためにMinTを使用すると、これらの異なる文脈を区別することが便利になります。 こうすることで、利用者がバグを報告するときに修正が必要な場所がより明確になります。

  • MinT Service. オープンソースのニューラル機械翻訳モデルを実行するバックエンドサービス。
    • MinT test instance. 異なる翻訳モデルを試す基礎的なインターフェース。
  • MinT for Translators. MinTサービスをコンテンツ翻訳やTranslate拡張機能のような他の機械翻訳サービスをサポートするツールと、それを統合する翻訳装置。
    • MinT Client for Content Translation. コンテンツ翻訳で利用可能な機械翻訳サービスの内のひとつとしてMinTサービスを提示するクライアント。
    • MinT Client for Translate extension. Translate 拡張機能で利用可能な機械翻訳サービスのひとつとして MinTサービスを提示するクライアント。
  • MinT for Wiki Readers. 読者がウィキ上で他の言語によるコンテンツを機械翻訳を使用して読めるようにする製品。

それぞれのMinT翻訳装置についてより詳しくは以下をご覧ください。

参加する

フィードバックを提供するには協議ページに投稿してください。 改善計画はPhabricator で補足され詳細情報)、間違った挙動を報告したり機能強化を提案したり、タスクの進捗を追跡したり、それに関する自分なりの視点を共有したりできます。 完了した作業については、以下の更新情報もご参照ください。

MinTサービス

MinT サービスの設計では訳文を複数の機械翻訳モデルから提供します。 現在のところ、以下のモデルを使用しています:

  • NLLB-200 - メタの研究チームが手がけた最新モデル No Language Left Behind project です。 このモデルは200 言語にわたる翻訳に対応し、その中には他の翻訳サービスがサポートしていない言語も含まれます。
  • OpusMT - ヘルシンキ大学が開発したOPUS (Open Parallel Corpus) projectはフリーライセンスの多言語コンテンツをまとめて翻訳モデルOpusMT 翻訳モデル(オーパスMT)を訓練しています。 誰でもさまざまなプロジェクトに参加してデータをOPUSプロジェクトに提供すると、翻訳の質向上に手軽に貢献できます。 例えば、利用者がウィキペディアの記事の翻訳を作成するときにコンテンツ翻訳拡張機能を使うと、公開した翻訳のデータはモデルの次バージョンの翻訳品質を改善するための新しいリソースとして取り入れられます。 利用者が手軽に貢献するもう一つの方法は、Tatoebaを使って訳文を提供することです。
  • IndicTrans2 - IndicTrans2 プロジェクト20言語以上のインド語群をサポートする翻訳モデルを提供します。 これらのモデルはインド工科大学マドラス校の研究グループ、 AI4Bharat@IIT Madrasによって開発されました。
  • Softcatalà - Softcatalà はデジタル製品でカタルーニャ語の使用を改善することを目的とする非営利団体です。 Softcatalà 翻訳プロジェクトの一環として、10言語とカタルーニャ語の間の翻訳をする翻訳サービスで使用されている翻訳モデルをリリースしました
  • MADLAD-400. MADLAD-400 is a multilingual machine translation model by Google Research that supports 419 languages.

MinT は200言語以上をサポートし、そのうち 70 言語以上が他のサービスではサポートされていません(ウィキペディアがまだない27言語を含む)。 詳細はMinTの初期リリースについてご覧いただき、いくつかのよくある質問はサービスの概要ページをご確認ください。

技術的な詳細

GPUアクセラレーションが必要にならないように、翻訳モデルは OpenNMT Ctranslate2 library を使ってパフォーマンスについて最適化されています。 これによって組織や個人が独自のインスタンスをより簡単に構築し実行できるようになります。 詳細は以下をご確認ください:

MinT は複数の翻訳モデルを実行するためのプラットフォームを提供します。 さまざまな取り組みをサポートするためには、文のセグメント化言語検出、コンテンツの前/後処理などの側面があり、それゆえリッチ形式サポートが平文テキスト・ベースのモデルに加えて開発されました。

テストインスタンス

MinT テストインスタンスは様々な翻訳モデルを試すための基礎的なインターフェースです。 選択した言語のペアで、翻訳モデルが複数利用可能なときには好きなモデルを選択してコンテンツを翻訳できます。 これにより様々なコミュニティが自分たちの言語がどのくらいモデルでサポートされているのか確認できます。 このインスタンスはテスト目的のため、パフォーマンスと可用性は他のMinTベースの製品に比べて減少している可能性があります。 MinT テストインスタンスの利用可能状態を確認できます。

翻訳者向けのMinT

モバイル翻訳でMinTを使う

翻訳は多言語利用者にとってウィキメディアエコシステムで貢献する一般的な方法です。 機械翻訳は利用者がレビューして改善するための有用な一次翻訳を提供できます。 言語チームは翻訳をワークフローの面で支援するツールを開発しました。このツールはプロセスを加速するために様々な機械翻訳サービスを統合できます。 MinTが利用可能になったら、 これらのツールを統合するのが影響力を増大させるための論理的な次のステップでした。 MinTは以下のプロジェクトで利用可能です:


ウィキ読者向けのMinT

読者がウィキペディアやその他のウィキから学ぶことができる話題と情報の量は、読者が話す言語に依存します。 機械翻訳は興味のある話題について自分の言語でコンテンツが手に入らないときに人々を助けることができます。

この取り組みは以下のような方法でどうウィキペディア記事にMinTからの機械翻訳支援を表面化するか模索しています:

  • 読者が興味のある話題について他言語からもっと学べるようにします。
  • 自動的に生成されたコンテンツをコミュニティが作成したものと明確に区別します。
  • 可能であればコミュニティが作成したコンテンツにアクセスして投稿することを推奨します。

現時点では言語チームは、この取り組みについてはリサーチおよびデザインに基づく初期実装に取り組んでいます。 データとコミュニティの意見に基づいた学習によって、この取り組みの次のステップが決まります。

さらに広く利用可能なMinT

前のイニシアティブにおける取り組みはシステムを洗練し固める助けになります。 今のところ、 MinT API はウィキメディア製品でのみ利用可能です。 システムの準備ができた時点で、より広く公開することを検討します。 革新的な方法でコミュニティが利用できるサービスを提供することで非常に強力なツールとなりえます。 MinT をより広く利用可能にするための新しいイニシアティブは将来ここに取り込まれる予定です。 それまでの間、独自の MinT インスタンスを自由に構成して実験してください。

免責事項

  1. Accuracy of MinT’s Translations - MinTによって生成される翻訳の正確性はばらつきがあります。 翻訳は完全に正確ではなかったり、元のコンテンツの文脈で意図されていた意味が常に伝わっているわけではなかったりします。 ウィキメディアは自動的に翻訳されたコンテンツの正確性や妥当性について声明や保証をしていません。
  2. Limitation of Liability - ウィキメディア、その関連団体、および従業員は、直接的、間接的、偶発的、懲罰的、または結果的損害(のれん、使用、データ、または、そこから生じるその他の無形の損失、またはMinTの使用に関連して、またはMinTで生成された翻訳に対する損害賠償を含みますが、これに限定されません)については責任を負いません。
  3. Creative Commons Compliance - MinTによって生成された翻訳は元のコンテンツに準拠する適切なクリエイティブ・コモンズ・ライセンスの下で二次的著作物とみなされます。 利用者は翻訳されたコンテンツを利用するときには、適用されるクリエイティブ・コモンズ・ライセンスの規約に従わなければなりません。
  4. Terms of Use and Privacy Policy - MinTの使用はウィキメディアの利用規約およびプライバシーポリシーに準拠します。

更新情報

2024年2月

2024年1月

2023年12月

2023年11月

2023年10月

2023年9月

2023年8月

2023年7月