ウィキメディア言語技術系/ニュースレター/2023年/10月号
言語チームがお送りする言語と国際化ニュースレターの創刊号にようこそ!
当ニュースレターは四半期ごとに(年4回)、新機能の開発や既存のさまざまな言語関連の技術プロジェクト類 およびサポート作業の改善の進捗と、コミュニティとのミーティング報告、さらにプロジェクト類への参加のアイデア類を発信していきます。
主な注目点
機械翻訳サービス(MinT)、ウィキペディアの202言語版に対応
新規の機械翻訳サービスとしてMinT を2023年6月に導入、サービスが行き届かない複数言語への対応を盛り込み、現状でウィキペディアの対応言語数は202言語版となりました。 これは重要なポイントであり、これらの言語群にとっては、初めて機械翻訳ツールが導入されたからです。 訳文の品質を高めると見込まれます。 これらのコミュニティの利用者には、Google翻訳と比べてMinTの翻訳の方がよかった、その言語で既存の翻訳ツールにしたいとの要望が聞かれました。[1]
全言語版のウィキペディアで前四半期に訳文6万7千件超を記録
前四半期(2023年7月–9月期)において、コンテンツ翻訳拡張機能は全言語版のウィキペディアで訳文6万7千件超を記録し、最も活発に使われたのはスペイン語版でした。[2] コンテンツ翻訳拡張機能は導入当初から、出力件数が183万件に達しました。 その反面、朝鮮語版ウィキペディアにおける見出し単位の翻訳機能※は7月に471件を記録、2022年5月導入当初の月間50件未満から大幅な増加を見せました。("※"=section translation feature) これは活動レベルごとに、機能導入に要する時間を示すものです。
言語ツールを改善:パーソイドとの統合、サービス更新その他
コンテンツ翻訳 拡張機能を使い、ネットワークAPIを経由せずに直接、Parsoid とのやり取りができるようになりました。Parsoid(パーソイド)とはウィキペディアの言語版(ウィキ文)を一般的なウェブ言語(HTML)にもっと似せて表示するサービスで、あるいはその逆も実現しようとしています。 この変更の趣旨とは、コンテンツ翻訳のスピード化です。
コンテンツ翻訳 拡張機能ならびに節単位の翻訳 ツールもそれぞれコンテンツの翻訳に従来よりも優れたサポートを適用しました - ウェブブラウザのセッション群が変わって翻訳の草案を保存できるようになった点、翻訳済みのコンテンツの分量を把握できる進捗バーの表示、翻訳元言語を変更して続きを翻訳するなどです。
コンテンツ翻訳 システムでは長い間、機械翻訳サービスの1つYoudao (ユーダオ)を採用してきました。 ほとんど利用者がいないことから、これはすでに使用停止になっており、他の同類のサービスが利用できます。 これは管理の時間と労力削減に役立つはずです。 しかしながら、同じ言語群に対応した他の機械翻訳サービス群 も引き続き、利用可能です。
MediaWiki 言語拡張バンドル の新しいバージョンとして、専門家の評価を受け、多言語機能を備えたMediaWiki拡張機能一式をリリースしました。 これら拡張機能に加えた更新点の総覧は、バージョン2023.04のリリースノート をご参照ください。
翻訳対象ページについて利用者調査から得た洞察
メディアウィキの機能に翻訳対象ページというものがあり、編集者がウィキページをマークアップして他言語に翻訳できるようにします。この機能を使うと、多言語でウィキページ類を新規に立項することも可能です。しかしながら問題もあります。使い方にかなりコツがある点と、システムの裏まで知り尽くした上級利用者を主な対象とする点です。
“ | 翻訳拡張機能はよくできているし、あれこれ欠点はあるけれど、それでも良いと思う
|
” |
—David |
言語チームの設計調査担当は最近、この機能を使おうとした利用者がどんな困りごとに直面するのか研究しました。関心のあった指標として、翻訳対象ページに取り組んで新規項目の立項や既存の記事の更新がきちんとできる人を増やすこと、技術的な知識があまりない人にも使いやすくすること。結果として発見した知見は、調査報告書を参照してください。
“ | 最優先課題は、翻訳者が費やす時間をきちんと無駄なく活用しているかどうか常に確かめることです。
|
” |
—Alice |
マレーシアの先住民族語1件の話者を支援
サマ・バジャウ諸語というマレーシアの先住民族言語に対して技術的サポートをメディアウィキに追加したばかりです。これによりこの言語の話者の皆さんは、ウィキメディアのさまざまなウェブサイト※で記事ページならびにソフトウェアを、母語に翻訳できるようになりました。("※":訳注=プロジェクト群)
コミュニティの会合とイベント
- 初の言語コミュニティの会合を2023年11月17日(金曜)16:00–17:00(UTC)に設定しました。出席希望の皆さんはリンクを押して事前登録してください。
- Santhosh さんが第10回アジア翻訳ワークショップ※で講演しました。内容は、どのようにして全ての人が無料で、多言語で機械翻訳を使えるようにするべきかというものでした。("※":the 10th Workshop on Asian Translation。)
ご参加ください
- 技術系のタスクをお探しの場合は、さまざまなウィキメディアPhabricatorの言語プロジェクトのリポジトリ類を開き、まだ誰も担当に名乗り出ていないが簡易なタスクを探してはいかがでしょうか。
- 記事ページ、インタフェースのメッセージ文の編集や翻訳に使うツールをお探しの場合は、Translatewiki.netでコンテンツ翻訳拡張機能ならびにSpecial:Translateの翻訳ツールをお使いください。これらのツールは他言語版のコンテンツを扱う作業に役立つよう意図されたものです。
- フィードバックは言語ツールのトークページに投稿してください。
次号をお楽しみに! 当ニュースレターの購読はこちら。
脚注
- ↑ MinT:サービスが行き届かない言語をオープンソースの機械翻訳で支援
- ↑ https://superset.wikimedia.org/superset/dashboard/p/yxXBlewrG8R/ (アクセスはウィキメディアの職員アカウントに限定)