Help:Content translation/Translating/Translation quality/ja

翻訳版を作成するには、公開前に内容の校正が欠かせません. 当該の原文の意味を取り違えていないこと、また訳出した言語で自然に読めるかどうか確認しなければなりません. 先に機械翻訳にかけると翻訳作業のスピードアップに役立つ最初のコンテンツ〔訳注：一次翻訳〕は用意されますが、ツール利用者にはそのコンテンツを十分に再検討し編集するよう求められています.

翻訳者が一次翻訳を適切に編集できるよう、異なるメカニズムを用意しました. 翻訳編集機能により利用者がどの程度、一次翻訳を修正したか記録し、複数の限度に照らして公開を防止するか、利用者に警告を表示して内容をさらに吟味するよう促します.

機械翻訳をたくみに操る利用者に対し、ツールはこの手順で翻訳機能を提供し、再検討が足りない質の低い翻訳の作成を防止できます. 前述の限度の有効性の詳細は、各言語のニーズに適応させる調整法、ツールを使って作成したコンテンツの質の評価法を含め下記をご参照ください.

制限を設けて一次翻訳の再検討を呼びかける
コンテンツ翻訳は自動翻訳が提供する一次翻訳に、利用者が加えた修正の割合を測定します. この方法は一次翻訳の翻訳において加筆・削除もしくは書き換えられた文字数をシステムに把握させます. これらの測定値は異なる2段階で取得します. 単文単位と訳文全体の2レベルです. どちらのレベルにも異なる制限が設定され、下記に詳細を示します.

訳文全体の制限
全文の 99% 超を機械翻訳のまま使おうとすると、公開できません. この制限は明らかに不正行為だとわかるものをブロックする方策です. 翻訳機能に単に文章を入れて、一次翻訳をまったく編集しないまま利用者が公開しようとしても防止します. 下記の説明のとおり、この制限は言語版単位で調整できます.

単文単位の制限
単文単位で一次翻訳に加えた修正の割合も測定されます. 特定の段落にある一次翻訳のままの部分が 80% 超の場合、問題のある段落とされます (もしくは翻訳原文からコピーした内容を使うのが当然の場合、変更しない部分が 60% 超の場合. )

翻訳エディタは問題があると見られる単文単位で警告を表示し、利用者にその編集を促します. 場合によっては、利用者がそのまま訳文を公開できますが、そのページは吟味していない翻訳として追跡カテゴリに追加され、コミュニティの再評価を待つことになる可能性があります. それを除くと、利用者は訳文の公開を認められません.

下記は利用者にコンテンツ翻訳の結果を公開させるかどうか校了する条件の一部です (なかには開発中のものを含みます. )


 * 問題のある段落の数. 問題のある段落が50件超あると、利用者は訳文を後悔できません. 問題のある段落が50件より少ない場合、利用者は訳文を後悔できる場合がありますが、訳文に問題のある段落が10件から49件のあいだだと、コミュニティが再検討できるように、吟味していない翻訳の可能性があるとして追跡カテゴリに加えられます.
 * 以前に翻訳が削除された. 過去30日間に翻訳を削除された利用者が対象で、問題を繰り返さないように、制限はより厳格に設定します. その場合、問題のある段落10件超で公開ができず、同様に9件以下で吟味していない翻訳の可能性があるものの追跡カテゴリに追加されます.
 * 利用者の確認. 利用者が段落を解決済みとマークすると、利用者がその訳文の状態を吟味した印として、厳格さがゆるめの閾値を設定できます. もし段落に未編集の警告が表示されたのに利用者が解決済みとマークした場合は、より厳格さの低い閾値を適用します (解決済み部分の 95% 以下が機械翻訳もしくは原文の内容を転記した部分が 75% 以下の場合).  これにより、機械翻訳が想定以上に良質だった場合を容認することができ、なおかつコンテンツ翻訳機能の悪用の可能性を防止できます (利用者の確認済み処理を鵜呑みにしないなど).

制限の影響を受けないコンテンツ
コンテンツの中には、大幅な編集を想定しないものがあり、それれは上記の制限の対象外です. 非常に短い節見出しや出典、あるいは出典一覧はチェック対象から除外されます. そうしないと、出典部分の書籍の題名など翻訳しないものまで警告の対象になるのでは、利用者が誤解しやすくなります.

制限の調整
上記に説明した制限により一般的な仕組みは提供されるものの、個別のウィキ固有のニーズにあわせて調整する必要があります. 最初の評価に基づき、機械翻訳による一次翻訳に加えるべき修正の量は、言語対にもよりますが 10% から 70% と幅があります. あるウィキでは規定の制限では厳しすぎて、不要なノイズを発生させたり、完璧に有効な翻訳の公開を妨害する可能性があります. その他のウィキで規定の制限がゆるすぎて、きちんと編集しないまま翻訳を公開できてしまうかもしれません.

閾値の調整により、個別のウィキのニーズに制限の強弱をさまざまに適合させることができます. 制限をきちんと調整するには、それぞれの言語を母語とする人日とのフィードバックが不可欠です. 翻訳を作成したり評価したりするときに、現在の制限がうまく気脳していないと判断された場合は、ぜひ皆さんのフィードバックを投稿していただき、こちらで調整の改善を探らせてください.

閾値の調整に関するフィードバックをする場合、訳例をいくつか作るようお勧めします (もしそのテスト版を通常のコンテンツとして公開する必要がないなら公開先の選択肢を確認してください. ) ご使用の言語で制限が有効かどうかテストするには、次の条件を意識することをお勧めします.


 * 両方の場合の検討. 翻訳において訳文が十分に編集されていない部分と同時に、編集が行き届いた部分でも制限が有効かどうか、どちらも検討します. この方法は、ちょうどよい制限に調整しやすくします.  片方の問題だけ検討するのでは、閾値を反対方向に強めすぎる傾向があります.
 * Check different contents. Content in a wiki is very diverse, and machine translation may work much better for some cases compared to others. For example, content full of numeric data or technical names may require less editing by users than content with more descriptive text. Make sure to test with different articles, making translations of different lengths and involving different types of content.
 * Prepare to iterate. Adjusting the thresholds is an iterative process. It may require to make a custom adjustment to the thresholds or improve the general approach. In any case, after each change further testing may be needed to verify the improvements.

Adjusting the limits in collaboration with editors has proven to be effective. For example, initial results show that the Indonesian community has reduced significantly the number of problematic translations by restricting the publication of translations with more than 40% of unmodified machine translation. There is no automatic tool that is infallible, and these limits are not an exception.

The process of content review by the community is still essential, but these limits provide communities with tools to reduce the number of translations they have to focus on, making the review process much more effective. Please share your feedback and we can explore how to better adjust them.

未編集かもしれない翻訳を追跡する
「cx-unreviewed-translation-category」いう名称の追跡カテゴリを利用すると、コミュニティにとって、推奨される制限を超過したコンテンツを含んだまま公開された記事が見つかりやすくなります.

このカテゴリを探すには、それぞれのウィキでは追跡カテゴリ一覧を見てください. そのカテゴリにある記事は、公開を防止する制限に適合するものの、想定よりも編集が足りない段落を含んだまま公開されました. 例としてインドネシア語版のカテゴリにある記事に含まれる機械翻訳は 40% 以下ですが、機械翻訳のまま編集していない段落を 80% 含んでいます.

翻訳品質の測定
コンテンツの品質評価の自動化は簡単ではありません. 削除率を目安にすると、生成されたコンテンツで編集者のコミュニティによって削除されなかったものは、その程度の質は備えていると推定できます. 削除率の分析によると、翻訳により作成された記事はゼロから書き起こした記事と比較すると、削除率が比較的低いのです. このことから、ほかの方法で記事を作成するよりも翻訳に対し、高い率で参加に制限を設けることは実際的ではないとも示唆されます.

コンテンツ翻訳機能を使った翻訳を公開するとcontenttranslation 編集タグが付き、「最近の更新」その他のツールを用いると、コミュニティにとってコンテンツ翻訳ツールを使った翻訳に集中できるようにしてあります. その上、公開された翻訳に関するデータならびに機械翻訳利用率の統計値は公開して誰でも解析できるようにしてあります.

利用者体験のその他の制限


ウィキにより質の低い翻訳作成を減らす方策として、利用者の権利によって翻訳に追加の規制を加えているところがあります. たとえば英語版ウィキペディアでは自動承認された利用者に制限し、英語版ウィキペディアで編集500回以上の経歴がないと、記事の翻訳が認められません. 編集初学者にも もしくは 名前空間に翻訳を公開することはでき、その後、記事名前空間に記事を移動することができます.

以上は、このページで説明する制限法ができる以前の話で、これらは、質の高い翻訳作成を促すお勧めの方法ではありません.

作成されるコンテンツに考慮しない制限を設ける前に、上記に説明したとおり、未編集のコンテンツを制限する手順を検討してください. その制限は質の低い翻訳予防のためいくらでも厳格にでき、編集者が良質な翻訳を作成して公開する道を残すことができます.