ORES/BWDS review/ja

ここではBWDSが自動生成した用語の一覧の検索方法を概説します.

BWDSの動作の仕組み
BWDSは巻き戻しされた編集では使用頻度が高く、容認された編集ではあまり使われない用語を抽出します. つまり記事にふさわしくない悪態語や日常会話の用語"hello"、"woohoo"や"yolo"（「こんにちは」「やった!」「yolo」等）を拾う傾向があるということです. このシステムはまた、すべての編集に共通する単語も出力し、文の処理ではストップワードstopwords（検索の対象外とする機能語など）として使用します.

精度を上げるには
BWDS により自動生成された単語一覧は独自のウィキページに集まります. ハンガリー語/マジャル語を調査したときの一覧を参照してください. これらリストの精度を上げるには、誤って取り込んだ単語を削除するため、目標言語を母語とする人の手を借りる必要があります.


 * 生成した単語の一覧（Generated list）
 * 巻き戻しされた編集から抽出した単語. これをもとに下記のようにbadwordsとinformalsに分類します.


 * 多出語（Generated common words）
 * すべての編集で最も頻出する単語の一覧です. 人間による査読は不要で、作業対象から除外できます.


 * 悪態語（Bad words）
 * This list should include all of the words from list-generated that are unwelcome on any page. This would include curse words, spam and other content that would be reverted regardless of where it is inserted. Please feel free to supplement this list with additional badwords that were not detected by BWDS.


 * Informal words
 * This list should include all words that are unwelcome on article namespace but would be acceptable on talk pages. This would include words such as "hello" or "hahaha" which would be fine in discussions but not in articles. Please feel free to supplement this list with additional informal words that were not detected by BWDS.

Where do I find my BWDS list?
We have pre-generated lists for many of the larger wikis. Review our word lists to see if a list is already generated for your wiki. If it isn't, use the button below to request that lists be generated. See also how to get support.

([//phabricator.wikimedia.org/T131450 example])