Structured Data Across Wikimedia/Image Suggestions/ja

このページでは経験を積んだ利用者対象の画像のおすすめ機能について、進行中の設計と構築の作業をまとめます. このツールはS DAW チームが開発担当です（SDAW＝Structured Data Across Wikimedia、ウィキメディア横断構造化データ）

この作業の基盤に先行する構造化データ関連の「画像を追加」プロジェクト内の一部があります. ただし、ここでは焦点を変え、経験を積んだ寄稿者の作業手順を向上させます. なかでも、特定の記事または記事群を編集済みもしくはウォッチ中の利用者に着目する根拠は、おそらくその分野に専門性を備えた人々である点、その記事（記事群）の改善に関心がある点を推測するからです.

複数のコミュニティから既に初期段階のフィードバックを受け、初回のテスト段階に入った当プロジェクトでは通知の使い方を実験中で、ウィキペディアの記事に利用できるかもしれない画像があると利用者に伝えようとしています.

背景
The image suggestion UI is a key component of the SDAW project, aimed at developing systems for structured data across all Wikimedia projects.

Images are key for illustrating concepts and helping people understand subjects. Considering that Wikimedia Commons contains 65 million images, we believe that it is possible to make Wikipedias substantially more illustrated with Commons images. We believe that Structured Data can open an enduring pipeline for enriching content between Commons and Wikipedia. This will help us, in turn, to grow and diversify contributors, improve content for readers, and narrow gaps in content.

Despite that, in many Wikipedias more than half of the articles have no images. This is mainly due to the complexity of the current workflow of adding media and making connections between content and images. We want to make this process easier.

Where are we starting from
As we already said, the tool will build on the work already done for the “Add an image” structured task project. The Image Suggestion API, built by the Platform Engineering team, combines the results of the Image Suggestions Algorithm and MediaSearch to provide suggestions for images matches to unillustrated articles, using the following approach:
 * 1) Look at the Wikidata item for the article.
 * 2) If it has, suggest that image.
 * 3) If it has, suggest an image from the category.
 * 4) Look at the articles about the same topic in other language Wikipedias. Suggest a lead image from those articles.
 * 5) Search MediaSearch on Commons for the title of the article, which combines traditional text-based search with structured data from Commons and Wikidata. If an image ranks high enough in the results, suggest that image.

In initial tests, the combined algorithms can suggest images for up to 40% of all unillustrated articles on a given Wikipedia. We are currently doing further testing of the accuracy of the matches. Also, the Android and Growth teams are testing ideas that use the Image Suggestion API to allow newcomers to add images to articles via the suggested tasks interface.

We are also experimenting with adding the results from the Image Suggestions Algorithm directly to MediaSearch. We hope that will simplify the process technically and improve MediaSearch results. See on Phabricator for more information.

What we want to do
The project is currently experimenting with an approach based on notifications. The goal is to embed the suggestions in the user’s existing Wikipedia activities through weekly notifications, thus increasing the likelihood they will review such suggestions and add selected images as part of their current editing workflow. Contributors can choose to edit via Wikitext or Visual Editor, and can review the image and the article information in the notification.

Tentative workflow
The following is the current tentative workflow we defined for this stage of testing. Wherever appropriate, there is a link to the related task on Phabricator.
 * 1) Notifications are sent weekly to all users who have at least 500 edits at a predefined day and time (e.g. every Monday at 08:00 AM UTC), all across the globe → see  on Phabricator
 * 2) Notification includes a link to user’s preferences to allow users to opt out of the notifications → about opting-out, see  on Phabricator
 * 3) * “Image Suggestions” options would be added to bottom of the list of users’ opt-in/opt-out notifications
 * 4) Suggestions are selected randomly from the list of matched recent images to unillustrated articles, using the algorithms explained above
 * 5) Users are selected randomly from a group of users that:
 * 6) * have at least 500 edits on the project
 * 7) * did not opt-out of the notification
 * 8) * have received up to 2 image notifications in a given week
 * 9) The tool will check the user’s watchlist for articles edited in the last 30 days
 * 10) * If the user has already received a notification for the article ID, the tool skips to the next article
 * 11) * Otherwise, it matches one suggestion and sends the notification
 * 12) If image matches remain, then the tool checks for other articles on users watchlist
 * 13) The notification process will be generated weekly, until image matches are exhausted or applicable users are exhausted
 * 14) * Notifications for a particular article-image match notification will only be shown once to a particular user
 * 15) * The same match can be sent to multiple users to review (except in the case the image has been inserted)

User experience
Based on the information provided in the notification, the user can:
 * 1) go through their normal image addition workflow (e.g. choose to insert the image with wikitext or Visual Editor insert flow)
 * 2) * in this case, just the opportunity to review the match will be provided to the user - no additional help or feature will be provided
 * 3) click on “Review image” in the notification
 * 4) * this will redirect the user to the image on Commons
 * 5) click on “Review article” in the notification
 * 6) * this will redirect the user to the article on Wikipedia

Ideas for the future
The following bullet list lists all the ideas that are out of scope of the current test stage, but might be worked upon in the future:
 * Suggestions to users who have uploaded images on Commons that match articles
 * Suggestions given in other ways besides via notifications (e.g. suggestions in the image search dialogue in VisualEditor)
 * Illustrated articles
 * Section level image suggestions
 * A tool to help users add images to the article
 * A landing page that lets users review multiple suggestions at once
 * Limiting notifications only to users who have a history of adding images to articles in the last 30 days

Metrics and analytics
We are planning on measuring the following metrics, to analyse the performance of the current testing and determine whether the tool is successful:
 * 1) Number of notifications sent
 * 2) Number of image suggestions notifications opened (measuring engagement with notifications)
 * 3) Number of opt-outs (low number of opt-outs = notifications are useful)
 * 4) Number of images suggested that are added to the matched article within a month of receiving the notification
 * 5) Number of suggested images not reverted from their matched article (low revert rate = good quality of suggested matches)

私たちが 避けたい こと

 * 便利じゃないからと心をつかまない、放置されるツールを作らないこと
 * Annoy users with too many notifications
 * Encourage edits that will overwhelmingly be reverted
 * Encourage edits that go against existing policies and/or practises (NPOV, original research...)
 * Encourage edits that introduce additional bias in the article

フィードバック
プロジェクトへのご意見、ご感想、ご指摘はいつでも歓迎します. 皆さんの発案に特に関心がありますので、皆さんがトークページに書く投稿に期待しており、特に、以下の未解決の疑問をどう考えるか、 ぜひ声を聞かせてください.
 * 1) What is your opinion about the approaches outlined above?
 * 2) Should we be helping editors with image placement location?
 * 3) How can we help users make sure they are following the conventions of a particular wiki when choosing and placing an image?
 * 4) How can we help users add appropriate captions?
 * 5) How can we help users add appropriate alt-text?

聞き取り調査

 * 2021年8月：第1回フィードバック受け付け (コメント依頼文のウィキペディア版（RfC）、同ウィキメディアコモンズ版)

画像のおすすめツールって何？
ウィキメディア横断構造化データプロジェクト（SDAW）では、画像のおすすめを肝心な要素として位置づけていて、その時点で画像を載せていない記事がある場合に、利用者が画像やメディアを簡便に追加できるよう目指しています. （SDAW＝Structured Data Across Wikimedia. ）

よく似た「画像の追加」ツールが Growth チームから出ていて、このツールはそれと重複しませんか？
技術的にはそうなります. 同一のアルゴリズムを採用するという意味ですが、使用目的は次のように、同じではありません.
 * 一方で「画像を追加」ツールは新規参加者ならびに経験値が少ない利用者を対象に設定、画像を記事に追加した鳩がほとんどない人を想定しています.
 * 他方で「画像のおすすめ」ツールはもう少し経験を積んだ利用者を想定し、画像やメディアを既存の記事に追加した方がある人たちです（つまり編集回数500回超の人. ）

ウィキデータとかコモンズが保存する構造化データと、画像のおすすめツールはどう連携しますか？
このツールはウィキペディアの画像がない記事に使えるかもしれないメディアを探す手順として、ウィキデータの情報と、コモンズ保有の構造化データを突き合わせています.

少し深掘りするなら、ツールは対応するウィキデータ項目を読みに行って、そこに画像が登録されているかどうか（ウィキデータの属性はプロパティ P18）、または構わずカテゴリが紐付けしてあるか（同じくプロパティ P373）チェックします. どちらにも使える画像がない場合はウィキペディアのその記事の別の言語版を調べに行き、代表的な画像を探します. ツールはさらに、コモンズの MediaSearch 機能で記事題名をキーワードに検索し、もし一致度の高さに満足できる画像がヒットすると、ツールはその画像を選び出します.

この通知のしくみは？
システムは毎週、利用者ごとにウォッチリストの登録記事を照会し、画像が載っていない記事を2件ずつ、選択します. 記事と画像のマッチング案は、利用者に1回だけ表示します. 選択の基準は、過去30日以内に編集が1回以上、行われた記事を優先します.

利用者個人が特定の記事について通知を受けると、ツールは一覧の次の記事の処理を始めます. 通知プロセスは週単位で実施、一致する画像がなくなる、またはマッチングする利用者がゼロになるまで反復処理されます.

一致する画像の選び方は？
記事との一致は、ウィキメディアコモンズに収載した画像に限定して検討します. ローカル単位で保存する画像を通知の対象に加える計画は、今のところありません.

通知を受信オフにするには？
通知を（今後は）受信したくない場合、 特別:GlobalPreferences→「通知」タブ→画像のおすすめ（Image suggestions）に関する項目の横の◽︎を押して白色に変えます. 留意点：設定の変更はまず画像のおすすめ機能を採用したプロジェクトページに進み、次にグローバルな個人設定を開いてください（直近で対応するウィキペディアの言語版はカタロニア語、フィンランド語、インドネシア語、ノルウェー語、ポルトガル語、ロシア語を把握. ）