Structured Data Across Wikimedia/ja

ウィキメディアの一貫した構造化データ (SDAW＝Structured Data Across Wikimedia) というプロジェクトは、ウィキ文で記したページのコンテンツを構造化する役に立ち、機械認識の対象として関連付けをもたらして（機械可読）、同時に閲読、編集、検索の利便性を高め、インターネット環境において、またウィキメディアのプロジェクト相互で便利にしようとするものです.

利用者にとってはウィキメディアのプロジェクト間でコンテンツのつながりを把握する手段であり、閲読者はウィキメディアの知識の生態系に踏みこむ深さが増え、寄稿者にはまるでウィキデータ式の汎用性を得たように情報を複数のプロジェクトに広めることができます. 当プロジェクトはまた試行の場であり、コンピュータ援用の編集ツールを使って世界のどこにいる編集者の誰もが、より簡便に、また支障なく編集活動ができることを目指します.

背景
このプロジェクトは、以前のStructured Data on Commons (SDC) の助成金の一部として、コモンズ上で完了した同様の開発のフォローアップであり、Sloan Foundation からの3年間の助成金が一部提供される予定です. SDC に取り組む中で、すべてのコンテンツに対してより高度なメタデータと、よりよい検索結果を提供するための API が必要であることを認識しました.

このプロジェクトは、3 つの高い目標を掲げています:


 * 1) To allow machines to recognize Wikimedia content and to suggest relationships to other Wikimedia content. We are exploring this first via the image suggestion project.
 * 2) To design a way to structure articles and pages to enable new content formats – such as content served in smaller, easily digestible pieces that is more accessible for readers to use and share.
 * 3) To give Wikimedia users a more inviting, more efficient way to search and find content, building on MediaSearch, and exploring new ways to improve search across Wikipedias using Structured Data.

何が変わったか
当プロジェクトの目的は柔軟な新システムを設計して試作版を作ることで、近い将来、メタデータをサポートする需要ができたとき、必要なものをすべて受け入れるように目指します.

この作業にあたり、開発の主眼となる以下のプロジェクト3件を識別しました.


 * 1) 画像の提案 の対象は経験を積んだ編集者で、ウィキペディアの記事に挿絵を加えやすくする機能です.
 * 2) 見出し単位のメタデータ は別称見出し単位の主題 といい、ウィキペディアの特定の記事にある見出しの内容を説明する機能です.
 * 3) 検索の改善 では構造化したコンテンツを利用して、ウィキペディアでコンテンツを探そうとする利用者に向けて、親しみやすく効率の良い方法の提供を目指します.

画像の提案
The Image Suggestion UI aims at developing systems for structured data across all Wikimedia projects.

This work will build on the work already begun as part of the “Add an image” structured task project. However, its focus will be shifted towards improving the processes for experienced contributors. In particular, we will target users who have edited or watched a particular article or set of articles, since they are likely to be experts in the topic and to have interest in seeing that article(s) improve.

見出し単位の主題
The Section Topics project will identify sections in an article and create topics accordingly for those sections, drawing on several elements, such as:


 * an algorithm that detects Wikidata items based on the section’s blue links (which will be developed in partnership with the Structured Data, Research, and Data Platform teams);
 * the ability to automatically identify sections in an article (which will be developed in partnership with the Structured Data and Data Platform teams).

One of the first use cases we envisioned for section topics will be section-level image suggestions, which will use the blue-links algorithm and section identification infrastructure above, and be delivered both via the newcomer experience and via notifications for experienced contributors. This will build upon the work done on image suggestions and will be developed in partnership with the Structured Data, Data Platform, Research, Search, Android, and Growth teams.

These elements will not change, nor impact the current editing experience for users. All these activities will be automatic and will not depend on any action from editors. Currently, this project is in its development phase, and there are still aspects that may require further investigation and/or feedback from users.

検索の改善
The Search Improvements project will use structured content to give users a more inviting and more efficient way to search and find content on the Wikipedias. By improving Special:Search, we want to enable users to find the information they are looking for, or that they may not have noticed, or previously come across through existing search.

We aim to identify and define incremental “special search” improvements that use structured content, to assist users in finding the content they are looking for, especially in those language wikis that have fewer articles.

私たちが 避けたい こととは？

 * 1) 利用者を置き去りにして進む
 * 2) 新しいコンテンツをあれもこれも渡して点検してくれと頼み、利用者をうんざりさせる
 * 3) ウィキメディアってやっぱりアレだよねというバイアス（判断の歪み）を増やす
 * 4) 不正行為を助ける針路を増やす
 * 5) 各種システムにいたずらに複雑さを取り込む

2022

 * First round of Image Suggestions testing on Portuguese, Russian and Indonesian Wikipedia successfully concluded.
 * Project pages updated to reflect the new current status of the initiative.

2022

 * ウィキメディアの一貫した構造化について、2年次の報告書を発行しました.
 * DPLA には SDAW 助成金がつき、画像のうち説明文がついて継承を明示したものの再利用を促進します. 詳細は DPLA のページ2022年SDAW プロジェクト告知をご参照ください. （2022 SDAW project announcement）
 * 検索の改善に関して、広く聞き取り調査を始めました（Search improvements）.

2022

 * イニシアチブの刷新、また開発の主軸となるプロジェクト3件の決定に照らし、関連のページ類を更新しました.
 * テスト対象コミュニティとして、インドネシア語版ウィキペディアが参加しました.

2022

 * 画像の提案に関した最初の試験コミュニティとなるポルトガル語版、ロシア語版のウィキペディアのコミュニティとコンタクトを確立. （Image Suggestions）

2021

 * プロジェクトは初めて試験ステージに進み、ウィキペディアの利用者に使えるかもしれない画像群をお知らせする実験として、通知機能の応用に取り組んでいます.

2021年5月 - 8月

 * 画像提案プロジェクトに関してフィードバック募集中（Image Suggestions）、個別の聞き取りとコメント募集月間 month-long RfC 実施のウィキペディア + コモンズ 4 件

2021

 * これらの発想にフィードバックを募集.
 * この発想を伸ばすため、ワイヤフレーム素案と試作版作りに取り組む.
 * この作業に適したインフラを技術意思決定フォーラム（Technical Decision Making Forum）の場で検討. をご参照ください.

2020年後半

 * MediaSearchをコモンズに組み込むには.
 * MediaSearch A/B 試験 - 2020年9月10日より同17日に実施

フィードバック
Project feedback is and will always be welcome. We are especially interested in your ideas about the extent to which you want to keep the “human-in-the-loop” throughout the topical metadata creation process. We are looking forward to hearing from you about the following open questions:


 * 1) プロジェクトに期待されることとは
 * 2) What do users expect from this project? What are the necessary actions to be addressed?
 * 3) How do you envision this metadata being used? Can you think of ways it would aid in your workflows?
 * 4) メタデータの調整
 * 5) Is moderation necessary to avoid vandalism and/or bias?
 * 6) If moderation is necessary, how can it be effectively managed?
 * 7) メタデータの追加と検証
 * 8) Do users want to be able to approve or reject metadata suggested by the automated system?
 * 9) Do users want to be able to add additional metadata beyond what is suggested by the automated system?
 * 10) Do you think it may just be sufficient for users to have the opportunity to send feedback with suggestions on how to improve the machine generated metadata, when necessary?
 * 11) 視覚化が編集にもたらす恩恵
 * 12) Do we want metadata to be visible for all users or only for certain classes of users?
 * 13) メタデータの編集が可能 なのは全ての利用者が対象か、それとも特定のクラスに分類される一部の人々だけでしょうか？

さらにまた、関連のプロジェクトに関して特定の課題を述べたフィードバックは、通常はプロジェクトのトークページに投稿をお奨めしています.
 * コモンズと検索機能 MediaSearch
 * 画像の提案

資金計画
この作業には資金の一部を アルフレッド・P・スローン財団よりとして受けており、助成対象事業「コモンズの構造化データ」の第1段階の満了後にさらに作業を充実させました.