WikiWho

From mediawiki.org
This page is a translated version of the page WikiWho and the translation is 100% complete.

WikiWho(ウィキフー)というサービスは、コンテンツの永続性アルゴリズムを利用して執筆者の帰属を示します。 最初の開発はカールスルーエ技術研究所(Karlsruhe Institute of Technology)ならびにライプニツ社会科学研究所(GESIS – Leibniz Institute for the Social Sciences)が手がけました。 2021年8月には ウィキメディア・クラウドサービスのインフラに移し、保守と開発の続行をウィキ教育財団コミュニティ技術チームが担当しています。

技術的な詳細

WikiWho の機能の中核は、特定のウィキページに関してどの文字列を誰が記入し/または除去し/または再度記入したのか、どの改編でどのトークンのレベルで実施したのか、それまでの変更履歴をすべて処理して 調べます。 つまり、(例えば単語など)トークン単位で加筆、除去、再加筆の履歴が閲覧できるわけです。

背景で動作するアルゴリズムは当初、WWW 2014の論文に解説があり、かなり改版頻度が高い記事でも正解率95%という 広範な評価を紹介しています。 最新のコードバージョンは GitHub で確認してください。

アプローチ方法としてまとめるなら、改編のたびに段落や文やトークン要素を階層的に入れ子構造に分解し、コンテンツのすべての改編をこのように構築した完全なグラフを得て、要素の出現を追跡しています。 現状ではウィキ文に展開し、理論上は文がどんな種類であっても動作可能です(とはいうもののトークン付与や管理の規則は適応が必要かもしれません)。

WikiWho algorithm example
トークンのメタデータを生成する仕組み

この方法なら追跡は – 個別のトークン単位で –最初の加筆も除去も再加筆も、それが発生した特定版とともに可能になります。 するとそれらの改編と対応する編集者名、タイムスタンプその他の情報が推量できます。 また個別のトークンには固有の識別 ID が割りふってあり、同じ文字列が文中の異なる位置に配置されていたら2件のトークンを識別できます。

導入済みのウィキ群

WikiWho を応用したツール

外部リンク