ORES

From MediaWiki.org
Jump to: navigation, search
This page is a translated version of the page ORES and the translation is 100% complete.

Other languages:
English • ‎italiano • ‎polski • ‎português do Brasil • ‎русский • ‎中文

ORES/ɔɹz/, Objective Revision Evaluation Service,客观修订评估服务)是一个具有机器学习即服务并由评分平台团队维护的为维基媒体项目提供的网络服务和API。该系统为自动化关键的维基工作而设计——例如破坏的检测和删除。当前ORES生成的两种一般类型的分数是基于“编辑质量”和“文章质量”。

ORES是一个后端服务,它并不会直接提供一个使用分数的方式。如果您要使用ORES分数,请见使用ORES分数的工具列表。如果您的维基仍不支持ORES,请参见如何申请支持

编辑质量[edit]

ORES编辑质量流。从“互联网”不断到达维基百科的编辑的描述图,之前质量为“未知”,而经过ORES后被分为“良好”、“待查”和“破坏”标签。

维基媒体开放项目的一个最关键的问题是检查可能存在破坏性的贡献(“编辑”)。同时也需要判定(不经意间造成破坏的)善意贡献者并给予其帮助。该模型的目的是让从Special:RecentChanges摘要的过滤工作更加容易。我们提供两个级别的编辑质量预测模型支持——基本和高级。

基本支持[edit]

假定最具破坏性的编辑会被回退,而具有建设性的编辑不会被reverted(回退),我们可以根据一个维基的编辑历史(和回退历史)来建立模型。这个模型易于建立,但仍面临很多回退编辑并非由于破坏的问题。为了解决这个问题,我们建立了一个基于不良词汇的模型

  • reverted -- 用于预测一个编辑是否可能最终被回退。

高级支持[edit]

除了假设以外,我们可以让编辑者训练ORES来使其决定哪些编辑确实是damaging(破坏性的),而哪些编辑应该是goodfaith(善意的)。这需要社区志愿者额外的工作,但能对编辑质量提供更精准更细微的预测。很多工具只有在高级支持可用时才能在一个目标维基工作。

  • damaging -- 预测一个编辑是否是破坏性的
  • goodfaith -- 预测一个编辑是否是善意保存的


文章质量[edit]

英文维基鉴定表。该截图是由WP 1.0机器人生成的鉴定表。

百科全书文章的质量是维基人们核心的关注点。新页面必须被检查审核来保证垃圾信息、破坏和攻击性的文章不会存留在维基上。对于那些通过初审的文章,一些维基人会定期评估文章质量,但这需要极大的劳动力并且评估结果往往会过期。

质量审核支持[edit]

有问题的文章和草稿越快被移除越好。审核新创建的页面可以花费大量的精力。就如同编辑中反破坏的问题一样,机器预测有助于优先关注最有问题的新页面。根据管理员删除页面时(见记录表)写下的留言,我们可以训练一个模型来用于预测需要快速删除的页面。中文维基的快速删除方针请参见维基百科:快速删除方针。对于中文模型,我们使用G3 “纯粹破坏”(也适用于人身攻击)、G11 “广告宣传”G12 “无来源且负面的生者传记”

  • draftquality -- 预测一篇文章是否需要被快速删除(广告/破坏/攻击/OK)

等级评估支持[edit]

对于初审通过的文章,一些规模较大的维基百科会定期用大致相当于英语维基百科1.0(“wp10”)的标准评估文章质量。这些评定非常有用,因为有助于衡量进步过程并抓住错过的机会(比如低质量的文章)。然而保持这些评定的时效性很有难度,所以覆盖范围也不一致。这种情况下wp10机器学习模型就派上用场了。通过训练一个模型来模仿人类评估文章质量的过程,我们可以让计算机自动评估每篇文章和每个编辑。该模型已经被用于维基项目分流重估工作并探索提升文章质量的编辑机制。

  • wp10 -- 预测一篇文章或草稿的(维基百科1.0类)评估等级

支持列表[edit]

下表显示ORES在各维基的支持状态和可用模块。如果您没有看到您的维基在此列表内,或者您的维基没有您想使用的模块,您可以申请支持

该ORES支持列表显示正在部署的功能(In progress)和已完成部署的功能(Done)。如果要为您的维基部署功能,请参见申请支持

context edit quality article quality
damaging goodfaith reverted wp10 draftquality
arwiki Arabic Wikipedia In progress In progress Yes check.svg
bnwiki Bengali Wikipedia Yes check.svg
cawiki Catalan Wikipedia In progress In progress
cswiki Czech Wikipedia Yes check.svg Yes check.svg Yes check.svg
dewiki German Wikipedia In progress In progress Yes check.svg
elwiki Greek Wikipedia Yes check.svg
enwiki English Wikipedia Yes check.svg Yes check.svg Yes check.svg Yes check.svg Yes check.svg
enwiktionary English Wiktionary Yes check.svg
eswiki Spanish Wikipedia In progress In progress Yes check.svg
eswikibooks Spanish Wikibooks In progress In progress Yes check.svg
etwiki Estonian Wikipedia Yes check.svg Yes check.svg Yes check.svg
fawiki Persian Wikipedia Yes check.svg Yes check.svg Yes check.svg
fiwiki Finnish Wikipedia Yes check.svg Yes check.svg Yes check.svg
frwiki French Wikipedia In-progress In-progress Yes check.svg Yes check.svg
hewiki Hebrew Wikipedia Yes check.svg Yes check.svg Yes check.svg
huwiki Hungarian Wikipedia In progress In progress Yes check.svg
idwiki Indonesian Wikipedia In progress In progress Yes check.svg
itwiki Italian Wikipedia In progress In progress Yes check.svg
kowiki Korean Wikipedia In progress In progress Yes check.svg
nlwiki Dutch Wikipedia Yes check.svg Yes check.svg Yes check.svg
nowiki Norwegian Wikipedia In progress In progress Yes check.svg
plwiki Polish Wikipedia Yes check.svg Yes check.svg Yes check.svg
ptwiki Portuguese Wikipedia Yes check.svg Yes check.svg Yes check.svg
rowiki Romanian Wikipedia In progress In progress Yes check.svg
ruwiki Russian Wikipedia Yes check.svg Yes check.svg Yes check.svg Yes check.svg
svwiki Swedish Wikipedia In progress In progress Yes check.svg
tawiki Tamil Wikipedia Yes check.svg
trwiki Turkish Wikipedia Yes check.svg Yes check.svg Yes check.svg
ukwiki Ukrainian Wikipedia In progress In progress Yes check.svg
urwiki Urdu Wikipedia In progress In progress In progress
viwiki Vietnamese Wikipedia In progress In progress Yes check.svg
wikidatawiki Wikidata Yes check.svg Yes check.svg Yes check.svg


API使用[edit]

ORES提供具象状态传输的API服务来动态获取每个编辑的分数信息。若要了解如何使用该API,请参见 https://ores.wikimedia.org

如果需要用此服务查询大量的编辑,建议每次以50个编辑来批量请求,如下所述。可以接受最多4个并行请求。

查询示例: http://ores.wmflabs.org/v3/scores/enwiki/?models=draftquality|wp10&revids=34854345|485104318