扩展:防滥用过滤器/規則格式

From MediaWiki.org
Jump to navigation Jump to search
This page is a translated version of the page Extension:AbuseFilter/Rules format and the translation is 82% complete.

Outdated translations are marked like this.
Other languages:
English • ‎dansk • ‎français • ‎português do Brasil • ‎русский • ‎मराठी • ‎中文 • ‎日本語 • ‎한국어

規則格式与类C/JAVA/Perl语言的条件式十分相近。

字符串

你可以在单引号或双引号中填写字符串常量,亦可直接填写数字变量(包括整型与浮点型)。 你可以使用\n来换行,\t為制表符,而且你还可以使用半角反斜杠来转义引号字符。

Use the + (plus) symbol to concatenate two literal strings or the values of two vars with a string value.

示例
"这是一条字符串"
'这也是一条字符串'
'虽然有单引号\',但这条字符串仍然有效'
"这是一条带有\n换行符的字符串"
1234
1.234
-123

用戶自訂變數

你可以定義自訂的變數,只要在一行中使用賦值符號:=(以;結尾)並跟隨一個條件。 這些變數可以使用字母、下劃線和數字(除第一個字符外),並且區分大小寫。 例如(來自w:Special:AbuseFilter/79):

(
	line1:="(\{\{(r|R)eflist|\{\{(r|R)efs|<references\s?/>|</references\s?>)";
	rcount(line1, removed_lines)
) > (
	rcount(line1, added_lines)
)

陣列

AbuseFilter has support for non-associative arrays, which can be used like in the following examples.

my_array := [ 5, 6, 7, 10];
my_array[0] == 5
length(my_array) == 4
string(my_array) == "5\n6\n7\n10\n" //注意:最後一個換行將在未來移除
5 in my_array == true
'5' in my_array == true
'5\n6' in my_array == true //注意:與陣列轉型為字串的方式相同,即使用換行來implode陣列。
1 in my_array == true //注意:因為「in」指令將變數轉型為字串,所以 1 在 10 中被找到且回傳 true。

注釋

您可以使用以下語法來注釋:

/* 這是一條注釋 */

算术

你可以使用基本的算术符号对变量和常量进行算术运算,语法规则如下:

  • - — 用左操作数减去右操作数。
  • + — 将左、右操作数相加。
  • * — 将左、右操作数相乘。
  • / — 用右操作数去除左操作数。
  • ** — 对左操作数求幂,幂次由右操作数指定。
  • % — 返回左操作数除以右操作数后的余数。

The type of the returned result is the same that would be returned by PHP, for which a lot of documentation may be found online. More exhaustive examples may be found in this AF parser test.

示例 结果
1 + 1 2
2 * 2 4
1 / 2 0.5
9 ** 2 81
6 % 5 1

布尔运算

你可以要求满足所有条件为真,或满足任一条件为真,或只满足任一条件为真。

  • x | y — OR – 如果两个条件中有一个或多个为真,则返回真值True。
  • x & y — AND – 如果两个条件中所有条件都为真,则返回真值True。
  • x ^ y — XOR – 如果两个条件中当且仅当一个条件为真,则返回真值True。
  • !x — NOT – 如果条件为假,则返回真值True。

示例

代码 结果
1 | 1 true
1 | 0 true
0 | 0 false
1 & 1 true
1 & 0 false
0 & 0 false
1 ^ 1 false
1 ^ 0 true
0 ^ 0 false
!1 false

简单的比较

你可以将变量与其他变量进行比较及運算,以下是语法规则:

  • <> — 如果左運算元分別小於/大於右運算元,則返回true。 Watch out: operands are casted to strings and, like it happens in PHP, null < any number === true and null > any number === false.
  • <=>= — 如果左運算元分別小於或等於/大於或等於右運算元,則返回true。 Watch out: operands are casted to strings and, like it happens in PHP, null <= any number === true and null >= any number === false.
  • ==(或=)、!= —如果左運算元分別等於/不等於右運算元,則返回true。
  • ===!== —如果左運算元等於右運算元左運算元的資料類型等於右運算元的資料類型,則返回true,只要有一個不符合,返回false。
示例 结果
1 == 2 false
1 <= 2 true
1 >= 2 false
1 != 2 true
1 < 2 true
1 > 2 false
2 = 2 true
'' == false true
'' === false false
1 == true true
1 === true false
['1','2','3'] == ['1','2','3'] true
[1,2,3] === [1,2,3] true
['1','2','3'] == [1,2,3] true
['1','2','3'] === [1,2,3] false
[1,1,''] == [true, true, false] true
[] == false & [] == null true
['1'] == '1' false[1]

內建變數

防滥用过滤器可以根据变量的名称将各种变量传送给解析器。 你可以输入这些变量的名称来访问它们,就像访问常量一样。 在过滤日志中,你还可以看到各请求的相关变量。

來自防濫用過濾器的變數

可用變數
描述 名称 資料型態 注释
動作 action 字符串 以下之一: edit, move, createaccount, autocreateaccount, delete, upload[2], stashupload[3]
用户的编辑次数 user_editcount 整數/Null 未註冊用戶為Null。
用户账户名称 user_name 字符串
"createaccount"動作時為空,請使用accountname
电子邮件地址得到确认的时间 user_emailconfirm 字符串 以YYYYMMDDHHMMSS的格式。 若電子郵件未確認則為Null。
用户账户的年龄 user_age 整数 單位為秒。 未註冊用戶為0。
用户是否被封禁 user_blocked boolean 已封禁註冊帳戶為True、未註冊用戶為$2。 Also true for edits from blocked IP addresses, even if the editor is a registered user who is not blocked. Null otherwise.
這無法區分部分封禁和全站封禁。
用户所在群组(包括隐藏群组) user_groups 字串陣列 参见Special:ListGroupRights
用户拥有的权限 user_rights 字串陣列 参见Special:ListGroupRights
页面编号 article_articleid 整数 (已弃用) 請使用page_id
页面编号 (found in the page's HTML source - search for wgArticleId) page_id 整数 理論上新建页面时为0,但这不一定可靠。 如果您需要準確的結果,使用「page_age == 0」判断是否为新建页面。 (note that it is slower, though.)
页面名字空间 article_namespace 整数 (已弃用) 請使用page_namespace
页面名字空间 page_namespace 整数 參見名字空间索引
页面年龄(以秒为单位) page_age 整数 第一次编辑之后的秒数(新页面为0) This is reliable, but it tends to be slow; consider using page_id if you don't need much precision.
页面标题(不含名字空间) article_text 字符串 (已弃用) 請使用page_title
页面标题(不含名字空间) page_title 字符串
完整页面标题 article_prefixedtext 字符串 (已弃用) 請使用page_prefixedtitle
完整页面标题 page_prefixedtitle 字符串
页面的编辑保护级别 article_restrictions_edit 字符串 (已弃用) 請使用page_restrictions_edit
页面的编辑保护级别 page_restrictions_edit 字串陣列
页面的移动保护级别 article_restrictions_move 字符串 (已弃用) 請使用page_restrictions_move
页面的移动保护级别 page_restrictions_move 字串陣列
上传文件的保护 article_restrictions_upload 字符串 (已弃用) 請使用page_restrictions_upload
上传文件的保护 page_restrictions_upload 字串陣列
创建页面的保护 article_restrictions_create 字符串 (已弃用) 請使用page_restrictions_create
创建页面的保护 page_restrictions_create 字串陣列
最后十位对该页面贡献的用户 article_recent_contributors array of strings (已弃用) 請使用page_recent_contributors
最后十位对该页面贡献的用户 page_recent_contributors 字串陣列 這通常很慢(參見#效能)。 嘗試在此之前將條件更可能被判斷為false,以避免不必要地執行此查詢。 若該頁面僅由一位使用者貢獻則為空值(不確定),最多統計100個歷史版本
贡献页面的第一位用户 article_first_contributor 字符串 (已弃用) 請使用page_first_contributor
贡献页面的第一位用户 page_first_contributor 字符串 這通常很慢(參見#效能)。[4] 嘗試在此之前將條件更可能被判斷為false,以避免不必要地執行此查詢。
對部分動作可用的變數
描述 名称 資料型態 注释
编辑摘要/原因 summary 字符串 Summaries automatically created by MediaWiki ("New section", "Blanked the page", etc.) are created after the filter checks the edit, so they will never actually catch, even if the debugger shows that they should.[5]
编辑是否被标记为小编辑(不再使用) minor_edit 字符串 停用,且對於2016到2018年間的所有項目皆被設為false。[6]
旧页面的wiki文本,在编辑之前(不再继续使用) old_wikitext 字符串 這個變數可能非常大。 盡可能考慮使用removed_lines來提高性能。
编辑后的新页面,wiki代码格式 new_wikitext 字符串 這個變數可能非常大。 盡可能考慮使用added_lines來提高性能。
编辑产生的差异 edit_diff 字符串
统一所有由编辑、预保存转换更改的差异 edit_diff_pst 字符串 這通常很慢(參見#效能)。 檢查added_linesremoved_lines可能更有效率。[7]
新页面大小 new_size 整数
旧页面大小 old_size 整数
编辑前后的大小改变 edit_delta 整数
透過檢查action === 'edit'或其他限於編輯的變數,確保要過濾的操作是編輯。 否則,edit_delta將是null,因而被認為少於其他任何數字(參見#简单的比较
编辑中加入了行,并在保存前转换 added_lines_pst 字串陣列 盡可能使用added_lines,更有效率。
编辑增加的行 added_lines 字串陣列 最後差異中所有以+開頭的行
编辑移除的行 removed_lines 字串陣列
新内容中的所有外部链接 all_links array of strings
旧内容中的所有外部链接 old_links array of strings
新内容中新增的所有外部链接 added_links 字串陣列 這通常很慢(參見#效能)。 考慮首先檢查added_lines,再檢查added_links,以減少變慢的編輯。 這遵守MediaWiki的外部連結規則 。 添加到陣列中的連結都是唯一的。 更改連結將計為1個添加和1個移除連結。
新内容中移除的所有外部链接 removed_links 字串陣列 這通常很慢(參見#效能)。 考慮首先檢查removed_lines,再檢查removed_links,以減少變慢的編輯。 這遵守MediaWiki的外部連結規則 。 添加到陣列中的連結都是唯一的。 更改連結將計為1個添加和1個移除連結。
新页面维基语言,预保存转换 new_pst 字符串
编辑后的新页面,已解析为HTML源码 new_html 字符串 這個變數可能非常大。 盡可能考慮使用added_lines來提高性能。
编辑后的新页面,去除所有标记 new_text 字符串 這個變數可能非常大。 盡可能考慮使用added_lines來提高性能。
旧页面的wiki文本,解析为HTML(不再继续使用) old_html 字符串 因效能原因而被停用。
编辑前的旧页面,去除所有标记 old_text 字符串 因效能原因而被停用。
Unix timestamp of change timestamp 字符串 使用 int(timestamp) 來取得整數以用來計算日期、時間、星期等等。
文件内容的SHA1值 file_sha1 字符串 [2]
文件大小,单位字节 file_size 整数 檔案大小,單位為位元組[2]
文件宽度(像素) file_width 整数 寬度,單位為像素[2]
文件高度(像素) file_height 整数 高度,單位為像素[2]
文件的位/颜色通道 file_bits_per_channel 整数 每個顏色通道的位元數[2]
移动目的页面的页面编号 moved_to_articleid 整数 (已弃用) 請使用moved_to_id
移动目的页面的页面编号 moved_to_id 整数
移动目的页面的标题 moved_to_text 字符串 (已弃用) 請使用moved_to_title
移动目的页面的标题 moved_to_title 字符串
移动目的页面的完整标题 moved_to_prefixedtext 字符串 (已弃用) 請使用moved_to_prefixedtitle
移动目的页面的完整标题 moved_to_prefixedtitle 字符串
移动目的页面的名字空间 moved_to_namespace 字符串
移动目标页面年龄(以秒为单位) moved_to_age 整数
移动源页面的名字空间 moved_from_namespace 字符串
移动源页面的标题 moved_from_text 字符串 (已弃用) 請使用moved_from_title
移动源页面的标题 moved_from_title 字符串
移动源页面的完整标题 moved_from_prefixedtext 字符串 (已弃用) 請使用moved_from_prefixedtitle
移动源页面的完整标题 moved_from_prefixedtitle 字符串
移动源页面的页面编号 moved_from_articleid 整数 (已弃用) 請使用moved_from_id
移动源页面的页面编号 moved_from_id 整数
移动来源页面年龄(以秒为单位) moved_from_age 整数
帐户(创建时)的名称 accountname 字符串
舊版本的內容模型 old_content_model 字符串 參見Help:更改内容模型 有關更改內容模型的資料
新版本的內容模型 new_content_model 字符串 參見Help:更改内容模型 有關更改內容模型的資料


來自其他擴充功能的變數

描述 名称 資料型態 數值 由誰加入
该用户的全域用户组 global_user_groups 数组 CentralAuth
结构式讨论版块的页面ID board_articleid 整数 (已弃用) 請使用board_id StructuredDiscussions
结构式讨论版块的页面ID board_id 整数 StructuredDiscussions
结构式讨论版块的名字空间 board_namespace 整数 參見名字空间索引 StructuredDiscussions
结构式讨论版块的标题(没有名字空间) board_text 字符串 (已弃用) 請使用board_title StructuredDiscussions
结构式讨论版块的标题(没有名字空间) board_title 字符串 StructuredDiscussions
结构式讨论版块的完整标题 board_prefixedtext 字符串 (已弃用) 請使用board_prefixedtitle StructuredDiscussions
结构式讨论版块的完整标题 board_prefixedtitle 字符串 StructuredDiscussions
翻译单元的原始文本 translate_source_text 字符串 扩展:翻译
修改是否经过Tor节点完成 tor_exit_node 布尔值 如果動作來自tor出口節點,則為true。 TorBlock
用户是否通过移动版界面编辑 user_mobile 布尔值 移動版用戶為true,否則為false。 扩展:移动前端
用户是否正使用移动应用进行编辑 user_app 布尔值 如果用戶透過移動應用程序進行編輯,則為true,否則為false。 扩展:MobileApp
用户是否正在通过维基百科零计划的免流量提供方编辑 user_wpzero 布尔值
此變數僅在過濾動作時有效。 在檢查過去編輯或批次測試時,它將總是Null。
WikimediaEvents
⧼abusefilter-edit-builder-vars-page-views⧽ article_views 整数 (已弃用) 請使用page_views HitCounters
⧼abusefilter-edit-builder-vars-page-views⧽ page_views 整数 頁面瀏覽量 HitCounters
⧼abusefilter-edit-builder-vars-movedfrom-views⧽ moved_from_views 整数 來源頁面的頁面瀏覽量 HitCounters
⧼abusefilter-edit-builder-vars-movedto-views⧽ moved_to_views 整数 目標頁面的頁面瀏覽量 HitCounters
⧼abusefilter-edit-builder-vars-is-proxy⧽ is_proxy 整数 此操作是否通過代理做出 AutoProxyBlock
⧼abusefilter-edit-builder-vars-sfs-blocked⧽ sfs_blocked 布尔值 IP地址是否使用stopforumspam.com列表來封鎖 StopForumSpam


注释

action='move',只有summaryactiontimestampuser_*變數可用。 The page_* variables are also available, but the prefix is replaced by moved_from_ and moved_to_, that represent the values of the original article name and the destination one, respectively. For example, moved_from_title and moved_to_title instead of page_title.

Since MediaWiki 1.28 (https://gerrit.wikimedia.org/r/#/c/295254/), action='upload' is only used when publishing an upload, and not for uploads to stash. A new action='stashupload' is introduced, which is used for all uploads, including uploads to stash. This behaves like action='upload' used to, and only provides file metadata variables (file_*). Variables related to the page edit, including summary, new_wikitext and several others, are now available for action='upload'. For every file upload, filters may be called with action='stashupload' (for uploads to stash), and are always called with action='upload'; they are not called with action='edit'.

Filter authors should use action='stashupload' | action='upload' in filter code when a file can be checked based only on the file contents – for example, to reject low-resolution files – and action='upload' only when the wikitext parts of the edit need to be examined too – for example, to reject files with no description. This will allow tools that separate uploading the file and publishing the file (e.g. UploadWizard or upload dialog) to inform the user of the failure before they spend the time filling in the upload details.

效能

As noted in the table above, some of these variables can be very slow. While writing filters, remember that the condition limit is not a good metric of how heavy filters are. For instance, variables like *_recent_contributors or *_links always need a DB query to be computed, while *_pst variables will have to perform parsing of the text, which again is a heavy operation; all these variables should be used very, very carefully. For instance, on Italian Wikipedia it's been observed that, with 135 active filters and an average of 450 used conditions, filters execution time was around 500ms, with peaks reaching 15 seconds. Removing the added_links variable from a single filter, and halving the cases when another filter would use added_lines_pst brought the average execution time to 50ms. More specifically:

  • Use _links variables when you need high accuracy and checking for "http://..." in other variables (for instance, added_lines) could lead to heavy malfunctioning;
  • Use _pst variables when you're really sure that non-PST variables aren't enough. You may also conditionally decide which one to check: if, for instance, you want to examine a signature, check first if added_lines contains ~~~;
  • In general, when dealing with these variables, it's always much better to consume further conditions but avoid computing heavy stuff. In order to achieve this, always put heavy variables as last conditions.

Last but not least, note that whenever a variable is computed for a given filter, it'll be saved and any other filter will immediately retrieve it. This means that one single filter computing this variable counts more or less as dozens of filters using it.

关键词

如果未明確說明,關鍵字會將其操作數轉換為字符串

常用功能中通常會包含以下特殊关键词:

  • like(或matches)— 如果左字符串能够匹配右字符串指定的通配符,则返回真值True。
  • in — 如果左字符串包含右字符串,则返回真值True。 注意: 空字符串不被包含在任何其他字串,不包含任何其他字符串(甚至不包含空字符串本身)。
  • contains類似in,但左右操作符交換位置。 注意: 空字符串不被包含在任何其他字串,不包含任何其他字符串(甚至不包含空字符串本身)。
  • rlike(或regex)和irlike — 如果左字符串能够匹配右字符串指定的正则表达式,则返回真值True(irlike是不區分大小寫)。

此系統使用PCRE。 只有PCRE_UTF8PHP修飾字u)選項被啟用。irlikePCRE_CASELESSPCRE_UTF8選項被啟用(修飾字iu)。

  • if ... then ... else ... end
  • ... ? ... : ...
  • true, false, null

示例

代码 结果 備註
"1234" like "12?4" True
"1234" like "12*" True
"foo" in "foobar" True
"foobar" contains "foo" True
"o" in ["foo", "bar"] True 由於轉換為字符串
"foo" regex "\w+" True
"a\b" regex "a\\\\b" True To look for the escape character backslash using regex you need to use either four backslashes or two \x5C. (Either works fine.)
"a\b" regex "a\x5C\x5Cb" True

函数

为了简化一些常见的操作,防滥用过滤器提供了一系列内建的函数。 它们具有相同的格式functionName( arg1, arg2, arg3 ),并可以放置在常量或变量的位置使用。 它的参数可以是常量,可以是变量,亦可以是别的函数。

函数名 描述
lcase 将第一个参数转换为小写字母并返回之。
ucase 将第一个参数转换为大写字母并返回之。
length 返回第一个参数给出字符串的长度。 如果參數是陣列,將返回元素個數。
string 转换为字符串数据类型。 如果參數是陣列,將用換行來implode。
int 转换为整数数据类型。
float 转换为浮点数据类型。
bool 转换为布尔数据类型
norm 等价于rmwhitespace(rmspecials(rmdoubles(ccnorm(arg1))))
ccnorm 规范化参数中的易混淆/相近字符,并以标准形式返回之。 A list of characters and their replacements can be found on git, e.g. ccnorm( "Eeèéëēĕėęě3ƐƷ" ) === "EEEEEEEEEEEEE".[8] 此函數的輸出總是大寫。
ccnorm_contains_any Normalises confusable/similar characters in the arguments, and returns true if the first string contains any strings from the following arguments (unlimited number of arguments, logic OR mode). A list of characters and their replacements can be found on git.
ccnorm_contains_all Normalises confusable/similar characters in the arguments, and returns true if the first string contains every strings from the following arguments (unlimited number of arguments, logic AND mode). A list of characters and their replacements can be found on git.
specialratio 返回参数中非字母字符除以所有字符的數值。
rmspecials 移除参数中特殊字符,并返回结果。 (等价于s/[^\p{L}\p{N}]//g。)
rmdoubles 移除参数中重复的字符,并返回结果。
rmwhitespace 移除空白(空格、制表符、换行符)。
count 返回指针(第一个字符串)在栈(第二个字符串)中出现的次数。 如果只给出一个参数,则默认使用半角逗号分割,并返回分割后片段的个数。
rcount count类似,但指针使用正则表达式。 Can be made case-insensitive by letting the regular expression start with "(?i)". Please note that, for simple strings, this function is roughly ten times slower than count, so use that one when possible.
get_matches MW 1.31+ Looks for matches of the regex needle (first string) in the haystack (second string). Returns an array where the 0 element is the whole match and every [n] element is the match of the n'th capturing group of the needle. Can be made case-insensitive by letting the regular expression start with "(?i)". If a capturing group didn't match, that array position will take value of false.
ip_in_range 若用户IP(第一个字符串)与指定IP段(第二个字符串)匹配,则返回true。 Only works for anonymous users. Supports both IPv4 and IPv6 addresses.
contains_any 若第一个字符串包含任何之后参数内的字符串(不限制参数数量於邏輯OR模式),则返回true。 如果第一個參數是一個陣列,它將被轉換為字符串。
contains_all Returns true if the first string contains every strings from the following arguments (unlimited number of arguments in logic AND mode). If the first argument is an array, it gets casted to string.
equals_to_any Returns true if the first argument is identical (===) to any of the following ones (unlimited number of arguments). Basically, equals_to_any(a, b, c) is the same as a===b | a===c, but more compact and saves conditions.
substr Returns the portion of the first string, by offset from the second argument (starts at 0) and maximum length from the third argument (optional).
strlen length相同。
strpos 返回第一次匹配指针(第二个字符串)时,其位于栈(第一个字符串)的位置。從第三個參數的偏移量開始(可選,預設值為0)。 当指针匹配栈的开头时,该函数会返回0,所以其可能被判斷为false。 更好的方法是使用===!==以检测是否发现。
str_replace 用替换字符串替换所有匹配的搜索字符串。 该函数有3个参数,其依次为:进行搜索的文本,搜索文本,替换文本。
rescape Returns the argument with some characters preceded with the escape character "\", so that the string can be used in a regular expression without those characters having a special meaning.
set 设定一个变量(第一个字符串)以给定值(第二个字符串),以备过滤器进一步使用。 等价语法为:name := value
set_var set相同。

示例

代码 结果 備註
length( "Wikipedia" ) 9
lcase( "WikiPedia" ) wikipedia
ccnorm( "w1k1p3d14" ) WIKIPEDIA ccnorm輸出總是大寫
ccnorm( "ωɨƙɩᑭƐƉ1α" ) WIKIPEDIA
ccnorm_contains_any( "w1k1p3d14", "wiKiP3D1A", "foo", "bar" ) true
ccnorm_contains_any( "w1k1p3d14", "foo", "bar", "baz" ) false
ccnorm_contains_any( "w1k1p3d14 is 4w3s0me", "bar", "baz", "some" ) true
ccnorm( "ìíîïĩїį!ľ₤ĺľḷĿ" ) IIIIIII!LLLLLL
norm( "!!ω..ɨ..ƙ..ɩ..ᑭᑭ..Ɛ.Ɖ@@1%%α!!" ) WIKIPEDAIA
norm( "F00 B@rr" ) FOBAR norm removes whitespace, special characters and duplicates, then uses ccnorm
rmdoubles( "foobybboo" ) fobybo
specialratio( "Wikipedia!" ) 0.1
count( "foo", "foofooboofoo" ) 3
count( "foo,bar,baz" ) 3
rmspecials( "FOOBAR!!1" ) FOOBAR1
rescape( "abc* (def)" ) abc\* \(def\)
str_replace( "foobarbaz", "bar", "-" ) foo-baz
ip_in_range( "127.0.10.0", "127.0.0.0/12" ) true
contains_any( "foobar", "x", "y", "f" ) true
get_matches( "(foo?ba+r) is (so+ good)", "fobaaar is soooo good to eat" ) ['fobaaar is soooo good', 'fobaaar', 'soooo good']


运算符的顺序

运算符通常是按从左向右的顺序运算的,但各运算符的优先级并不相同。 As soon as the filter fails one of the conditions, it will stop checking the rest of them (due to short-circuit evaluation) and move on to the next filter (except for phab:T43693). 運算顺序如下:

  1. 由半角圆括号(())括住的内容会被作为一个独立单元首先运算出。
  2. 将变量/常量转换为它们所代表的数据。(如page_namespace變成0)
  3. 调用函数(normlcase等)
  4. 一元运算符+-(定義正值或負值,例:-1234+1234
  5. 关键词
  6. 布尔反向 (!x)
  7. 求幂 (2**3 → 8)
  8. 乘法相关(乘、除、模)
  9. 加减法 (3-2 → 1)
  10. 比较 (<, >, ==)
  11. 布尔运算 (&, |, ^)

示例

  • A & B | C is equivalent to (A & B) | C, not to A & (B | C). In particular, both false & true | true and false & false | true evaluates to true.
  • A | B & C is equivalent to (A | B) & C, not to A | (B & C). In particular, both true | true & false and true | false & false evaluates to false.

Condition counting

The condition limit is (more or less) tracking the number of comparison operators + number of function calls entered.

Further explanation on how to reduce conditions used can be found at Extension:AbuseFilter/Conditions .

Exclusions

Although the AbuseFilter examine function will identify "rollback" actions as edits, the AbuseFilter will not evaluate rollback actions for matching. [9]

实用链接

註釋

  1. Comparing arrays to other types will always return false, except for the example above
  2. 2.0 2.1 2.2 2.3 2.4 2.5 檔案上傳(action='upload')的可用的變數只有user_*, page_*, file_sha1, file_size, file_mime, file_mediatype, file_width, file_height, file_bits_per_channel(最後五個變數在MediaWiki 1.27 gerrit:281503才被加入)。 所有的file_*變數對其他動作都不可用(包含action='edit')。
  3. 從MediaWiki 1.28 (https://gerrit.wikimedia.org/r/#/c/295254/)起
  4. Several filters (12) that use this variable have showed up in the AbuseFilterSlow Grafana dashboard (requires logstash access to view). 將此變數移動到過濾器的尾端似乎有所幫助。
  5. 参见phabricator:T191722
  6. 此commit起棄用,且自起停用。
  7. Some filters using this variable have showed up in the AbuseFilterSlow Grafana dashboard (example, requires logstash access). For instance, instead of using "text" in edit_diff_pst (or even edit_diff), consider something like "text" in added_lines & !("text" in removed_lines)
  8. 注意phab:T27619。 您可以使用Special:AbuseFilter/tools來評估ccnorm( "your string" )以查看轉換後的字符。
  9. T24713 - rollback not matched by AF