Extension:AbuseFilter/規則の書式

From MediaWiki.org
Jump to navigation Jump to search
This page is a translated version of the page Extension:AbuseFilter/Rules format and the translation is 63% complete.

Outdated translations are marked like this.
Other languages:
English • ‎dansk • ‎français • ‎português do Brasil • ‎русский • ‎मराठी • ‎中文 • ‎日本語 • ‎한국어

規則は、C言語、Java、Perlに類似したプログラミング言語の条件文と同様の書式です。

文字列

You can specify a literal by placing it in single or double quotes (for strings), or by typing it in as-is (for numbers, both floating-point and integer). 改行は \nタブ文字\t、引用符文字はバックスラッシュを付けて表記します。

Use the + (plus) symbol to concatenate two literal strings or the values of two vars with a string value.

"これは文字列です"
'これも文字列です'
'引用符\'がありますが、この文字列も正しいです'
"この文字列は\n改行文字を含みます"
1234
1.234
-123

利用者定義の変数

You can define custom variables for ease of understanding with the assign symbol := in a line (closed by ;) within a condition. Such variables may use letters, underscores, and numbers (apart from the first character) and are case sensitive. Example (from w:Special:AbuseFilter/79):

(
	line1:="(\{\{(r|R)eflist|\{\{(r|R)efs|<references\s?/>|</references\s?>)";
	rcount(line1, removed_lines)
) > (
	rcount(line1, added_lines)
)

配列

AbuseFilter has support for non-associative arrays, which can be used like in the following examples.

my_array := [ 5, 6, 7, 10];
my_array[0] == 5
length(my_array) == 4
string(my_array) == "5\n6\n7\n10\n" //Note: the last linebreak could be removed in the future
5 in my_array == true
'5' in my_array == true
'5\n6' in my_array == true //Note: this is due to how arrays are casted to string, i.e. by imploding them with linebreaks
1 in my_array == true //Note: this happens because 'in' casts arguments to strings, so the 1 is catched in '10' and returns true.

コメント

You can specify comments using the following syntax:

/* これはコメントです */

算術演算子

You can use basic arithmetic symbols to do arithmetic on variables and literals with the following syntax:

  • - — Subtract the right-hand operand from the left-hand operand.
  • + — Add the right-hand operand to the left-hand operand.
  • * — Multiply the left-hand operand by the right-hand operand.
  • / — Divide the left-hand operand by the right-hand operand.
  • ** — Raise the left-hand operand to the exponential power specified by the right-hand operand.
  • % — Return the remainder given when the left-hand operand is divided by the right-hand operand.

The type of the returned result is the same that would be returned by PHP, for which a lot of documentation may be found online. More exhaustive examples may be found in this AF parser test.

結果
1 + 1 2
2 * 2 4
1 / 2 0.5
9 ** 2 81
6 % 5 1

論理演算子

You can match if and only if all of a number of conditions are true, one of a number of conditions are true, or one and only one of all conditions are true.

  • x | y — OR – 条件のいずれかが true の場合に true を返します。
  • x & y — AND – 条件の両方が true の場合に true を返します。
  • x ^ y — XOR – 条件の片方のみが true の場合に true を返します。
  • !x — NOT – 条件が true ではない場合に true を返します。

コード 結果
1 | 1 true
1 | 0 true
0 | 0 false
1 & 1 true
1 & 0 false
0 & 0 false
1 ^ 1 false
1 ^ 0 true
0 ^ 0 false
!1 false

単純な比較

You can compare variables with other variables and literals with the following syntax:

  • <、​> — Return true if the left-hand operand is less than/greater than the right-hand operand respectively. Watch out: operands are casted to strings and, like it happens in PHP, null < any number === true and null > any number === false.
  • <=、​>= — Return true if the left-hand operand is less than or equal to/greater than or equal to the right-hand operand respectively. Watch out: operands are casted to strings and, like it happens in PHP, null <= any number === true and null >= any number === false.
  • == (or =), != — Return true if the left-hand operand is equal to/not equal to the right-hand operand respectively.
  • ===、​!== — Return true if the left-hand operand is equal to/not equal to the right-hand operand AND the left-hand operand is the same/not the same data type to the right-hand operand respectively.
結果
1 == 2 false
1 <= 2 true
1 >= 2 false
1 != 2 true
1 < 2 true
1 > 2 false
2 = 2 true
'' == false true
'' === false false
1 == true true
1 === true false
['1','2','3'] == ['1','2','3'] true
[1,2,3] === [1,2,3] true
['1','2','3'] == [1,2,3] true
['1','2','3'] === [1,2,3] false
[1,1,''] == [true, true, false] true
[] == false & [] == null true
['1'] == '1' false[1]

組み込みの変数

不正利用フィルターでは、さまざまな変数をその変数名でパーサーに渡せます。 これらの変数へは、リテラルを使用できるような場所に入力することでアクセスできます。 不正利用記録内の各リクエストに関連付けられた変数を閲覧することもできます。

Variables from AbuseFilter

利用できる変数
説明 名前 データ型 注記
操作 action 文字列 以下のいずれか1つ: edit, move, createaccount, autocreateaccount, delete, upload[2], stashupload[3]
利用者の編集回数 user_editcount 整数/null 匿名利用者の場合のみ null。
利用者のアカウント名 user_name 文字列
this is empty for "createaccount" action, use accountname instead.
メールアドレスを確認した時刻 user_emailconfirm 文字列 以下の形式: YYYYMMDDHHMMSS メールアドレスが確認されていない場合は null です。
利用者アカウントの登録期間 user_age 整数 秒単位。 匿名利用者の場合は 0。
利用者がブロックされているかどうか user_blocked boolean True for blocked registered users. Also true for edits from blocked IP addresses, even if the editor is a registered user who is not blocked. Null otherwise.
This doesn't differentiate between partial and total blocks.
利用者が属するグループ (明示的ではないものも含む) user_groups 文字列の配列 Special:ListGroupRights を参照してください
利用者が持つ権限 user_rights 文字列の配列 Special:ListGroupRights を参照してください
ページ ID article_articleid 整数 (廃止予定) 代わりに page_id を使用してください。
ページ ID (found in the page's HTML source - search for wgArticleId) page_id 整数 理論的には新規ページでは 0 ですが、この値は信頼できません。 新規ページ作成を識別するには、代わりに「page_age == 0」を使用してください。 (note that it is slower, though.)
ページの名前空間 article_namespace 整数 (廃止予定) 代わりに page_namespace を使用してください。
ページの名前空間 page_namespace 整数 名前空間の添字 を参照します
ページの生存期間 (秒) page_age 整数 the number of seconds since the first edit (or 0 for new pages). This is reliable, but it tends to be slow; consider using page_id if you don't need much precision.
ページ名 (名前空間を除く) article_text 文字列 (廃止予定) 代わりに page_title を使用してください。
ページ名 (名前空間を除く) page_title 文字列
完全なページ名 article_prefixedtext 文字列 (廃止予定) 代わりに page_prefixedtitle を使用してください。
完全なページ名 page_prefixedtitle 文字列
ページの編集保護レベル article_restrictions_edit 文字列 (廃止予定) 代わりに page_restrictions_edit を使用してください。
ページの編集保護レベル page_restrictions_edit 文字列の配列
ページの移動保護レベル article_restrictions_move 文字列 (廃止予定) 代わりに page_restrictions_move を使用してください。
ページの移動保護レベル page_restrictions_move 文字列の配列
ファイルのアップロード保護レベル article_restrictions_upload 文字列 (廃止予定) 代わりに page_restrictions_upload を使用してください。
ファイルのアップロード保護レベル page_restrictions_upload 文字列の配列
ページの作成保護レベル article_restrictions_create 文字列 (廃止予定) 代わりに page_restrictions_create を使用してください。
ページの作成保護レベル page_restrictions_create 文字列の配列
直前10人のページへの投稿者 article_recent_contributors array of strings (廃止予定) 代わりに page_recent_contributors を使用してください。
直前10人のページへの投稿者 page_recent_contributors 文字列の配列 This tends to be slow (see #Performance). Try to put conditions more likely evaluate to false before this one, to avoid unnecessarily running the query. This value is empty if the user is the only contributor to the page(?), and only scans the last 100 revisions
ページヘの最初の投稿者 article_first_contributor 文字列 (廃止予定) 代わりに page_first_contributor を使用してください。
ページヘの最初の投稿者 page_first_contributor 文字列 This tends to be slow (see #Performance).[4] Try to put conditions more likely evaluate to false before this one, to avoid unnecessarily running the query.
一部の操作で利用できる変数
説明 名前 データ型 注記
編集の要約や理由 summary 文字列 Summaries automatically created by MediaWiki ("New section", "Blanked the page", etc.) are created after the filter checks the edit, so they will never actually catch, even if the debugger shows that they should.[5]
その編集が細部の編集かどうか (廃止) minor_edit 文字列 Disabled, and set to false for all entries between 2016 and 2018.[6]
編集前の古いウィキテキスト old_wikitext 文字列 This variable can be very large. Consider using removed_lines if possible to improve performance.
編集後の新しいウィキテキスト new_wikitext 文字列 This variable can be very large. Consider using added_lines if possible to improve performance.
編集による変更の統一差分 edit_diff 文字列
編集による変更のUnified diff 形式差分 (pre-saveの変換前) edit_diff_pst 文字列 This tends to be slow (see #Performance). Checking both added_lines and removed_lines is probably more efficient.[7]
新しいページのサイズ new_size 整数
古いページのサイズ old_size 整数
編集による変更サイズ edit_delta 整数
Ensure that the action being filtered is an edit, either by checking for action === 'edit' or checking other edit-specific variables. Otherwise, edit_delta will be null, thus being considered less than every other number (see #Simple comparisons).
編集で追加された行 (pre-saveの変換前) added_lines_pst 文字列の配列 Use added_lines if possible, which is more efficient.
編集で追加された行 added_lines 文字列の配列 includes all lines in the final diff that begin with +
編集で削除された行 removed_lines 文字列の配列
新しい本文中のすべての外部リンク all_links array of strings
編集前のページに含まれていたリンク old_links array of strings
編集で追加されたすべての外部リンク added_links 文字列の配列 This tends to be slow (see #Performance). Consider checking against added_lines first, then check added_links so that fewer edits are slowed down. This follows MediaWiki's rules for external links . Only unique links are added to the array. Changing a link will count as 1 added and 1 removed link.
編集で除去されたすべての外部リンク removed_links 文字列の配列 This tends to be slow (see #Performance). Consider checking against removed_lines first, then check removed_links so that fewer edits are slowed down. This follows MediaWiki's rules for external links . Only unique links are added to the array. Changing a link will count as 1 added and 1 removed link.
保存前変換適用後の新しいウィキテキスト new_pst 文字列
新しい版のパース済みHTMLソース new_html 文字列 This variable can be very large. Consider using added_lines if possible to improve performance.
マークアップを除く新しい本文 new_text 文字列 This variable can be very large. Consider using added_lines if possible to improve performance.
古いウィキテキストから生成されたHTML old_html 文字列 Disabled for performance reasons.
マークアップを除く古い本文 old_text 文字列 Disabled for performance reasons.
Unix timestamp of change timestamp 文字列 int(timestamp) gives you a number with which you can calculate the date, time, day of week, etc.
ファイルのSHA1ハッシュ file_sha1 文字列 [2]
ファイルのサイズ (バイト) file_size 整数 バイト単位のファイル サイズ[2]
ファイルのピクセル単位での幅 file_width 整数 The width in pixels[2]
ファイルのピクセル単位での高さ file_height 整数 The height in pixels[2]
ファイルのカラーチャネル毎のビット数 file_bits_per_channel 整数 The amount of bits per color channel[2]
移動先のページID moved_to_articleid 整数 (廃止予定) 代わりに moved_to_id を使用してください。
移動先のページID moved_to_id 整数
移動先のページ名 moved_to_text 文字列 (廃止予定) 代わりに moved_to_title を使用してください。
移動先のページ名 moved_to_title 文字列
移動先の完全なページ名 moved_to_prefixedtext 文字列 (廃止予定) 代わりに moved_to_prefixedtitle を使用してください。
移動先の完全なページ名 moved_to_prefixedtitle 文字列
移動先ページの名前空間 moved_to_namespace 文字列
移動先ページの存在歴(秒単位) moved_to_age 整数
移動元ページの名前空間 moved_from_namespace 文字列
移動元のページ名 moved_from_text 文字列 (廃止予定) 代わりに moved_from_title を使用してください。
移動元のページ名 moved_from_title 文字列
移動元の完全なページ名 moved_from_prefixedtext 文字列 (廃止予定) 代わりに moved_from_prefixedtitle を使用してください。
移動元の完全なページ名 moved_from_prefixedtitle 文字列
移動元のページID moved_from_articleid 整数 (廃止予定) 代わりに moved_from_id を使用してください。
移動元のページID moved_from_id 整数
移動元ページの存在歴(秒単位) moved_from_age 整数
アカウント名 (アカウント作成時のみ) accountname 文字列
古い版のコンテンツ モデル old_content_model 文字列 コンテンツ モデルの変更についての情報は Help:ChangeContentModel を参照してください
新しい版のコンテンツ モデル new_content_model 文字列 コンテンツ モデルの変更についての情報は Help:ChangeContentModel を参照してください


Variables from other extensions

説明 名前 データ型 追加した拡張機能
利用者の所属グローバルグループ global_user_groups 配列 CentralAuth
Page ID of Structured Discussions board board_articleid 整数 (廃止予定) 代わりに board_id を使用してください。 StructuredDiscussions
Page ID of Structured Discussions board board_id 整数 StructuredDiscussions
Namespace of Structured Discussions board board_namespace 整数 名前空間の添字 を参照します StructuredDiscussions
Title (without namespace) of Structured Discussions board board_text 文字列 (廃止予定) 代わりに board_title を使用してください。 StructuredDiscussions
Title (without namespace) of Structured Discussions board board_title 文字列 StructuredDiscussions
Full title of Structured Discussions board board_prefixedtext 文字列 (廃止予定) 代わりに board_prefixedtitle を使用してください。 StructuredDiscussions
Full title of Structured Discussions board board_prefixedtitle 文字列 StructuredDiscussions
翻訳する単位の翻訳原文 translate_source_text 文字列 Translate
Tor 末端ノードを通じてなされた変更かどうか tor_exit_node 真偽値 true if the action comes from a tor exit node. TorBlock
利用者が携帯機器版インターフェイスで編集しているかどうか user_mobile 真偽値 true for mobile users, false otherwise. MobileFrontend
Whether the user is editing from mobile app user_app 真偽値 true if the user is editing from the mobile app, false otherwise. MobileApp
Wikipedia Zero の利用者がゼロレートのキャリア経由で編集をしているかどうか user_wpzero 真偽値
This variable is only valid when filtering an action. When examining a past edit or batch testing, it'll always be null.
WikimediaEvents
⧼abusefilter-edit-builder-vars-page-views⧽ article_views 整数 (廃止予定) 代わりに page_views を使用してください。 HitCounters
⧼abusefilter-edit-builder-vars-page-views⧽ page_views 整数 the amount of page views HitCounters
⧼abusefilter-edit-builder-vars-movedfrom-views⧽ moved_from_views 整数 the amount of page views of the source page HitCounters
⧼abusefilter-edit-builder-vars-movedto-views⧽ moved_to_views 整数 the amount of page views of the target page HitCounters
⧼abusefilter-edit-builder-vars-is-proxy⧽ is_proxy 整数 Whether this action was performed through a proxy AutoProxyBlock
⧼abusefilter-edit-builder-vars-sfs-blocked⧽ sfs_blocked 真偽値 Whether the IP address is blocked using the stopforumspam.com list StopForumSpam


注記

When action='move', only the summary, action, timestamp and user_* variables are available. The page_* variables are also available, but the prefix is replaced by moved_from_ and moved_to_, that represent the values of the original article name and the destination one, respectively. For example, moved_from_title and moved_to_title instead of page_title.

Since MediaWiki 1.28 (https://gerrit.wikimedia.org/r/#/c/295254/), action='upload' is only used when publishing an upload, and not for uploads to stash. A new action='stashupload' is introduced, which is used for all uploads, including uploads to stash. This behaves like action='upload' used to, and only provides file metadata variables (file_*). Variables related to the page edit, including summary, new_wikitext and several others, are now available for action='upload'. For every file upload, filters may be called with action='stashupload' (for uploads to stash), and are always called with action='upload'; they are not called with action='edit'.

Filter authors should use action='stashupload' | action='upload' in filter code when a file can be checked based only on the file contents – for example, to reject low-resolution files – and action='upload' only when the wikitext parts of the edit need to be examined too – for example, to reject files with no description. This will allow tools that separate uploading the file and publishing the file (e.g. UploadWizard or upload dialog) to inform the user of the failure before they spend the time filling in the upload details.

パフォーマンス

As noted in the table above, some of these variables can be very slow. While writing filters, remember that the condition limit is not a good metric of how heavy filters are. For instance, variables like *_recent_contributors or *_links always need a DB query to be computed, while *_pst variables will have to perform parsing of the text, which again is a heavy operation; all these variables should be used very, very carefully. For instance, on Italian Wikipedia it's been observed that, with 135 active filters and an average of 450 used conditions, filters execution time was around 500ms, with peaks reaching 15 seconds. Removing the added_links variable from a single filter, and halving the cases when another filter would use added_lines_pst brought the average execution time to 50ms. More specifically:

  • Use _links variables when you need high accuracy and checking for "http://..." in other variables (for instance, added_lines) could lead to heavy malfunctioning;
  • Use _pst variables when you're really sure that non-PST variables aren't enough. You may also conditionally decide which one to check: if, for instance, you want to examine a signature, check first if added_lines contains ~~~;
  • In general, when dealing with these variables, it's always much better to consume further conditions but avoid computing heavy stuff. In order to achieve this, always put heavy variables as last conditions.

Last but not least, note that whenever a variable is computed for a given filter, it'll be saved and any other filter will immediately retrieve it. This means that one single filter computing this variable counts more or less as dozens of filters using it.

キーワード

Where not specifically stated, keywords cast their operands to strings

The following special keywords are included for often-used functionality:

  • like (または matches) は、左辺が右辺のグロブパターンに一致する場合に true を返します。
  • in は、右辺 (文字列) が左辺を含む場合に true を返します。 注: empty strings are not contained in, nor contain, any other string (not even the empty string itself).
  • contains works like in, but with the left and right-hand operands switched. 注: empty strings are not contained in, nor contain, any other string (not even the empty string itself).
  • rlike (または regex)、irlike は、左辺が右辺の正規表現に一致する (含む) 場合に true を返します (irlike は大文字を区別しません (insensitive))。

このシステムは PCRE を使用します。 The only PCRE option enabled is PCRE_UTF8 (modifier u in PHP); for irlike both PCRE_CASELESS and PCRE_UTF8 are enabled (modifier iu).

  • if ... then ... else ... end
  • ... ? ... : ...
  • true, false, null

コード 結果 コメント
"1234" like "12?4" True
"1234" like "12*" True
"foo" in "foobar" True
"foobar" contains "foo" True
"o" in ["foo", "bar"] True Due to the string cast
"foo" regex "\w+" True
"a\b" regex "a\\\\b" True 正規表現を使用してエスケープ文字であるバックスラッシュを検索するには、4つのバックスラッシュまたは、2つの\x5Cを使用する必要があります。 (いずれかが正常に動作します。)
"a\b" regex "a\x5C\x5Cb" True

関数

よくある問題への対応をを容易にするために多くの関数が内蔵されています。 これらは functionName( arg1, arg2, arg3 ) のような一般的な形式で実行できます。関数は、リテラル、変数の代わりに使用できます。 引数として、リテラル、変数を渡すことができ、さらに他の関数も渡せます。

名前 説明
lcase 引数を小文字に変換したものを返します。
ucase 引数を大文字に変換したものを返します。
length 引数として渡された文字列の長さを返します。 引数が配列の場合は、その要素数を返します。
string 文字列のデータ型にキャストします。 引数が配列の場合は、改行文字で連結 (implode) します。
int 整数のデータ型にキャストします。
float 浮動小数点数のデータ型にキャストします。
bool 真偽値のデータ型にキャストします。
norm rmwhitespace(rmspecials(rmdoubles(ccnorm(arg1)))) と同等です。
ccnorm 引数に含まれる紛らわしい/よく似た字形の文字を正規化した文字列を返します。 置換対象の文字の一覧は git にあります。例: ccnorm( "Eeèéëēĕėęě3ƐƷ" ) === "EEEEEEEEEEEEE"[8] The output of this function is always uppercase.
ccnorm_contains_any Normalises confusable/similar characters in the arguments, and returns true if the first string contains any strings from the following arguments (unlimited number of arguments, logic OR mode). 置換対象の文字の一覧は git にあります。
ccnorm_contains_all Normalises confusable/similar characters in the arguments, and returns true if the first string contains every strings from the following arguments (unlimited number of arguments, logic AND mode). 置換対象の文字の一覧は git にあります。
specialratio 引数に含まれる英数字以外の文字数を全体の文字数で割ったものを返します。
rmspecials 引数からすべての特殊文字を除去し、その結果を返します。 (s/[^\p{L}\p{N}]//g と同等です。)
rmdoubles 引数から連続する文字を除去し、その結果を返します。
rmwhitespace 空白文字 (空白、タブ文字、改行) を除去します。
count 文字列haystack[9](第2引数)の中で、needle[10](第1引数)が出現する回数を返します。 引数が1つしか指定されていない場合は、カンマでそれを分割し、セグメント数を返します。
rcount count と同様ですが、こちらは needle (第1引数) に正規表現を使用します。 正規表現の先頭に「(?i)」を付けることで、大文字小文字を区別しないようにすることもできます。 Please note that, for simple strings, this function is roughly ten times slower than count, so use that one when possible.
get_matches MW 1.31+ Looks for matches of the regex needle (first string) in the haystack (second string). Returns an array where the 0 element is the whole match and every [n] element is the match of the n'th capturing group of the needle. Can be made case-insensitive by letting the regular expression start with "(?i)". If a capturing group didn't match, that array position will take value of false.
ip_in_range 利用者の IP アドレス (第1引数) が指定した IP 範囲 (第2引数) に一致する場合に true を返します。 匿名利用者に対してのみ動作します。 Supports both IPv4 and IPv6 addresses.
contains_any 第1引数が、残りの引数のいずれかの文字列に一致する場合に true を返します。(論理 OR モードでは引数の数に制限はありません。) If the first argument is an array, it gets casted to string.
contains_all 第1引数が、残りの引数のすべての文字列に一致する場合に true を返します。(論理 AND モードでは引数の数に制限はありません。) If the first argument is an array, it gets casted to string.
equals_to_any Returns true if the first argument is identical (===) to any of the following ones (unlimited number of arguments). Basically, equals_to_any(a, b, c) is the same as a===b | a===c, but more compact and saves conditions.
substr 第1引数を対象に、第2引数で指定された位置 (先頭は 0) から第3引数 (省略可能) で指定された長さだけの文字列を返します。
strlen length と同一です。
strpos Returns the numeric position of the first occurrence of needle (second string) in the haystack (first string), starting from offset from the third argument (optional, default is 0). この関数は haystack (第1引数) の文頭に needle (第2引数) があった場合に 0 を返すため、他の比較演算子が 0 を false と誤認するおそれがあります。 === または !== を使用して、存在するかどうか確認するといいでしょう。
str_replace Replaces all occurrences of the search string with the replacement string. The function takes 3 arguments in the following order: text to perform the search on, text to find, replacement text.
rescape Returns the argument with some characters preceded with the escape character "\", so that the string can be used in a regular expression without those characters having a special meaning.
set Sets a variable (first string) with a given value (second argument) for further use in the filter. 別の構文もあります: name := value
set_var set と同一です。

コード 結果 コメント
length( "Wikipedia" ) 9
lcase( "WikiPedia" ) wikipedia
ccnorm( "w1k1p3d14" ) WIKIPEDIA ccnorm output is always uppercase
ccnorm( "ωɨƙɩᑭƐƉ1α" ) WIKIPEDIA
ccnorm_contains_any( "w1k1p3d14", "wiKiP3D1A", "foo", "bar" ) true
ccnorm_contains_any( "w1k1p3d14", "foo", "bar", "baz" ) false
ccnorm_contains_any( "w1k1p3d14 is 4w3s0me", "bar", "baz", "some" ) true
ccnorm( "ìíîïĩїį!ľ₤ĺľḷĿ" ) IIIIIII!LLLLLL
norm( "!!ω..ɨ..ƙ..ɩ..ᑭᑭ..Ɛ.Ɖ@@1%%α!!" ) WIKIPEDAIA
norm( "F00 B@rr" ) FOBAR norm removes whitespace, special characters and duplicates, then uses ccnorm
rmdoubles( "foobybboo" ) fobybo
specialratio( "Wikipedia!" ) 0.1
count( "foo", "foofooboofoo" ) 3
count( "foo,bar,baz" ) 3
rmspecials( "FOOBAR!!1" ) FOOBAR1
rescape( "abc* (def)" ) abc\* \(def\)
str_replace( "foobarbaz", "bar", "-" ) foo-baz
ip_in_range( "127.0.10.0", "127.0.0.0/12" ) true
contains_any( "foobar", "x", "y", "f" ) true
get_matches( "(foo?ba+r) is (so+ good)", "fobaaar is soooo good to eat" ) ['fobaaar is soooo good', 'fobaaar', 'soooo good']


演算の順序

一般に、演算は左から右へ実行されますが、演算が解決される際の順序があります。 フィルターが条件のいずれかの処理に失敗すると、(短絡評価により) 残りの部分のチェックは停止され、次のフィルターに移ります (phab:T43693 を除く)。 評価順序は以下のようになります:

  1. 括弧 (()) で囲まれている文字列は単一の単位として評価されます。
  2. 変数やリテラルをそれぞれのデータに変換。 (例: page_namespace を 0 に変換)
  3. 関数呼び出し (normlcase、など)
  4. 単項演算子 +- (正の数値・負の数値として -1234+1234 のような形で)
  5. キーワード
  6. 論理値の反転 (!x)
  7. べき乗 (2**3 → 8)
  8. 乗算、除算、剰余
  9. 加算、減算 (3-2 → 1)
  10. 比較。 (<, >, ==)
  11. 論理演算子。 (&, |, ^)

  • A & B | C(A & B) | C と等価ですが、A & (B | C) とは等価ではありません。 具体的には、false & true | truefalse & false | true はどちらも true と等価です。
  • A | B & C(A | B) & C と等価ですが、A | (B & C) とは等価ではありません。 具体的には、true | true & falsetrue | false & false はどちらも false と等価です。

条件のカウント

The condition limit is (more or less) tracking the number of comparison operators + number of function calls entered.

Further explanation on how to reduce conditions used can be found at Extension:AbuseFilter/Conditions .

除外

Although the AbuseFilter examine function will identify "rollback" actions as edits, the AbuseFilter will not evaluate rollback actions for matching. [11]

有用なリンク

注記

  1. Comparing arrays to other types will always return false, except for the example above
  2. 2.0 2.1 2.2 2.3 2.4 2.5 ファイル アップロード (action='upload') で現在利用できるのは以下の変数のみです: user_*, page_*, file_sha1, file_size, file_mime, file_mediatype, file_width, file_height, file_bits_per_channel (最後の5種類は MediaWiki 1.27 gerrit:281503 リリースで追加されました)。 file_* のすべての変数は、ファイル アップロード以外の操作 (action='edit' を含む) では利用できません。
  3. MediaWiki 1.28 (https://gerrit.wikimedia.org/r/#/c/295254/) 以降
  4. Several filters (12) that use this variable have showed up in the AbuseFilterSlow Grafana dashboard (requires logstash access to view). Moving this variable to towards the end of the filter seemed to help.
  5. phabricator:T191722 を参照してください
  6. Deprecated with this commit and disabled with this one.
  7. Some filters using this variable have showed up in the AbuseFilterSlow Grafana dashboard (example, requires logstash access). For instance, instead of using "text" in edit_diff_pst (or even edit_diff), consider something like "text" in added_lines & !("text" in removed_lines)
  8. Be aware of phab:T27619. You can use Special:AbuseFilter/tools to evaluate ccnorm( "your string" ) to see which characters are transformed.
  9. 「haystack」は大きな文字列、概ね文章レベルの文字列を指す。英語の諺“look for a needle in a haystack”(干し草の山から針を捜す)より。干し草の山(膨大なもの)の中から針(細かなもの)を探す様を大きな文字列から小さな文字列を探す様子に喩えている。
  10. 「needle」は小さな文字列、概ね文章レベルの文字列を指す。語源は上の注釈を参照。
  11. T24713 - rollback not matched by AF