Help:検索エンジンによるインデックス化の制御

From mediawiki.org
This page is a translated version of the page Help:Controlling search engine indexing and the translation is 54% complete.
PD 注意: このページを編集すると、編集内容が CC0 のもとで公開されることに同意したと見なされます。詳細はパブリック・ドメインのヘルプ ページを参照してください。
このページの古い版の一部は、CC BY-SA ライセンスのもとで取り込まれました。 新しい編集のみがパブリックドメインと見なされます。
PD

MediaWiki では、通常、ページがインデックスされるという既定の状態であるため、検索エンジンのインデックスを制御するという目的で、さまざまな方法が利用者に提供されています。一般的には「noindexing」と呼ばれます。 これらの方法のほとんどは、検索エンジンに特定のページをインデックスしないようにする noindex HTML メタ タグを使用することに依存しています。 このタグや robots.txt ファイルに関して、特に既にインデックスされたコンテンツの削除などについては、個々の検索エンジンによって尊重されるかどうかは異なり、理論上は完全に無視される可能性もあります。

制御の方法は以下の通り:

  1. MediaWiki ソフトウェアの設定による、名前空間全体の制御
  2. MediaWiki:Robots.txt を使用した、ページのクラスごとの制御
  3. 個々のページに __NOINDEX__ マジックワードを直接的にまたはそれを含むテンプレートを使用して追加することによるページの制御
  4. 特定の状況で使用される標準テンプレートに __NOINDEX__ マジックワードを追加することによるページの制御

Indexing policy set by one of the means above only apply for the page content only. Views that are a part of MediaWiki interface (such as the page history, historical page version or most special pages) are never indexed, irrespective of the settings set above.[1]

ソフトウェアの設定とrobots.txt

ソフトウェアの設定

特定の名前空間全体を noindex 化するには、$wgNamespaceRobotPolicies を使用できます。

同時に、__NOINDEX__ を特定の名前空間で無効にすることもできます。 This is controlled by the MediaWiki software setting $wgExemptFromUserRobotsControl , which defaults to $wgContentNamespaces .

$wgArticleRobotPolicies can be used to specify different policies for individual pages.

robots.txt による noindex

System message MediaWiki:Robots.txt can be used to noindex pages. Unlike the software settings, it can be directly edited.

NOINDEXマジックワード

個別のページ

Individual pages can be noindexed by adding the __NOINDEX__ magic word into that page. This can be done either directly or using a template designed to contain the magic word (eg {{NOINDEX}}); this can make use of the keyword easier to track.

Pages with the keyword are tracked by MediaWiki, and automatically categorized in a tracking category. The category name is determined by MediaWiki:Noindex-category.

Standard template noindexing

Standard templates can include the __NOINDEX__ keyword, thereby noindexing pages to which the templates are applied. A template used to flag a particularly sensitive type of page can then automatically noindex it.

INDEXマジックワード

個別のページ

Individual pages can override namespace noindexing by adding the __INDEX__ magic word into that page. Pages with the keyword are tracked by MediaWiki, and automatically categorized in a tracking category. The category name is determined by MediaWiki:Index-category. However, INDEX does not override noindexing via MediaWiki:Robots.txt. It does override $wgArticleRobotPolicies .

現在の問題点

  • phab:T24251Magic word to remove page from internal MediaWiki search results

脚注