Help:Управление поисковой индексацией

From MediaWiki.org
Jump to navigation Jump to search
This page is a translated version of the page Help:Controlling search engine indexing and the translation is 68% complete.
Other languages:
English • ‎español • ‎français • ‎русский • ‎中文 • ‎日本語
PD Внимание: Когда вы редактируете эту страницу, вы соглашаетесь на передачу своего вклада по лицензии CC0. Узнать об этом подробнее можно на странице справки.
PD

There are a variety of ways in which MediaWiki allows users to attempt to control search engine indexing, commonly termed "noindexing", as the default position is that pages are indexed. Most of the methods rely on using the noindex HTML meta tag, which tells search engines not to index certain pages. Respecting the tag, or the robots.txt file, especially in terms of removing already indexed content, is up to the individual search engine, and in theory they may be ignored entirely.

Способами управления являются:

  1. Controlling an entire namespace, via MediaWiki software settings
  2. Controlling classes of pages, via MediaWiki:Robots.txt
  3. Controlling individual pages by adding the __NOINDEX__ magic word into them, either directly or using a template made to contain it.
  4. Controlling pages by adding the __NOINDEX__ magic word into standard templates used in certain situations.

Настройки системы и robots.txt

Настройки системы

Всё пространство имён может быть сделано неиндексируемым через $wgNamespaceRobotPolicies .

В то же время, __NOINDEX__ может быть отключен в определённых пространствах имён. Это управляется с помощью параметра настроек системы MediaWiki $wgExemptFromUserRobotsControl , который по умолчанию имеет значение $wgContentNamespaces .

$wgArticleRobotPolicies может использоваться для назначения отдельным страницам различных политик.

Исключение из индексации с помощью Robots.txt

Системное сообщение MediaWiki:Robots.txt может быть использовано для исключения страниц из индексации. В отличие от настроек системы, его можно отредактировать напрямую.

Волшебное слово NOINDEX

Отдельные страницы

Individual pages can be noindexed by adding the __NOINDEX__ magic word into that page. This can be done either directly or using a template designed to contain the magic word (eg {{NOINDEX}}); this can make use of the keyword easier to track.

Pages with the keyword are tracked by MediaWiki, and automatically categorized in a tracking category. The category name is determined by MediaWiki:Noindex-category.

Стандартный шаблон исключения из индексации

Standard templates can include the __NOINDEX__ keyword, thereby noindexing pages to which the templates are applied. A template used to flag a particularly sensitive type of page can then automatically noindex it.

Волшебное слово INDEX

Отдельные страницы

Individual pages can override namespace noindexing by adding the __INDEX__ magic word into that page. Pages with the keyword are tracked by MediaWiki, and automatically categorized in a tracking category. The category name is determined by MediaWiki:Index-category. However, INDEX does not override noindexing via MediaWiki:Robots.txt. It does override $wgArticleRobotPolicies .

Существующие проблемы

  • phab:T24251 – Magic word to remove page from internal MediaWiki search results