Help:Управление поисковой индексацией

From mediawiki.org
This page is a translated version of the page Help:Controlling search engine indexing and the translation is 59% complete.
PD Примечание: Редактируя эту страницу, вы соглашаетесь на передачу своего вклада по лицензии CC0.
Подробнее — в проекте Помощь с общественным достоянием.
Некоторые старые изменения для этой страницы были импортированы под лицензией CC BY-SA. Только новые вклады находятся в общественном достоянии (ОД).
PD

There are a variety of ways in which MediaWiki allows users to attempt to control search engine indexing, commonly termed "noindexing", as the default position is that pages are indexed. Most of the methods rely on using the noindex HTML meta tag, which tells search engines not to index certain pages. Respecting the tag or the robots.txt file, especially in terms of removing already indexed content, is up to the individual search engine, and in theory they may be ignored entirely.

Способами управления являются:

  1. Управление всеми пространствами имен через настройки программного обеспечения MediaWiki
  2. Управление классами страниц через MediaWiki:Robots.txt
  1. Controlling individual pages by adding the __NOINDEX__ magic word into them, either directly or using a template made to contain it.
  1. Controlling pages by adding the __NOINDEX__ magic word into standard templates used in certain situations.

Indexing policy set by one of the means above only apply for the page content only. Views that are a part of MediaWiki interface (such as the page history, historical page version or most special pages) are never indexed, irrespective of the settings set above.[1]

Настройки системы и robots.txt

Настройки системы

Всё пространство имён может быть сделано неиндексируемым через $wgNamespaceRobotPolicies .

В то же время, __NOINDEX__ может быть отключен в определённых пространствах имён. This is controlled by the MediaWiki software setting $wgExemptFromUserRobotsControl , which defaults to $wgContentNamespaces .

$wgArticleRobotPolicies может использоваться для назначения отдельным страницам различных политик.

Исключение из индексации с помощью Robots.txt

Системное сообщение MediaWiki:Robots.txt может быть использовано для исключения страниц из индексации. В отличие от настроек системы, его можно отредактировать напрямую.

Волшебное слово NOINDEX

Отдельные страницы

Отдельные страницы можно не индексировать, добавив на эту страницу __NOINDEX__ магическое слово. Это можно сделать либо напрямую, либо с помощью шаблона, который содержит волшебное слово (например, {{NOINDEX }}); это может упростить отслеживание использования ключевого слова.

Страницы с ключевым словом отслеживаются MediaWiki и автоматически попадают в категорию отслеживания. Название категории устанавливается MediaWiki:Noindex-category.

Стандартный шаблон исключения из индексации

Стандартные шаблоны могут включать ключевое слово __NOINDEX__, тем самым не индексируя страницы, к которым применяются шаблоны. Шаблон, используемый для отметки особенно конфиденциального типа страницы, может затем автоматически не индексировать его.

Волшебное слово INDEX

Отдельные страницы

Individual pages can override namespace noindexing by adding the __INDEX__ magic word into that page. Pages with the keyword are tracked by MediaWiki, and automatically categorized in a tracking category. The category name is determined by MediaWiki:Index-category. However, INDEX does not override noindexing via MediaWiki:Robots.txt. It does override $wgArticleRobotPolicies .

Существующие проблемы

  • phab:T24251 – Волшебное слово для удаления страницы из результатов внутреннего поиска MediaWiki

Footnotes