Jump to content

Help:Controlling search engine indexing/nl

From mediawiki.org
This page is a translated version of the page Help:Controlling search engine indexing and the translation is 100% complete.
PD Let op: Als u deze pagina bewerkt, gaat u akkoord met het vrijgeven van uw bijdragen onder de CC0. Zie Helppagina’s Publiek Domein voor meer informatie.
Sommige oude revisies van deze pagina zijn geïmporteerd onder de CC BY-SA licentie. Alleen nieuwe bijdragen zijn publieke domein.
PD

Er zijn verschillende manieren waarop MediaWiki gebruikers in staat stelt om te proberen de indexering van zoekmachines te controleren, gewoonlijk "noindexing" genoemd, omdat de standaardpositie is dat pagina's worden geïndexeerd. De meeste methoden zijn gebaseerd op het gebruik van de noindex HTML-metatag, die zoekmachines vertelt om bepaalde pagina's niet te indexeren. Het is aan de zoekmachine om de tag of het bestand robots.txt te respecteren, vooral als het gaat om het verwijderen van al geïndexeerde inhoud, en in theorie kunnen ze volledig worden genegeerd.

De methoden zijn:

  1. Beheer over een volledige namespace, via MediaWiki software-instellingen
  2. Classes van pagina's beheren, via MediaWiki:Robots.txt
  3. Individuele pagina's beheren door er het magische woord __NOINDEX__ aan toe te voegen, hetzij rechtstreeks, hetzij met behulp van een sjabloon dat gemaakt is om het te bevatten.
  4. Beheren van pagina's door het toevoegen van het magische woord __NOINDEX__ in standaardsjablonen die in bepaalde situaties worden gebruikt.

Het indexeringsbeleid dat is vastgesteld door een van de bovenstaande middelen is alleen van toepassing op de inhoud van de pagina. Weergaven die deel uitmaken van de MediaWiki-interface (zoals de paginageschiedenis, historische paginaversie of de meeste speciale pagina's) worden nooit geïndexeerd, ongeacht de instellingen die hierboven zijn ingesteld.[1]

Software instellingen en robots.txt

Software instellingen

Hele namespaces kunnen via $wgNamespaceRobotPolicies niet worden geïndexeerd.

Tegelijkertijd kan __NOINDEX__ worden uitgeschakeld in bepaalde namespaces. Dit wordt gedaan door de MediaWiki-software instelling $wgExemptFromUserRobotsControl , die is standaard $wgContentNamespaces .

$wgArticleRobotPolicies kan worden gebruikt om verschillend beleid voor individuele pagina's te specificeren.

Robots.txt noindexing

Systeembericht MediaWiki:Robots.txt kan worden gebruikt om noindex pagina's te maken. In tegenstelling tot de software-instellingen kan het direct worden bewerkt.

Magisch woord NOINDEX

Individuele pagina's

Individuele pagina's kunnen worden uitgesloten van het indexeren door het magische woord __NOINDEX__ aan die pagina toe te voegen. Dit kan rechtstreeks of met behulp van een sjabloon worden gedaan dat het magische woord bevat (bijv. {{NOINDEX }}); dit kan het volgen van het gebruik hiervan gemakkelijker maken.

Pagina's met dit magische woord worden door MediaWiki gevolgd en automatisch ingedeeld in een trackingcategorie. De categorienaam wordt bepaald door MediaWiki:Noindex-category.

Standaardsjabloon noindexing

Standaardsjablonen kunnen het woord __NOINDEX__ bevatten, waardoor er geen pagina's worden geïndexeerd waarop de sjablonen worden toegepast. Een sjabloon dat wordt gebruikt om een bijzonder gevoelig type pagina te markeren, kan deze automatisch uitsluiten van het indexeren.

Magisch woord INDEX

Individuele pagina's

Individuele pagina's kunnen het niet indexeren van de hele namespace voor die pagina overschrijven door het magische woord __INDEX__ aan die pagina toe te voegen. Pagina's met dit magische woord worden door MediaWiki gevolgd en automatisch ingedeeld in een trackingcategorie. De categorienaam wordt bepaald door MediaWiki:Index-category. INDEX overschrijft echter niet een opdracht om niet te indexeren die via MediaWiki:Robots.txt wordt gedaan. Het overschrijft wel $wgArticleRobotPolicies .

Huidige problemen/verzoeken

  • phab:T24251 – Magisch woord om pagina te verwijderen uit interne MediaWiki zoekresultaten

Voetnoten