Manuel:generateSitemap.php

From mediawiki.org
This page is a translated version of the page Manual:GenerateSitemap.php and the translation is 91% complete.
Outdated translations are marked like this.

Détails

Le fichier generateSitemap.php est un maintenance script qui génère un sitemap pour une installation de MediaWiki. Les sitemaps sont des fichiers qui permettent aux robots des moteurs de recherche (comme googlebot) de parcourir plus efficacement un site web (à condition que le robot prenne en charge le protocole sitemap).

Par défaut, le script génère un fichier d'index de carte du site et une carte de site compressée avec gzip pour chaque espace de noms avec du contenu. Voir #Options pour une liste d'options que on peut donner au script.

Vous pouvez devoir préparer une tâche cron pour mettre à jour la carte du site automatiquement.

Pour des instructions générales sur l'utilisation des scripts de maintenance de MédiaWiki, voir Scripts de maintenance .�

Options

--help

affiche les options disponibles pour generateSitemap.php

--fspath=<path>

Le chemin du système de fichier dans lequel sauver, par ex. sitemapt. Toutefois, notez que ce répertoire doit être consultable en ligne

--identifier=<identifier>

L'identifiant de site à utiliser pour le wiki, $wgDBname par défaut.

--urlpath=<prefix>

L'URL relative au domaine qui pointe vers --fspath, par ex.
/sitemap/
Si spécifié, est ajouté en préfixe des noms de fichiers dans l'index sitemap.
Avant MédiaWiki 1.32.0 ce paramètre devrait contenir le nom de l'hôte et le protocole. Toutefois, depuis MédiaWiki 1.32.0 le contenu de ce paramètre sera ajouté au paramètre --server, donc il ne doit contenir ni le protocole ni le nom de l'hôte. Ceci est un changement de dernière minute non annoncé dans les RELEASE-NOTES.'

--server=<server>

Le protocole et nom d'hôte à utiliser dans les URLs, par ex.
https://en.wikipedia.org
Ceci est parfois nécessaire car la détection de nom de serveur peut échouer dans les scripts de ligne de commande et ne renvoient que "localhost" ou "my.servername" dans les fichiers xml.
Si défini, la valeur de $wgCanonicalServer remplacera la valeur de cette option dans tous les fichiers sitemap sauf dans le fichier index sitemap.

--compress=[yes|no]

Si il faut compresser les fichiers sitemap. Le paramètre par défaut est yes.

--skip-redirects

Si cette option est ajoutée les redirections sont ignorées er donc non affichées dans le sitemap. Ceci est recommandé puisque Google peut se plaindre des redirections. Toutefois, la configuration par défaut est de ne pas ignorer les redirections.

Exemple

Créer un sitemap pour Google Webmaster Tools:

mkdir sitemap

Ensuite :

Version de MediaWiki :
1.40
php maintenance/run.php generateSitemap --memory-limit=50M --fspath=/path/to/examplecom/sitemap/ --identifier=example.com --urlpath=/sitemap/ --server=https://www.example.com --compress=yes --skip-redirects
Versions de MediaWiki :
1.32 – 1.39
php maintenance/generateSitemap.php --memory-limit=50M --fspath=/path/to/examplecom/sitemap/ --identifier=example.com --urlpath=/sitemap/ --server=https://www.example.com --compress=yes --skip-redirects
Version de MediaWiki :
1.31
php maintenance/generateSitemap.php --memory-limit=50M --fspath=/path/to/examplecom/sitemap/ --identifier=example.com --urlpath=https://www.example.com/sitemap --server=https://www.example.com --compress=yes --skip-redirects

Ceci va créer un index sitemap stocké à path/to/examplescom/sitemap/sitemap-index-example.com.org.xml qui pointe à un fichier xml compressé pour chaque espace de noms, par exemple /path/to/examplecom/sitemap/sitemap-example.com-NS_0-0.xml.gz pour l'espace de noms articles.

Ceci ne signifie par que votre sitemap peut maintenant être trouvé automatiquement! Vous devrez alors fournir le lien vers l'index de sitemap au site d'exploration (exemple: Yandex ou Google), c'est-à dire https://www.example.com/sitemap/sitemap-index-example.com.org.xml.�

Sinon, vous pouvez rendre ceci trouvable par tous les navigateurs en ajoutant un lien v ers l'index sitemap dans le répertoire root de votre site par exemple :

ln -s /sitemap/sitemap-index-example.com.org.xml sitemap.xml

Lier un sitemap.xml de niveau supérieur fonctionne également si vous choisissez d'utiliser la Wayback Machine. sitemap submitter sur votre propre site.

Les domaines en caractères non latins doivent utiliser Punycode.

Paramètres de configuration associés

Version de MediaWiki :
1.13
  • $wgSitemapNamespaces : Tableau d'espaces de noms pour lesquels générer un sitemap Google, ou faux si il faut en générer pour tous les espaces de noms. Le paramètre par défaut est faux
Version de MediaWiki :
1.19
  • $wgSitemapNamespacesPriorities : Priorités d'espaces de noms personnalisés pour les sitemaps. Ceci devrait être une correspondance entre les identifiants d'espace de noms et leur priorité associée. La paramètre par défaut est faux.