Help:Export/fr

Les pages wiki peuvent être exportées au format XML pour pouvoir être importées sur une autre installation de MediaWiki, ou pour être utilisées séparément, par exemple pour analyser le contenu. Voir aussi Import pour la fonction associée.

Comment exporter
Il existe au moins cinq moyens d'exporter une page :

Utiliser robot Wikipedia en python, qui ne sera pas expliqué ici.
 * Ouvrir la page Special:Export et copier le nom de la page dans la liste.
 * Utiliser le lien Special:Export/Nom de l'article
 * Utiliser le script de sauvegarde dumpBackup.php qui place toutes les pages wiki dans un fichier XML. dumpBackup.php ne marche qu'avec MediaWiki 1.5 au moins, et il faut avoir un accès direct au serveur pour lancer ce script.
 * Utiliser l'interface OAI-PMH pour récupérer régulièrement des pages qui ont été modifiées depuis un temps donné.

Par défaut, seule la version actuelle de la page est incluse. Il est possible d'avoir toutes les versions, en incluant la date et l'heure de modifications, l'utilisateur et le résumé.

De plus, il est possible de récupérer la base de données SQL ; c'est le moyen de sauvegarde utilisé jusqu'à la version 1.5, qui ne sera pas expliqué ici.

Exporter toutes les pages d'un espace de nom donné
Pour exporter toutes les pages d'un espace de nom donné, en utilisant la première méthode :
 * Ouvrir Special:Allpages et sélectionner le bon espace de nom
 * Copier le résultat dans un éditeur de texte
 * Mettre tous les noms sur des lignes séparées
 * Insérer le préfixe avant le nom, si besoin
 * Appliquer Special:Export.

Format d'export
Le format du fichier XML reçu est toujours le même. Il est codé en XML Schema selon http://www.mediawiki.org/xml/export-0.3.xsd. Ce format n'est pas destiné à être visualisé dans un navigateur Web. Ce code XML peut être sauvegardé dans un fichier, ou visualisé avec la fonction "voir le code source" du navigateur.

Les codes "<" et ">" apparaissent comme &amp;lt; et &amp;gt; pour éviter les conflits avec les balises XML ; et pour éviter les ambiguïtés, "&amp;" est codé "&amp;amp;".

Le code wiki est exporté tel quel, il n'est pas remplacé par du code XML à l'heure actuelle.

Exemple
 Titre de la page sysop 2001-01-15T13:15:00Z Machin Je n'ai qu'une chose à dire Un tas de texte ici 2001-01-15T13:10:27Z 10.0.0.2 nouveau ! Une ancienne version. Discuter:Titre de la page 2001-01-15T14:03:00Z 10.0.0.2 salut Pourquoi la page est protégée ? Je voulais la modifier...

DTD
Voici une version non officielle en DTD de ce format.

<!ELEMENT mediawiki (siteinfo,page*)>

<!ATTLIST mediawiki version CDATA  #REQUIRED xmlns CDATA #FIXED "http://www.mediawiki.org/xml/export-0.3/" xmlns:xsi CDATA #FIXED "http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation CDATA #FIXED "http://www.mediawiki.org/xml/export-0.3/ http://www.mediawiki.org/xml/export-0.3.xsd" > <!ELEMENT siteinfo (sitename,base,generator,case,namespaces)> <!ELEMENT sitename (#PCDATA)> <!ELEMENT base (#PCDATA)> <!ELEMENT generator (#PCDATA)> <!ELEMENT case (#PCDATA)> <!ELEMENT namespaces (namespace+)> <!ELEMENT namespace (#PCDATA)> <!ATTLIST namespace key CDATA #REQUIRED> <!ELEMENT page (title,id?,restrictions?,(revision|upload)*)> <!ELEMENT title (#PCDATA)> <!ELEMENT id (#PCDATA)> <!ELEMENT restrictions (#PCDATA)> <!ELEMENT revision (id?,timestamp,contributor,minor?,comment,text)> <!ELEMENT timestamp (#PCDATA)> <!ELEMENT minor EMPTY> <!ELEMENT comment (#PCDATA)> <!ELEMENT text (#PCDATA)> <!ATTLIST text xml:space CDATA #FIXED "preserve"> <!ELEMENT contributor ((username,id) | ip)> <!ELEMENT username (#PCDATA)> <!ELEMENT ip (#PCDATA)> <!ELEMENT upload (timestamp,contributor,comment?,filename,src,size)> <!ELEMENT filename (#PCDATA)> <!ELEMENT src (#PCDATA)> <!ELEMENT size (#PCDATA)>

Utiliser l'export XML
Il ya de nombreux outils capables de comprendre le XML exporté. Pour travailler sur un grand nombre de pages, tout peut ne pas rentrer dans la mémoire, il faut donc utiliser un décomposeur (parser).

Méthodes pour travailler avec le code XML :


 * Processing MediaWiki XML with STX
 * IBM History flow project

Voir aussi

 * Aide:Pages spéciales
 * Aide:Import