Manual: Hacer una copia de seguridad de un wiki

From mediawiki.org
This page is a translated version of the page Manual:Backing up a wiki and the translation is 90% complete.

Es importante que de forma periódica hagas una copia de seguridad de tu wiki (datos y archivos). Esta página describe este proceso para un wiki típico basado en MediaWiki; probablemente quieras hacerte tus propios scripts que se encarguen de esto automáticamente, o usar una frecuencia distinta para esta tarea según el tamaño de tu wiki y tus necesidades particulares.

Help:Export is a quick and easy way to save all pages on your wiki.

Sumario

MediaWiki guarda información importante en dos lugares:

La base de datos
Las páginas y su contenido, los usuarios y sus preferencias personales, metadatos, índice de búsqueda, etc.
Sistema de archivos
Archivos de configuración del software, apariencias personalizadas, extensiones, imágenes y archivos multimedia (incluyendo los archivos borrados), etc.

Deberías poner tu wiki en modo lectura antes de empezar a crear la copia: mira $wgReadOnly . Esto garantizará que todas las partes de tu copia de seguridad sean consistentes, aunque algunas de las extensiones que tengas instaladas puedan escribir información al disco de todos modos.

Transferencia de archivos

Tendrás que elegir un método para transferir los archivos desde el servidor en el que se encuentran:

  • En el caso de información que no sea privada, puedes simplemente publicarla en archive.org y/o en un directorio dumps/ de tu servidor web.
  • SCP (o WinSCP), SFTP / FTP o cualquier otro protocolo de transferencia que elija.
  • La empresa que hospeda el wiki podría a lo mejor ofrecer una interfaz administrativa accesible con un navegador; consúltales.

Base de datos

La mayor parte de la información vital que contiene el wiki se encuentra en la base de datos, de la cual normalmente es bastante sencillo hacer una copia de seguridad. Si su wiki está actualmente fuera de línea, se puede hacer una copia de seguridad de su base de datos simplemente copiando el archivo de la base de datos.

Cuando se usa el MySQL o MariaDB backend, la base de datos se puede volcar en un archivo de script que se puede usar más tarde para recrear la base de datos y todos los datos que contiene desde cero.

MySQL

Automysqlbackup

Ver el paquete en Debian:

$ apt show automysqlbackup
[...]
Description: automysqlbackup creates backup every day, week and month for all of your MySQL database, to a configured folder. There's nothing to do but to install this package, and you'll rest assured that you have a way to go back in the history of your database.
[...]

Instalar el paquete:

# apt install automysqlbackup

Todas tus bases de datos serán salvadas en /var/lib/automysqlbackup/:

$ find /var/lib/automysqlbackup/
/var/lib/automysqlbackup/
/var/lib/automysqlbackup/weekly
/var/lib/automysqlbackup/weekly/my_wiki
/var/lib/automysqlbackup/weekly/my_wiki/my_wiki_week.18.2016-05-07_15h32m.sql.gz
/var/lib/automysqlbackup/monthly
/var/lib/automysqlbackup/daily
/var/lib/automysqlbackup/daily/my_wiki

Copia de seguridad manual:

# automysqlbackup

Restaurar una base de datos:

gunzip < /var/lib/automysqlbackup/weekly/my_wiki/my_wiki_week.18.2016-05-07_15h32m.sql.gz|mysql -uUSER -pPASSWORD my_wiki

Para otras distribuciones, busca en Sourceforge.

Mysqldump desde la línea de comandos

La forma más práctica de crear un volcado de la base de datos que quieres copiar es usar la herramienta de volcado estándar de MySQL mysqldump desde la línea de comandos. Asegúrate de usar los parámetros correctos, o tendrás problemas para restaurar la base de datos. Dependiendo del tamaño de la base de datos, mysqldump puede tardar un tiempo considerable.

Antes de nada, añade una línea como esta a LocalSettings.php:

$wgReadOnly = 'Dumping Database, Access will be restored shortly';

Puedes quitar esa línea en cuanto concluya el proceso de volcado de información.

Ejemplo del comando a ejecutar en la línea de comandos de Linux/UNIX:

mysqldump -h hostname -u userid -p --default-character-set=charset dbname > backup.sql

Sustituye hostname, userid, charset y dbname según corresponda. Los cuatro pueden encontrarse en su archivo LocalSettings.php (LSP). hostname puede encontrarse en $wgDBserver ; por defecto es localhost. userid puede encontrarse en $wgDBuser , charset se puede encontrar en $wgDBTableOptions , donde aparece después de DEFAULT CHARSET=. Si charset no se especifica, mysqldump probablemente usará el valor predeterminado utf8, o latin1 si usa una versión anterior de MySQL. Mientras que dbname pueden encontrarse en $wgDBname . Después de ejecutar esta línea desde la línea de comandos, mysqldump solicitará la contraseña del servidor (que se puede encontrar en Manual: $wgDBpassword en LSP).

Mira la documentación de mysqldump para ver una lista completa de los parámetros que admite el comando.

La salida de mysqldump puede pasarse por tubería a gzip para producir un archivo de salida más pequeño, de este modo:

mysqldump -h hostname -u userid -p dbname | gzip > backup.sql.gz

Algunas versiones más recientes de MySQL pueden mostrar un error sobre los espacios de tablas (tablespaces) y el privilegio PROCESS. MediaWiki no utiliza espacios de tablas. La solución es añadir la opción --no-tablespaces al comando:

mysqldump --no-tablespaces -h hostname -u userid -p dbname | gzip > backup.sql.gz

Puede usarse una orden similar de mysqldump para producir salida en formato XML, indicando la opción --xml:

mysqldump -h hostname -u userid -p --xml dbname > backup.xml

y comprimir el archivo enviándolo por tubería a gzip:

mysqldump -h hostname -u userid -p --xml dbname | gzip > backup.xml.gz

Opciones adicionales que debería considerar usar con mysqldump para una copia de seguridad incluye lo siguiente.

Opciones de Mysqldump adicionales
Opción Descripción
--default-character-set Especifica el conjunto de caracteres por defecto.
--no-tablespaces No escribe las sentencias CREATE LOGFILE GROUP o CREATE TABLESPACE en la salida
--single-transaction Emite una sentencia BEGIN SQL antes de volcar los datos del servidor
--triggers Vuelca los disparadores (triggers) para cada tabla volcada
--routines Vuelca las rutinas almacenadas (procedimientos y funciones) de las bases de datos volcadas
--events Vuelca los eventos de las bases de datos volcadas
--add-drop-table Añade la sentencia DROP DATABASE antes de cada sentencia CREATE DATABASE
--create-options Incluye opciones de tabla específicas de MySQL en las sentencias CREATE TABLE
--extended-insert Utiliza la sintaxis INSERT de varias filas

Si no usa --single-transaction, entonces debería considerar usar las opciones --lock-tables y --add-locks.

Debido a un cambio inesperado en las versiones 5.7.41 y 8.0.32 de MySQL en Febrero de 2023, la opción --single-transaction requería que el usuario encargado de la copia de seguridad tuviera los privilegios RELOAD o FLUSH_TABLES. El problema fue resuelto en las versiones de MySQL 5.7.42 y 8.0.33. Consulte Error 109685 de MySQL y Error 2003866 de Ubuntu para más detalles.

Recuerde hacer una copia de seguridad de los componentes adicionales del sistema de archivos utilizados por la wiki que podrían ser necesarios durante una restauración, como las imágenes, el logotipo, la apariencia y las extensiones.

Ejecutar mysqldump con Cron

En los sistemas que corren sistemas operativos tipo Unix, un Cron es un administrador regular de procesos en segundo plano que permite lanzar ciertos procesos (comandos o scripts de línea de comandos) de forma periódica o en determinadas fechas.

He aquí un ejemplo de comando que podrías lanzar desde un crontab:

nice -n 19 mysqldump -u $USER --password=$PASSWORD $DATABASE -c | nice -n 19 gzip -9 > ~/backup/wiki-$DATABASE-$(date '+%Y%m%d').sql.gz

El comando nice -n 19 reduce la prioridad del proceso.

Procura usar valores válidos con $USER, $PASSWORD y $DATABASE. Este comando creará una copia de seguridad poniendo el día de la semana en el nombre del archivo, con lo cual tendrías una buena referencia de copias. Si quieres copiar también los archivos y las extensiones, quizá te interese ver esto.

Advertencia Advertencia: No intentes hacer una copia de seguridad de tu base de datos de MediaWiki usando mysqlhotcopy. ¡El formato de tablas que usa MediaWiki no se puede copiar con esta herramienta, ¡con lo cual no hará bien su trabajo aunque parezca que sí!

Si quieres añadir esta tarea en Cron por medio de Cpanel, debes usar el carácter de escape "%":

/usr/bin/mysqldump -u $USER --password=$PASSWORD $DATABASE -c | /bin/gzip > ~/backup/wiki-$DATABASE-$(date '+\%Y\%m\%d').sql.gz

De lo contrario obtendrás un error:

/bin/sh: -c: line 0: unexpected EOF while looking for matching `''
/bin/sh: -c: line 1: syntax error: unexpected end of file

Ejecutar mysqldump con Systemd

Systemd unifica las configuraciones y el control de los servicios. Los temporizadores son archivos de unidad de systemd que controlan archivos de servicio o eventos. Los temporizadores pueden utilizarse como alternativa a cron. A continuación se muestra un ejemplo de archivos de unidad de systemd y un script de copia de seguridad.

wiki-backup.timer

El siguiente temporizador ejecuta el servicio wiki-backup a las 5:10 AM cada mañana.

$ cat /etc/systemd/system/wiki-backup.timer

[Unit]
Description=Run the backup service once a day
Documentation=...

[Timer]
OnCalendar=*-*-* 05:10:00
RandomizedDelaySec=600
Persistent=true

[Install]
WantedBy=timers.target
wiki-backup.service

Cuando el temporizador wiki-backup se dispara, entonces el servicio es invocado. El servicio ejecuta un script ubicado en /sbin.

$ cat /etc/systemd/system/wiki-backup.service

[Unit]
Description=Run the backup service once a day
Documentation=...

[Service]
Type=oneshot
User=root
ExecStart=/sbin/wiki-backup
wiki-backup script
$ cat /sbin/wiki-backup

#!/usr/bin/env bash

# Systemd adds random paths at times. Take full control of PATH.
PATH=/bin:/sbin:/usr/bin:/usr/sbin
export PATH

# Read the backup password from conf or ini Failed
wiki_password=...

# Fix the wiki tables just in case. This step produces a lot of noise,
# so send stdout to /dev/null.
if MYSQL_PWD="${wiki_password}" \
   mysqlcheck my_wiki --auto-repair --user=mwuser 1>/dev/null;
then
    echo "Repair wiki database ok"
else
    echo "Failed to repair wiki database"
    echo "Continuing anyways"
fi

# Disable the connection from Apache to MySQL for the dump
if ! systemctl stop apache2.service ;
then
    echo "Failed to stop Apache service"
    echo "Continuing anyways"
fi

# Lock option choice due to MySQL change at versions 5.7.41 and 8.0.32 in
# February 2023. See https://bugs.mysql.com/bug.php?id=109685 and
# https://bugs.launchpad.net/ubuntu/+source/mysql-5.7/+bug/2003866.
if mysql --version 2>&1 | grep -q -E 'mysql[[:space:]]+Ver 8\.0\.32'; then
   echo "Using MySQL --lock-tables --add-locks options"
   mysql_lock_opt="--lock-tables --add-locks"
else
   echo "Using MySQL --single-transaction option"
   mysql_lock_opt="--single-transaction"
fi

if MYSQL_PWD="${wiki_password}" \
   mysqldump --no-tablespaces \
     ${mysql_lock_opt} \
     --events --triggers --routines \
     --add-drop-table --create-options \
     --extended-insert \
     --default-character-set=utf8 \
     -u mwuser -h localhost my_wiki | gzip -q -v9 > /backup/wiki-backup.sql.gz ;
then
    echo "Dump wiki database ok"
else
    echo "Failed to dump wiki database"
    echo "Continuing anyways"
fi

# Re-enable connection from Apache to MySQL for the dump
if ! systemctl start apache2.service ;
then
    echo "Failed to start Apache service"
    echo "Continuing anyways"
fi

exit 0

Tablas

Algunas de las tablas vertidas tienen diferentes grados de temporalidad. Así que, para ahorrar espacio (más allá de aplicar gzip), si bien estas tablas tienen que estar presentes para tener un volcado como es debido, no ocurre lo mismo con la información que contienen. Sin embargo, en determinadas circunstancias el inconveniente de tener que reconstruir toda esta información puede ser mayor que el ahorro de espacio en disco (por ejemplo, en un wiki muy grande donde la velocidad a la que se restaura información es un factor clave).

Mira el hilo mysql5 binary schema de la lista de correo donde se trata este asunto.

Conversión Latin-1 a UTF-8

Mira la sección correspondiente en la página que trata la actualización para ver información sobre este proceso. En la página de discusión también encontrarás más información en general sobre cómo trabajar con juegos de caracteres.

PostgreSQL

Puedes usar la herramienta pg_dump para hacer una copia de seguridad de una base de datos de MediaWiki basada en PostgreSQL. Por ejemplo:

pg_dump mywiki > mywikidump.sql

volcará la base de datos mywiki en mywikidump.sql.

Para restaurar el volcado:

psql mywiki -f mywikidump.sql

También te puede interesar volcar la información global, por ejemplo los usuarios de la base de datos:

pg_dumpall --globals > postgres_globals.sql

SQLite

Si tu wiki está fuera de línea, puedes hacer una copia de su base de datos simplemente copiando el archivo en el que se encuentra. De lo contrario, usa el script de mantenimiento: php maintenance/SqliteMaintenance.php --backup-to <backup file name>, que se asegurará de que la operación sea atómica y que no haya inconsistencias. Si tu base de datos no es excesivamente grande y tu servidor no está bajo una fuerte carga de trabajo, los usuarios que estén editando el wiki tan sólo percibirán un ligero retardo. Los usuarios que sólo estén leyendo no notarán nada en cualquier caso.

phpMyAdmin

Pon tu wiki en modo lectura añadiendo $wgReadOnly = 'Site Maintenance'; a LocalSettings.php.

Encuentra la base de datos de wiki en LocalSettings.php. Aquí hay un ejemplo de cómo se ve esto en LocalSettings.php:

## Database settings
$wgDBtype           = "mysql";
$wgDBserver         = "localhost";
$wgDBname           = "sashtmax_mw19999";
$wgDBuser           = "sashtmax_mw19999";
$wgDBpassword       = "S7[88p]jJJ";
  1. Sigue el enlace a tu página administrativa, identifícate y elige la base de datos del wiki.
  2. Elige Exportar. Asegúrate de que todos los elementos que puedes exportar están marcados, incluyendo Estructura (es importante mantener la estructura de las tablas). Opcionalmente marca también "Añadir DROP TABLE" para borrar las referencias existentes al importar. Asegúrate de que Datos está marcada.
  3. Elige "En zip".
  4. Finalmente, pulsa CONFIRMAR para guardar la copia de seguridad.[1]
  5. Elimina $wgReadOnly = 'Site Maintenance'; de LocalSettings.php.

Recuerda hacer copia también de los componentes del sistema de archivos del wiki que puedas necesitar, como las imágenes, el logotipo y las extensiones.

Enlaces externos

HeidiSQL (alternative to phpMyAdmin)

HeidiSQL es similar a phpMyAdmin, pero sin las limitaciones de la versión gratuita de phpMyAdmin. HeidiSQL necesita una conexión directa con la base de datos; algunos servidores sólo ofrecen interfaces web (phpMyAdmin) a bases de datos protegidas por cortafuegos.

Sistema de archivos

MediaWiki guarda otros componentes de la wiki en el sistema de archivos.

Las más importantes son:

  • LocalSettings.php
  • Los archivos cargados en el directorio images/ (incluidos los archivos borrados, las imágenes en miniatura, las imágenes matemáticas renderizadas y las imágenes SVG, si corresponde).

El mejor método para hacer una copia de seguridad de estos archivos es almacenarlos por ejemplo en un archivo .tar, que luego puede comprimirse si se desea. En Windows, se pueden utilizar aplicaciones como WinZip o 7-zip.

En un sistema basado en Linux, suponiendo que el wiki se encuentre en /srv/www/htdocs/wiki, podrías usar algo como:

tar zcvhf wikidata.tgz /srv/www/htdocs/wiki

Debería ser posible hacer una copia de seguridad de todo el directorio "wiki" de la carpeta "htdocs" si estás usando XAMPP.

Archivos de configuración

LocalSettings.php es el más importante de ellos, pero una wiki también puede tener cosas como .htaccess u otros archivos de configuración del servidor web que deberían ser respaldados.

Archivos cargados

Los archivos subidos a la wiki se colocan por defecto en el directorio images/, separados en subdirectorios tales como images/8/8f. También hay otros directorios como images/archive/ y images/deleted/. Todos estos deberían ser respaldados.

El directorio images/thumb/ puede ser respaldado junto con todo lo demás, pero opcionalmente puede ser excluido para ahorrar espacio en la copia de seguridad. Este directorio almacena las miniaturas derivadas de imágenes y otros archivos; generalmente varias miniaturas por archivo wiki. Después de restaurar desde la copia de seguridad, estas miniaturas se volverán a crear según sea necesario (aunque dependiendo de $wgGenerateThumbnailOnParse , es posible que deba ser un proceso manual).

Copia de seguridad del contenido del wiki (volcado XML)

También es una buena idea crear un volcado XML además del volcado de la base de datos. Los volcados XML albergan el contenido del wiki (las páginas del wiki y todas sus revisiones) sin los datos relacionados con el sitio (no tienen las cuentas de usuario, metadatos de las imágenes, registros, etc.).[2]

Los volcados XML tienen menos posibilidades de causar problemas con la codificación de caracteres y son una forma de transferir gran cantidad de contenido de forma rápida; también son más fáciles de usar con herramientas externas, lo que los convierte en un buen recurso si se da el caso de que el volcado principal de la base de datos se vuelve inutilizable.

Para crear un volcado XML, usa la herramienta de línea de comando dumpBackup.php , que encontrarás en el directorio maintenance de tu instalación de MediaWiki. Véase Manual:dumpBackup.php para más información.

También puedes crear un volcado XML de un grupo específico de páginas usando Especial:Exportar, aunque normalmente si intentas volcar muchas páginas desde esta interfaz te encontrarás con que la petición del navegador caduca.

Para importar un volcado XML en un wiki, usa la herramienta de línea de comando importDump.php . Si se trata sólo de unas pocas páginas, también puedes usar Especial:Importar mediante tu navegador, aunque de forma predeterminada sólo los administradores pueden usar esta página.

Véase Manual:Importación de volcados XML para más información.

Sin acceso a la consola del servidor

MediaWiki Dump Generator

If you have no shell access, use the MediaWiki Client Tools' MediaWiki Dump Generator dumpgenerator script. It is run from the command-line in a terminal.

The XML dump can include full or only most recent page history. The images dump will contain all file types with associated descriptions. The siteinfo.json and SpecialVersion.html files will contain information about wiki features such as the installed extensions and skins. User account information won't be preserved.

Full instructions are at the MediaWiki Client Tools' MediaWiki Dump Generator GitHub repository.

Véase también Meta:Data dumps.

Scripts

Advertencia Advertencia: Usa estos scripts bajo tu cuenta y riesgo. Mira en el LocalSettings.php de tu wiki el juego de caracteres correcto que debes usar, ya que también es posible que tengas que modificar los scripts en tu caso particular.
  • Script no oficial para crear copias de seguridad de Flominator: sirve para crear una copia de seguridad de todos los archivos y de la base de datos, e incluye opcionalmente rotación de las copias. Shell script, last updated 2012.
  • Otro script para crear copias de seguridad que crea volcados de la base de datos, los archivos y el XML, pone el sitio en modo lectura, marca las copias por fechas y lee el juego de caracteres a utilizar de LocalSettings.php. El script no necesita ser modificado por cada sitio a respaldar. De momento no soporta la rotación de viejas copias. Uso: backup.sh -d backup/directory -w installation/directory. También proporciona un script para restaurar un restore.sh -a backup/directory/dated_archive.tar.gz -w installation/directory de respaldo. Shell script, last updated 2013.
  • User:Darizotas/MediaWiki Backup Script for Windows - un script que hace una copia de seguridad de una instalación de MediaWiki basada en Windows. Nota: No tiene función de restauración. Shell script, last updated 2015.
  • Script no oficial para hacer copias de seguridad creado por Duesentrieb. Shell script, last updated 2016.
  • mw_backup, un script para realizar copias de seguridad periódicas. Este script genera copias de seguridad diarias, semanales o mensuales de tu base de datos y del directorio de imágenes cuando se ejecuta como un proceso diario de Cron. PHP script, last updated 2017.
  • Another unofficial MediaWiki backup script for Windows by Lanthanis that: exports the pages of specified namespaces as an XML file; dumps specified database tables; and adds further specified folders and files to a ZIP backup file.

Puede ser usado con el Programador de Tareas de Windows. Last updated 2019.

  • WikiTeam tools - si no tienes acceso al servidor (por ejemplo, si tu wiki está en una granja gratuita de wikis), puedes generar un volcado XML y un volcado de imágenes usando dumpgenerator de las herramientas de WikiTeam (mira algunos de los wikis salvaguardados de este modo). Python 2 script.
  • MediaWiki Dump Generator - if you do not have server access (e.g. your wiki is in a free wikifarm), you can generate an XML dump and an image dump using dumpgenerator from Mediawiki Client Tools, Python 3 script, last update 2023.

Extensiones

Véase también

Referencias

  1. Manual talk:Backing up a wiki#Ubuntu 10.10 - Step by Step Instructions
  2. Los volcados XML son independientes de la estructura de la base de datos, y pueden importarse en versiones futuras (e incluso pasadas) de MediaWiki.