Manual:Importing XML dumps/ru

= Импорт XML дампов =

Эта страница описывает методы импортирования дампов XML.

MediaWiki использует формат основанный на XML для дампов. Это — то, что создаётся на странице Special:Export, а также то, что используется для XML дампов XML Википедии и других проектов Викимедии. Формат объяснён детальнее в meta:Help:Export.

Есть несколько методов для того, чтобы импортировать такие дампы XML:

Использование страницы Special:Import
Страница Special:Import может использоваться пользователями Вики, у которых есть права на импорта (по умолчанию пользователи в sysop группе), чтобы импортировать небольшое количество страниц (приблизительно 100 должно быть безопасными). Пытаясь импортировать большие дампы этот путь может привести к отказам связи или перерывам. См. meta:Help:Import для детального описания.

См. Manual:Импорт XML файла с манипуляциями на CSharp, образец кода на C#, который управляет файлом импорта XML.

Использование importDump.php
importDump.php:


 * Рекомендуемый метод для общего использования, но медленный для очень больших наборов данных. При большом количестве данных, таких как дамп большой Википедии используйте mwdumper, который импортирует таблицы связей как отдельные дампы SQL.

importDump.php — скрипт командной строки, расположенный в справочнике обслуживания Вашей установки MediaWiki. Если у Вас есть доступ к инсталляции MediaWiki, Вы можете вызвать его так:



php importDump.php

где   имя XML файла дампа. Если файл сжат, и у него расширение .gz or .bz2, он будет развернут автоматически.

чтобы использовать importDump.php (или любой другой инструмент из директории обслуживания), Вы должны настроить свой файл AdminSettings.php file.

использование importDump.php может занять длительное время. Поскольку дамп большой Википедия состоит из миллионов страниц, могут потребоваться дни, даже на быстром сервере. Также учитывайте, что согласно информации в meta:Help:Import, например, еще применяется объединение историй правки страниц, и т.п.

После использования этого Вы можете захотеть использовать rebuildrecentchanges.php чтобы обновить содержание Вашей страницы Special:Recentchanges.

Использование mwdumper
mwdumper — приложение на языке Java, которое может использоваться, чтобы читать, записывать и конвертировать дампы MediaWiki. Это можно использовать, чтобы сгенирировать SQL дамп от XML-файла (для последующего использования с mysql или phpmyadmin), а так же для того, чтобы непосредственно импортировать данные в базу. Это намного быстрее чем importDump.php, однако, это только импортирует ревизии (содержание страниц), и не обновляет таблицы внутренних ссылок, что означает, что страницы категории и много специальных страниц покажут неполную или неправильную информацию, если Вы не обновите эти таблицы.

Если доступно, Вы можете заполнить таблицы связей, импортируя отдельные SQL дампы этих таблиц, используя непосредственно командную строку клиента mysql. Для Викимедия Викий, эти данные доступны наряду с дампами XML.

Иначе, Вы можете использовать rebuildall.php, который займёт много времени, потому что он должен разобрать все страницы. Это не рекомендуется для больших наборов данных.

Использование xml2sql
Xml2sql - это скрипт на языке Perl, который преобразовывает XML файл ВикиМедиа в SQL дамп для использования с mysql или phpmyadmin</tt>.

Точно так же как использование mwdumper (см. выше), импортирует быстро, но не обновляет вторичные данные такие как таблицы связей, таким образом Вы должны использовать rebuildall.php</tt>, что аннулирует это преимущество.

Предупреждение: xml2sql не официальный инструмент и не поддерживается разработчиками MediaWiki. Это может быть устаревшим и несовместимым с последней версией MediaWiki!

См. также

 * Data dumps
 * Manual:System administration