Publiceren vanuit MediaWiki
MediaWiki is een geweldig hulpmiddel voor het gezamenlijk schrijven van documenten, maar het geeft u niet noodzakelijkerwijs uw voltooide document in een geschikt formaat voor gebruik buiten een wiki-context. Deze pagina onderzoekt de beste manieren om MediaWiki-inhoud te extraheren op een manier die geschikt is voor publicatie met behulp van andere media.
Tegenwoordig worden niet-digitale formaten normaal gesproken gemaakt van digitaal bronmateriaal, dus deze vraag komt grotendeels neer op 'in welke formaten kan ik mijn gegevens extraheren'.
Soorten inhoud die u mogelijk wilt extraheren
Er zijn in het algemeen vier soorten gegevens die u van MediaWiki wilt publiceren:
- Individuele pagina's
- Collectie pagina's
- Individuele mediabestanden (bijv. afbeeldingen)
- Collectie mediabestanden
In het geval van de laatste twee zullen deze normaal gesproken niet gezamenlijk op de wiki worden gemaakt, maar de wiki kan zijn gebruikt om de bestanden uit verschillende bronnen te verzamelen. Het manipuleren van dat bestand buiten MediaWiki levert echter waarschijnlijk de beste resultaten op, ongeacht het andere medium waarin u van plan bent te publiceren. In gevallen waarin een individuele afbeelding/bestand nodig is, gaat u gewoon naar de beschrijvingspagina van het bestand en downloadt u daar het origineel. In gevallen waarin u meerdere bestanden wilt downloaden, volgt u de instructies op alle bestanden van een wiki exporteren, maar filter de bestandenlijst zodat deze alleen de bestanden bevat die u wilt.
De rest van deze pagina richt zich daarom op de eerste twee: individuele pagina's en collectie pagina's.
Interne methoden voor het exporteren van gegevens via de interface
- U kunt de HTML-inhoud van een pagina exporteren door
?action=renderaan de URL toe te voegen, zoals dit. Dit voert alleen de opgebouwde HTML-inhoud van de pagina uit, zonder de MediaWiki-skin-elementen. Merk op dat het geen geldige HTML-pagina is, maar een paginafragment en geen CSS-stijl bevat. - U kunt een of meer pagina's exporteren voor Special:Export. Dit geeft u de ruwe wikitext verpakt in een XML-structuur. U moet verdere verwerking uitvoeren om deze uitvoer bruikbaar te maken.
- U zou in staat moeten zijn om pagina's te extraheren met behulp van de API.
Interne methoden voor het exporteren van gegevens via de commandoregel
/maintenance/getText.phpstelt u in staat om de wikitext voor een specifieke pagina te krijgen.- Als een hack, zal de volgende opdracht pagina-html uitvoeren. (Zorg ervoor dat het wordt uitgevoerd in uw map maintenance. Vervang Main_Page met de pagina die u wilt exporteren.)
echo '$a = new ApiMain( new FauxRequest( array( "action" => "parse", "page" => "Main_Page", "prop" => "text" ))); $a->execute(); $d = $a->getResultData(); echo $d["parse"]["text"]["*"];'|php eval.php
- Het bovenstaande kan worden vervangen door een goed onderhoudsscript als er vraag naar is (hetzelfde als getText.php voor pagina-tekst).
Extensies om te helpen bij het exporteren van gegevens
Deze lijst is vast niet compleet en dient ook niet als aanbeveling te worden beschouwd om een van deze extensies te gebruiken. Het is meer een aanwijzing voor een aantal die het waard zijn om zelf verder te gaan onderzoeken.
- Er zijn verschillende extensies die u kunt installeren die het mogelijk maken om afzonderlijke pagina's te exporteren als PDF-bestanden:
- Extension:Collection stelt u in staat om individuele pagina's of collecties pagina's in verschillende formaten te publiceren.
- Extension:OpenDocument Export exporteert in ODF-formaat.
- Category:Data extractie extensies is nu een beetje een vergaarbak, maar het bevat enkele nuttige items die niet in de bovenstaande onderwerpen zijn opgenomen.