Extension:Proofread Page
Rozšíření Proofread Page (Rozšíření:Stránka korektury) generuje stránku knihy buď jako:
- Dva sloupce, kdy se na jedné straně zobrazuje textový obsah, pokud bylo aplikováno OCR, a vedle něj obrázek naskenovaného originálu nebo
- Zalomenou do kapitol či lépe bloků, přičemž textový obsah na stránce MediaWiki je zalomen pod obrázkem dokumentu (přes transkluzi – zahrnutí části nebo celého elektronického dokumentu do jednoho nebo více dalších dokumentů pomocí hypertextového odkazu).
Rozšíření je navrženo tak, aby umožnilo snadné porovnání textu s digitalizovaným originálem.
Textový obsah dokáže zobrazit několika různými způsoby, aniž by při tom docházelo k jeho duplikování.[1]
Použití
Toto rozšíření je nainstalováno na všechny wikiny Wikisource. O syntaxi se více dozvíte na stránce dokumentace Wikisource Proofread Page. Bylo také použito na Bibliowiki.
Co potřebujete a co je doporučeno
- Pokud se spuštění aktualizačního skriptu (maintenance/update.php) z webového prohlížeče nezdaří, je vyžadován přístup k příkazovému řádku (viz Dokumentace k upgradu a Dokumentace k Update.php).
- Pokud chcete používat dokumenty v DjVu formátu (volitelný a doporučený) (otevřený souborový formát vyvinutý pro ukládání naskenovaných dokumentů), stačí v nastavení povolit, aby se používal nativní (v nezměněném stavu) DjVu handler (speciální systémový software pro obsluhu událostí). Více na stránce Příručka:Jak používat DjVu s MediaWiki.
- Kromě toho, se vám při použití ProofreadPage budou hodit i následující rozšíření:
- LabeledSectionTransclusion (silně doporučeno)
- Cite (výchozí patička stránek obsahuje tag
<references /> - Poem
- PdfHandler (může vyžadovat doinstalování dalších balíčků, které rozšíří možnosti PHP) — přidává podporu pro PDF
- PagedTiffHandler
- ParserFunctions
- TemplateStyles (povoluje CSS specifické pro index)
- Scribunto (umožňuje korekturu knihovny Lua)
Instalace
Rozšíření
- Stáhněte soubor/y a vložte je do adresáře pojmenovaného
ProofreadPageve vaší složceextensions/.
Vývojáři a přispěvatelé kódu by si místo toho měli nainstalovat rozšíření from Git pomocí:cd extensions/ git clone https://gerrit.wikimedia.org/r/mediawiki/extensions/ProofreadPage
- Na konec vašeho souboru LocalSettings.php přidejte následující kód:
wfLoadExtension( 'ProofreadPage' );
- Spusťte aktualizační skript, který automaticky provede všechny nezbytné databázové změny, jaké rozšíření vyžaduje.
Dokončeno – Přejděte na stránku Special:Version vaší wiki a zkontrolujte, zda bylo rozšíření úspěšně nainstalováno.
Generování náhledů
Rozšíření odkazuje přímo na miniatury obrázků, které často neexistují. Musíte zachytit chybu 404 a vygenerovat chybějící miniatury. Můžete to udělat pomocí některého z těchto řešení:
- Nastavte Apache RewriteRule v .htaccess na thumb.php pro chybějící miniatury:
RewriteEngine On RewriteCond %{REQUEST_FILENAME} !-f RewriteCond %{REQUEST_FILENAME} !-d RewriteRule ^/w/images/thumb/[0-9a-f]/[0-9a-f][0-9a-f]/([^/]+)/page([0-9]+)-?([0-9]+)px-.*$ /w/thumb.php?f=$1&p=$2&w=$3 [L,QSA]
- nebo nastavte popisovač Apache 404 na thumb-handler na Wikimedii. Toto je obecný obslužný program 404 s kódem specifickým pro Wikimedii, ne generátor miniatur.
ErrorDocument 404 /w/extensions/upload-scripts/404.php
- U MediaWiki >= 1,20 můžete jednoduše přesměrovat na thumb_handler.php:
RewriteEngine On RewriteCond %{REQUEST_FILENAME} !-f RewriteCond %{REQUEST_FILENAME} !-d RewriteRule ^/w/images/thumb/[0-9a-f]/[0-9a-f][0-9a-f]/([^/]+)/page([0-9]+)-?([0-9]+)px-.*$ /w/thumb_handler.php [L,QSA]
- nebo na apache2.conf:
ErrorDocument 404 /w/thumb_handler.php
Pokud narazíte na problém podobný následujícímu:
- phab:T301291 – soubory PDF a DjVu na Commons se nepodařilo zpracovat (žádné miniatury, nula stránek), ale jinak platné
- phab:T298417 – neodstraněné soubory DjVu zobrazují nesprávná metadata: Velikost 0x0, žádné informace o čísle stránky
- phab:T299521 – soubor PDF má v Commons velikost obrázku 0x0 po nahrání nové verze, když je číslo stránky správné
Zkuste následující kroky:
- Opravu miniatur pro soubory DjVu jádra MediaWiki (pro PDF použijte mimetype
application/pdf)php maintenance/refreshImageMetadata.php --verbose --mime image/vnd.djvu --force
- Potřebné pro aktualizaci informací o počtu stránek z
Special:IndexPagesphp maintenance/refreshLinks.php --namespace 252
Jmenné prostory
ProofreadPage zakládá při instalaci dva uživatelsky definované jmenné prostory, v angličtině pojmenované "Page" a "Index", které mají ID 250 a 252.
Pokud vaše wiki používá jako výchozí jiný jazyk než angličtinu, budou jejich názvy přeložené. Úplný seznam.
Názvy těchto jmenných prostorů i jejich ID můžete změnit: Vytvořte si vlastní jmenné prostory v konfiguračním souboru Příručka:LocalSettings.php a nastavte jim ID, jaké vám vyhovuje, přes globání proměnnou $wgProofreadPageNamespaceIds. Váš kód v konfiguraci pak bude vypadat asi takto:
define( 'NS_PROOFREAD_PAGE', 250);
define( 'NS_PROOFREAD_PAGE_TALK', 251);
define( 'NS_PROOFREAD_INDEX', 252);
define( 'NS_PROOFREAD_INDEX_TALK', 253);
$wgExtraNamespaces[NS_PROOFREAD_PAGE] = 'Page';
$wgExtraNamespaces[NS_PROOFREAD_PAGE_TALK] = 'Page_talk';
$wgExtraNamespaces[NS_PROOFREAD_INDEX] = 'Index';
$wgExtraNamespaces[NS_PROOFREAD_INDEX_TALK] = 'Index_talk';
$wgProofreadPageNamespaceIds = array(
'index' => NS_PROOFREAD_INDEX,
'page' => NS_PROOFREAD_PAGE
);
Vezměte ale na vědomí fakt, že si s tím můžete do budoucna komplikovat situaci, protože nelze vyloučit, že se metoda pro zakládání vlastních jmenných prostorů změní.
Nastavení
- Aby bylo možné použít systém kvality stránky, je nutné vytvořit pět kategorií. Názvy těchto kategorií musí být definovány v MediaWiki:Proofreadpage_quality0_category a MediaWiki:Proofreadpage_quality4_category.
- Ujistěte se, že máte nainstalováno Rozšíření:ParserFunctions.
Nastavení jmenného prostoru index
Další podrobnosti najdete na stránce Extension:Proofread Page/Index data configuration
- Aby se vám vygenerovala indexová stránka, musíte nejprve vytvořit stránku MediaWiki:Proofreadpage_index_template. Tato stránka je ve své podstatě šablona, jejíž parametry vyplňujete prostřednictvím editačního formuláře.
- Nastavení jednotlivých položek formuláře se provádí přes stránku MediaWiki:Proofreadpage_index_data_config.json, kterou musíte vytvořit. Nastavení této stránky přepisuje obsah stránek MediaWiki:Proofreadpage_index_attributes a MediaWiki:Proofreadpage_js_attributes, přes které se nastavení dělalo dříve.
Konfigurace je ve formátu JSON. Takto vypadá struktura pro jedno formulářové pole a jeho výchozí parametry. Pokud některý vynecháte, použije se výchozí hodnota:
{
"ID": { //ID metadat (první parametr proofreadpage_index_attributes)
"type": "string", //typ vlastnosti (z důvodů kompatibility nemusí být hodnoty tohoto typu). Možné hodnoty: řetězec, číslo, stránka. Pokud je nastaveno, nově nastavené hodnoty by měly být platné podle typu (např. pro číslo platné číslo, pro stránku existující wiki stránka...).
"size": 1, //pouze pro typ string : počet řádků vstupu (třetí parametr proofreadpage_index_attributes)
"values": {"a":"A", "b":"B","c":"C", "d":"D"}, //pole hodnot: Popisek, který vypisuje možné hodnoty (z důvodů kompatibility nesmí uložené hodnoty být jednou z těchto)
"default": "", //výchozí hodnota
"header": false, //přidat vlastnost do šablony MediaWiki:Proofreadpage_header_template (true je ekvivalentní uvedení v proofreadpage_js_attributes)
"label": "ID", //popisek ve formuláři (druhý parametr proofreadpage_index_attributes)
"help": "", //krátký text nápovědy
"delimiter": [], //seznam oddělovačů mezi dvěmi částmi hodnot. Například ["; ", " and "] pro řetězce jako "J. M. Dent; E. P. Dutton and A. D. Robert"
"data": "" //Typ metadat proofreadpage, ke kterému je vlastnost ekvivalentní
}
}
Parametr data může obsahovat některou z následujících hodnot: "type", "language", "title", "author", "translator", "illustrator", "editor", "school", "year", "publisher", "place", "progress"
Oddělovač stránek
Rozšíření vkládá mezi transkludované (automatické vkládání obsahu do stránky s využitím dvojitých složených závorek {{}}) stránky oddělovač, který je uložen v proměnné wgProofreadPagePageSeparator.
Ve výchozím stavu obsahuje   (mezera).
Chcete-li jej zcela potlačit, nastavte wgProofreadPagePageSeparator = "".
Spojení slov rozdělených mezi stránky
Přechází-li slovo rozdělené pomlčkou na další stránku, budou obě části spojeny do jednoho slova.
Konkrétně: z "hi-" a "storie" bude "historie".
Jako "spojovník" je interpretován znak uložený v proměnné wgProofreadPagePageJoiner, ve výchozím stavu je to '-' (znak ASCII spojovník).
Konfigurace změnových značek (volitelné)
Pokud chcete nastavit značky pro změnu, podívejte se na změny označení (change tagging).
Použití
Vytvoření první stránky (příklad s DjVu)
- Předtím, než budete pokračovat, zkontrolujte, jestli máte vaši konfiguraci nastavenou jak uvádí Příručka:Jak používat DjVu s MediaWiki.
- (kdy a v jakém jmenném prostoru je samotný soubor DjVu nahrán?)
- Pokračujte založením stránky ve jmenném prostoru "Page" (jeho název se může pochopitelně lišit, pokud používáte jinou wiki než anglickou a máte intenacionalizované názvy jmenných prostorů). Pokud se váš jmenný prostor jmenuje 'Page', tak založte stránku
Page:Carroll - Alice's Adventures in Wonderland.djvu. - Poté si do wiki nainstalujte soubor odpovídající této stránce commons:File:Carroll - Alice's Adventures in Wonderland.djvu (nebo si nastavte proměnnou Příručka:$wgUseInstantCommons na
true). - Pro vložený soubor vytvořte indexovou stránku
Index:Carroll - Alice's Adventures in Wonderland.djvu.- Do vstupního pole Pages (stránky) vložte tag
<pagelist />, aby se vám vygeneroval seznam odkazů na stránky.
- Do vstupního pole Pages (stránky) vložte tag
- Kliknete-li na číslo 5, které vede na stranu 'Page:Carroll - Alice's Adventures in Wonderland/5' a můžete začít stránku editovat.
Syntaxe
Toto rozšíření zavádí následující tagy:
<pages>, <pagelist>
Související odkazy
- Oddělení
- Index data configuration
- Change tagging
- Lua library reference
- Page viewer
- Edit-in-Sequence – nový systém (od roku 2022) pro korektury bez nutnosti znovu načítat celou stránku.
- Roadmap of the development
- API
- Metadata API –
proofreadsubmodul meta - Proofread properties API – vlastnosti jednotlivých stránek související s korekturou
- Index data API – přístup k datům indexových stránek (pole a kategorie)
- Index pagination API – seznam stránek v daném indexu
- Metadata API –
- Příručka:Jak používat DjVu s MediaWiki
- PdfHandler – umožňuje použít Proofread Page i na soubory v PDF formátu
- Aktuální úplný popis a pokyny (v angličtině) najdete na: s:Help:Proofread
- Statistiky pro Wikisource najdete zde: https://wsstats.toolforge.org/
- Seznam úkolů a seznam požadavků na funkce z komunity
- Uživatelská příručka ve pro veřejnou doménu: Nápověda:Rozšíření:ProofreadPage
- MediaWiki:OCR.js – skript OCR
Poznámky pod čarou
- ↑ Protože stránky nejsou umístěny v hlavním jmenném prostoru, nemohou být zahrnuty do celkové součtu, ve statistice zpracovaných textových jednotek.
| Toto rozšíření se používá na jednom nebo více projektech Wikimedia. Pravděpodobně to znamená, že rozšíření je stabilní a funguje dostatečně dobře, aby jej mohly používat weby s tak vysokou návštěvností. Vyhledejte tento název rozšíření v konfiguračních souborech CommonSettings.php a InitialiseSettings.php Wikimedie, abyste viděli, kde je nainstalováno. Úplný seznam rozšíření nainstalovaných na konkrétní wiki lze vidět na stránce wiki Special:Version. |
| Toto rozšíření je zahrnuto v následujících wiki farmách/hostitelích a/nebo balíčcích: |
- Stable extensions/cs
- Page action extensions/cs
- ContentHandler extensions/cs
- Tag extensions/cs
- API extensions/cs
- Database extensions/cs
- Extensions supporting Composer/cs
- Extensions which add rights/cs
- BeforePageDisplay extensions/cs
- CanonicalNamespaces extensions/cs
- ChangeTagsListActive extensions/cs
- CodeMirrorGetMode extensions/cs
- ContentHandlerDefaultModelFor extensions/cs
- EditFormPreloadText extensions/cs
- GetBetaFeaturePreferences extensions/cs
- GetDoubleUnderscoreIDs extensions/cs
- GetLinkColours extensions/cs
- GetPreferences extensions/cs
- ImageOpenShowImageInlineBefore extensions/cs
- InfoAction extensions/cs
- ListDefinedTags extensions/cs
- LoadExtensionSchemaUpdates extensions/cs
- MediaWikiServices extensions/cs
- MultiContentSave extensions/cs
- OutputPageParserOutput extensions/cs
- ParserFirstCallInit extensions/cs
- ParserTestGlobals extensions/cs
- RecentChange save extensions/cs
- ResourceLoaderRegisterModules extensions/cs
- ScribuntoExternalLibraries extensions/cs
- ScribuntoExternalLibraryPaths extensions/cs
- SkinTemplateNavigation::Universal extensions/cs
- WgQueryPages extensions/cs
- GPL licensed extensions/cs
- Extensions in Wikimedia version control/cs
- All extensions/cs
- Extensions used on Wikimedia/cs
- Extensions included in Miraheze/cs
- Extension:ProofreadPage/cs
- View page extensions/cs
- Image extensions/cs
- Transcription extensions/cs
