Manual:Database access/cs

Tento článek poskytuje přehled přístupu k databázi a obecných problémů s databází na MediaWiki.

Při kódování v MediaWiki budete obvykle přistupovat k databázi pouze prostřednictvím funkcí MediaWiki určených k tomuto účelu.



Schéma databáze
Pro aktuální informace o tom, jak vypadá databáze MediaWiki, jako například popis tabulek a jejich obsah, prostudujte. Historicky bylo dokumentováno v MediaWiki, též na, ale od verze 1.35 se postupně přešlo na  , což je součást iniciativy Abstract Schema. To znamená, že schéma ze  zapíše do souboru  , což umožňuje na základě jedné konfigurace generovat databázová schémata, pro různé typy databází.



Přihlášení do MySQL


Použití sql.php
MediaWiki má pro práci s databází údržbářský skript, který může přistupovat k databázi. Ten se spouští z adresáře maintenance:

Po jeho spuštění můžete zadávat dotazy na databázi. Další možnost je předat název souboru, který si bude spouštět MediaWiki, přičemž si MW podle potřeby nahradí všechny použité speciální proměnné. Pro další informace se podívejte na.

To bude fungovat pro všechny databázové backendy. Výzva však není tak plnohodnotná jako klienti příkazového řádku dodávaní s vaší databází.



Použití klienta příkazového řádku mysql
V LocalSettings.php najdete heslo a uživatelské jméno vaší wiki pro MySQL, například:

Do SSH se přihlaste zadáním následujícího:

Nahraďte a  jejich hodnotami. Poté budete vyzváni k zadání hesla a poté se zobrazí výzva.



Vrstva abstrakce databáze
MediaWiki používá knihovnu Rdbms jako svou abstrakční vrstvu databáze. Vývojáři nesmí přímo volat nízkoúrovňové databázové funkce, jako je.

Každé připojení je reprezentováno, ze kterého lze provádět dotazy. Připojení lze získat voláním  nebo   (v závislosti na případu použití) na instanci , nejlépe závislost-injected, nebo získat od MediaWikiServices prostřednictvím služby DBLoadBalancerFactory. Funkce  se postupně vyřazuje a neměla by se používat v novém kódu.

Chcete-li získat připojení k databázi, můžete zavolat buď  pro čtecí dotazy nebo   pro zapisovací dotazy a čtecí dotazy informující o zápisu. Rozdíl mezi primární a replikou je důležitý v prostředí s více databázemi, jako je Wikimedie. Informace o tom, jak pracovat s objekty, naleznete níže v části Funkce obálky.

Přečtěte si příklad dotazu:

""

Napište příklad dotazu:

""

Používáme konvenci pro čitelná připojení (replika) a  pro zapisovatelná připojení (primární). Také se používá pro instanci IConnectionProvider

SelectQueryBuilder
Třída je preferovaný způsob, jak formulovat čtené dotazy v novém kódu. Ve starším kódu můžete najít  a související metody třídy Database používané přímo. Tvůrce dotazů poskytuje moderní "plynulé" rozhraní, kde jsou metody zřetězené, dokud není vyvolána metoda načtení, bez nutnosti přiřazování zprostředkujících proměnných. Například:

Tento příklad odpovídá následujícímu SQL:

JOINs jsou také možné. Například:

Tento příklad odpovídá dotazu:

K jednotlivým řádkům výsledku můžete přistupovat pomocí smyčky foreach. Každý řádek je reprezentován jako objekt. Například:

Existují také praktické funkce pro načtení jednoho řádku, jednoho pole z několika řádků nebo jednoho pole z jednoho řádku:

V těchto příkladech je objekt řádku jako ve výše uvedeném příkladu,  je pole ID stránek a  je jedno ID stránky.



Funkce obálky
Poskytujeme funkci query pro nezpracovaný SQL, ale místo toho je třeba použít funkce wrapper jako select a insert. Mohou se za určitých okolností postarat například o předvolby tabulek a escaping. Pokud opravdu potřebujete vytvořit svůj vlastní SQL, přečtěte si dokumentaci k tableName a addQuotes. Ob̟ě budete potřebovat. Nezapomeňte, že pokud nebudete správně používat addQuotes, můžete do své wiki vložit závažné bezpečnostní díry.

Dalším důležitým důvodem pro použití metod na vysoké úrovni, namísto vytváření vlastních dotazů, je zajištění správného fungování kódu bez ohledu na typ databáze. V současné době je nejlepší podpora pro MySQL/MariaDB. Existuje také dobrá podpora pro SQLite, je však mnohem pomalejší než MySQL nebo MariaDB. Existuje podpora pro PostgreSQL, ale není tak stabilní jako MySQL.

V následující části jsou uvedeny dostupné funkce obálky. Podrobný popis parametrů funkcí obálky (wrapper) najdete v dokumentech třídy 's. Zejména viz  pro vysvětlení ,  ,  ,  ,   a   parametrů, které používá mnoho dalších funkcí wrapperu.



Pohodlné funkce
Pro kompatibilitu s PostgreSQL jsou idy vložení získány pomocí nextSequenceValue a insertId. Parametr pro nextSequenceValue lze získat z příkazu  v   a vždy odpovídá formátu x_y_seq, kde x je název tabulky (např. page) a y je primární klíč (např. page_id), např. page_page_id_seq. Například:

Pro některé další užitečné funkce, např. , atd., viz Příručka:Database.php#Functions.



Základní optimalizace dotazu
Vývojáři MediaWiki, kteří potřebují psát dotazy na DB, by měli mít určité znalosti o databázích a s nimi spojenými problémy s výkonem. Opravy obsahující nepřijatelně pomalé funkce nebudou přijaty. Neindexované dotazy nejsou na MediaWiki obecně vítány, s výjimkou zvláštních stránek odvozených z QueryPage. Pro nové vývojáře je obvyklé předkládat kód obsahující dotazy SQL, které zkoumají obrovské množství řádků. Pamatujte, že COUNT(*) je O(N), počítání řádků v tabulce je jako počítání fazolí v kbelíku.



Zpětná kompatibilita
Kvůli změnám návrhu DB jsou často nutné různé přístupy k DB pro zajištění zpětné kompatibility. To lze zpracovat například pomocí globální proměnné :

Replikace
Velké instalace MediaWiki, jako je Wikipedie, používají velkou sadu replik MySQL serverů replikujících zápisy provedené na primární MySQL server. Pokud chcete psát kód určený pro Wikipedii, je důležité porozumět složitosti spojené s velkými distribuovanými systémy.

Často se stává, že nejlepší algoritmus pro daný úkol závisí na tom, zda se používá replikace. Kvůli našemu neustálému centrování na Wikipedii často používáme pouze verzi vhodnou pro replikaci. Ale pokud chcete, můžete použít a zkontrolovat, zda se replikace používá.

Prodleva
K nadměrnému zpoždění (lag) dochází především při odesílání velkých dotazů na zápis na primární server. Zápisy na primárním serveru jsou prováděny paralelně, ale jsou prováděny sériově, když jsou replikovány do replik. Primární server zapíše dotaz do binlogu, když je transakce potvrzena. Repliky se dotazují na binlog a začnou provádět dotaz, jakmile se objeví. Mohou číst služby, zatímco provádějí dotaz na zápis, ale nebudou číst nic víc z binlogu a nebudou tedy provádět žádné další zápisy. To znamená, že pokud dotaz na zápis běží dlouhou dobu, repliky budou za primárním serverem zaostávat po dobu, kterou trvá dokončení dotazu na zápis.

Zpoždění může být umocněno vysokou zátěží čtením. Nástroj pro vyrovnávání zátěže MediaWiki přestane odesílat čtení do repliky, když se zpozdí o více než 5 sekund. Pokud jsou poměry zatížení nastaveny nesprávně nebo pokud je zatížení obecně příliš velké, může to vést k tomu, že se replika trvale pohybuje se zpožděním 5 sekund.

V produkci Wikimedie mají databáze povolenou semi-synchronizaci, což znamená, že změna nebude potvrzena primárně, pokud nebude potvrzena alespoň v polovině replik. To znamená, že velké zatížení může vést k odmítnutí všech úprav a dalších operací zápisu s chybou vrácenou uživateli. To dává replikám šanci vše dohnat.

Než jsme měli tento mechanismus, repliky se pravidelně zpožďovaly o několik minut, což ztěžovalo kontrolu posledních úprav.

Kromě toho se MediaWiki snaží zajistit, aby uživatel viděl události na wiki v chronologickém pořadí. Několik sekund zpoždění může být tolerováno, pokud uživatel uvidí konzistentní obrázek z následných požadavků. To se provádí uložením pozice primárního binlogu v relaci a poté na začátku každého požadavku čekáním, až replika dožene tuto pozici, než z ní provedete jakékoli čtení. Pokud toto čekání vyprší, čtení je přesto povoleno, ale požadavek je považován, že je v „režimu zpožděné repliky“. Režim opožděné repliky lze zkontrolovat voláním. Jediným praktickým důsledkem v současné době je varování zobrazené v zápatí stránky.

Uživatelé prostředí Shell mohou kontrolovat zpoždění replikace pomocí. Ostatní uživatelé s rozhraním API.

Databáze mají často také své vlastní monitorovací systémy, viz například MariaDB (Wikimedie) a wikitech:Help:Toolforge/Database (Wikimedie Cloud VPS).



Vyhýbání se zpoždění
Chcete-li se vyhnout nadměrnému zpoždění, měly by se dotazy, které píší velké množství řádků, rozdělit. Obvykle psát vždy jeden řádek najednou. Víceřádkové VLOŽIT (INSERT) ... VYBRAT (SELECT) dotazy jsou nejhorší pachatelé a je třeba se jim úplně vyhnout. Místo toho proveďte nejprve výběr a poté vložení.

I malé zápisy mohou způsobit zpoždění, pokud jsou prováděny velmi vysokou rychlostí a replikace není schopna držet krok. Nejčastěji se to stává ve skriptech údržby. Abyste tomu zabránili, měli byste po každých několika stovkách zápisů volat. Většina skriptů umožňuje konfigurovat přesné číslo:



Práce se zpožděním
I přes naše nejlepší úsilí není praktické zaručit prostředí s malým zpožděním. Zpoždění replikace bude obvykle kratší než jedna sekunda, ale někdy může být až 5 sekund. Pro škálovatelnost je velmi důležité udržovat nízké zatížení primárního serveru, takže pouhé odesílání všech vašich dotazů na primární server není řešením. Pokud tedy skutečně potřebujete aktuální data, doporučuje se následující postup:


 * 1) Proveďte rychlý dotaz na primární server na pořadové číslo nebo časové razítko
 * 2) Spusťte celý dotaz na repliku a zkontrolujte, zda odpovídá datům, které jste získali z primárního serveru
 * 3) Pokud ne, spusťte celý dotaz na primárním serveru

Aby nedošlo k zaplavení primárního serveru pokaždé, když se repliky zpozdí, použití tohoto přístupu by mělo být omezeno na minimum. Ve většině případů byste měli pouze číst z repliky a nechat uživatele, aby se se zpožděním vypořádal.



Uzamčení sporu
Vzhledem k vysoké míře zápisu na Wikipedii (a některých dalších wiki) musí být vývojáři MediaWiki velmi opatrní při strukturování svých zápisů, aby se vyhnuli dlouhodobým uzamčením. Ve výchozím nastavení MediaWiki otevře transakci při prvním dotazu a potvrdí ji před odesláním výstupu. Zámky se budou držet od doby, kdy je dotaz proveden, až po potvrzení. Takže můžete zkrátit dobu uzamčení provedením co nejvíce zpracování, než začnete psát dotazy. Operace aktualizace, které nevyžadují přístup k databázi, mohou být zpožděny až po odevzdání přidáním objektu do nebo do.

Tento přístup často není dost dobrý a je nutné uzavřít malé skupiny dotazů do jejich vlastní transakce. Použijte následující syntaxi:

Použití blokovacích čtení (např. klauzule FOR UPDATE) se nedoporučuje. Jsou špatně implementovány v InnoDB a způsobí pravidelné chyby zablokování. Je také překvapivě snadné ochromit wiki s tvrzením o uzamčení.

Namísto zamykání čtení zkombinujte své existenční kontroly do svých písemných dotazů pomocí vhodné podmínky v klauzuli WHERE UPDATE nebo pomocí jedinečných indexů v kombinaci s INSERT IGNORE. Potom pomocí ovlivněného počtu řádků zjistěte, zda byl dotaz úspěšný.



Schéma databáze
Při vytváření databází nezapomeňte na indexy, na zkušební wiki s desítkami stránek může vše hladce fungovat, ale skutečná wiki se zastaví. Podrobnosti najdete výše.

Konvence pojmenování najdete na stránce.



SQLite kompatibilita
Základní kontroly kompatibility můžete spustit pomocí:


 * - MediaWiki 1.36+
 * - MediaWiki 1.35 a starší

Nebo, pokud potřebujete testovat aktualizaci, postupujte takto:


 * - MediaWiki 1.36+
 * - MediaWiki 1.35 a starší
 * Protože záplaty DB aktualizují také soubor tables.sql, pro tento by jste měli předat předběžnou verzi tables.sql (soubor s úplnou definicí DB). Jinak můžete získat chybu, pokud přetáhnete index (protože již neexistuje v tables.sql, protože jste jej právě odstranili).

Výše uvedené předpokládá, že jste v $IP/maintenance/, jinak zadejte úplnou cestu k souboru. Pro opravy rozšíření použijte ekvivalent těchto přípon.



Související stránky

 * &mdash; Pokud rozšíření při aktualizaci MediaWiki vyžaduje změny v databázi, lze to provést pomocí tohoto háčku. Uživatelé pak mohou aktualizovat svou wiki spuštěním.