MediaWiki database policy/ja

このページでは、公式の MediaWiki のデータベース方針の規範について説明します. これは、RFC T220056 に従って TechCom の RFC プロセスを介して2019年12月に承認されました.



データベースのクエリ

 * MediaWiki から SQL クエリを送信するすべての新しいコードは MariaDB/MySQL の厳格モード (RFC T112637 による) の下でいかなる警告も生成しないようにする必要があります.
 * WMF は MariaDB/MySQL の厳格モード (T108255) を有効にする予定です. これは MySQL 5.7 でとにかく既定になる予定です. それ以前は、コードに警告が出ないようにする必要があります.
 * データベースを操作するコードは、以下の MySQL SQL モードと互換性がある必要があります:
 * (以下と同等: )
 * データベースのコードは、MediaWiki インストール要件のデータベース サーバーに列挙された古いバージョンと互換性がある必要があります. ただし、サポートされていないリリースにのみ適用されるものよりも、サポートされている最新のバージョン (またはその既定値や広く推奨されている既定値) にのみ適用されるような性能向上は優先すべきです.
 * レプリケーション環境では、非決定論的クエリや binlog 用の安全ではないステートメントの使用は避けるべきです. 後者は、「[Warning] Unsafe statement written to the binary log using statement format since BINLOG_FORMAT = STATEMENT」というテキストの警告で検出されます.  これには、自動インクリメント キーを使用して   を実行する場合、  がない   を実行する場合、および   などの決定論的ではない関数を使用する場合が含まれます.  詳細情報はこちら.
 * レプリケーション環境では、非決定論的クエリや binlog 用の安全ではないステートメントの使用は避けるべきです. 後者は、「[Warning] Unsafe statement written to the binary log using statement format since BINLOG_FORMAT = STATEMENT」というテキストの警告で検出されます.  これには、自動インクリメント キーを使用して   を実行する場合、  がない   を実行する場合、および   などの決定論的ではない関数を使用する場合が含まれます.  詳細情報はこちら.



スキーマの変更

 * すべての新しいテーブルには主キーが必要です. 主キー候補を作成できなかった場合 (例: すべての列が繰り返される可能性がある場合) は、別の auto_increment 列またはその他の任意のフィールド (ケースによって異なります) を追加する必要があります.
 * 主キーおよびそれを参照するフィールドは、最大値を増やすために符号なしである必要があります.
 * MediaWiki コア、ウィキメディアで展開された拡張機能、および MediaWiki に同梱された拡張機能のすべてのテーブルは、抽象スキーマ システムを使用して実装する必要があり、それらの新しいスキーマ変更は自動的に生成する必要があります.



スキーマ変更の互換性
Schema changes must provide a path for upgrading from all releases from two LTS releases before onwards (see T259771).



データベースのパッチ
データベース スキーマを変更する場合は、以下の規則に従ってください:


 * Update the installer – Update  and add an appropriate SQL patch file to  . The naming convention, if you're adding a field, is  . If you're removing a field, it is  . If you're adding a table, it is  . Look at the commit history of   to find examples of how it is done. If you're adding a bunch of fields to the same table, make all those changes in one query in one patch file.
 * Make your schema change optional – All schema changes must go through a period of being optional. Some examples:
 * Instead of changing the format of a column, create a new column, make all writes happen to the old and new column (if it exists), and deprecate use of the old column. Check if the new column exists before blindly assuming that it does. Only eliminate support for the old column after it is clear the schema migration has completed and there's no chance that we'll need to roll back to the old version of the software. If this doesn't seem feasible, send mail to Wikitech-l asking for advice.
 * You could set your new feature to only work if a config option is set to true, and set the option to false by default. Then the commit can be safely deployed before the schema change is made. To deploy your feature to the Wikimedia cluster, file a ticket in Phabricator in the relevant project with the  tag. Once you've confirmed the change has been made, you can remove the config option to enable your feature.
 * Note that this means your schema change should be optional in code - for wikimedia deployments, it is expected that every wiki with the relevant database table(s) will have the schema change applied to them. If you need different schema for different wikis, then apply the change using an extension and creating new tables dependent on that extension.

「スキーマの変更を省略可能にする」規則は、パフォーマンスまたはロジスティクスの観点から禁止される場合があります. ただし、そのようなスキーマの変更はそもそもまれであるため、wikitech-l メーリング リストで目立つようにして議論する必要があります. スキーマの変更を省略可能にすることが不可能な場合でも、変更前の状態にロールバックするスクリプトを作成することが重要です.


 * Search for input from a WMF Database Administrator – MediaWiki is deployed to Wikimedia websites every week, and it takes considerable planning to apply schema changes to MySQL-based sites the size of Wikipedia. Jaime Crespo (jcrespo on LDAP, jynus on irc) and Manuel (Arostegui, marostegui) are the best people to add to database reviews. In most cases, input is just needed on the logistics of the change.
 * Test your changes on Beta - in particular, it is a common mistake to change indexes and column definitions that would result in different query plans. Try to test the generated queries' plan with tools such as EXPLAIN; not doing so could mean that, when scaled to production, queries that only take 1 second locally, they pileup on production when they receive much more traffic and have larger tables.

注記
