书写体系

From mediawiki.org
This page is a translated version of the page Writing systems and the translation is 83% complete.
Outdated translations are marked like this.
i18n文档

本页为写作体系提供多方面的基本信息:多种语言手写本、写作方向、前沿翻译以及输入。

多种文字,多种方言

许多语言都用多种文字书写。 通常这是可以实现的,但缺乏软件支持,而且有时候如果不能实施,情况将变得非常复杂。 一些语言有用于支持多套书写系统的LanguageConverter。

一些语言拥有使用相同体系书写的相似方言,它们——在技术上——可以采用和不同体系书写的语言相同的方式处理。

LanguageConverter

關於如何使用LanguageConverter的文件,請參考书写系统/语法

LanguageConverter 基于语言变体的系统。(LC) 是一个基于语言变体的系统,可自动将页面内容转换为不同的变体。 变体主要是用不同的文字书写相同的语言。 要使用语言转换器,请进入国际化首选项。 如果你所在的维基支持转换,你会看到一个额外的选择脚本的选项。

Phab:T21044 -- 这需要更多的记录!

它适用于以下语言(截至 2023 年 7 月;最新列表见"languagesWithVariants"):

  • 巴厘语 (ban): Balinese (ban-bali), Latin (ban-latn) [1.36+]
  • 克里米亚鞑靼语 (crh): Latin (crh-latn), Cyrillic (crh-cyrl)
  • 英语 (en): Normal (en), Pig Latin (en-x-piglatin) (for testing, only when $wgUsePigLatinVariant is enabled)
  • 赣语 (gan): Simplified (gan-hans), Traditional (gan-hant)
  • 因纽特语 (iu): Latin (ike-latn), Syllabics (ike-cans) [1.18+]
  • 哈萨克语 (kk): Cyrillic (kk-cyrl), Latin (kk-latn), Arabic (kk-arab) Discontinued in 2023, see reasons at phab:T268143 and phab:T350684.
  • 库尔德语 (ku): Latin (ku-latn), Arabic (ku-arab) [1.11+]
  • 塞尔维亚-克罗地亚语 (sh): Cyrillic (sh-cyrl), Latin (sh-latn) [1.40+]
  • 希尔哈语 (shi): Tifinagh (shi-tfng), Latin (shi-latn) [1.19+]
  • 塞尔维亚语 (sr): Cyrillic (sr-ec), Latin (sr-el)
  • 塔吉克语 (tg): Cyrillic (tg-cyrl), Latin (tg-latn)
  • 塔里什文 (tly): Cyrillic (tly-cyrl), Latin (tly-latn) [1.36+]
  • 乌兹别克语 (uz): Cyrillic (uz-cyrl), Latin (uz-latin) [1.20+]
  • 吴语 (wuu): Simplified (wuu-hans), Traditional (wuu-hant) [1.41+]
  • 中文 (zh):
    • 简体中文 (zh-hans): China (zh-cn), Singapore (zh-sg), Malaysia (zh-my)
    • 繁体中文 (zh-hant): Taiwan (zh-tw), Hong Kong (zh-hk),[1] Macau (zh-mo)

更多的语言也需要它!

脚本的语言代码标签应遵循ISO 15924标准。

该系统目前的一个局限是,它可能特别不擅长处理基于同一底层脚本的多种书写系统。 中文维基人偶尔会在失败的情况下使用 => (单向)。 在 PHP 中,LC 总是尝试使用 sttreat up the largest chunk of words单词,因此 (分词)也经常很有用。

支持配置

通过zhwp 的 sitelib中的 wgULS/wgUVS 函数,可以在用户脚本用户界面中轻松选择变量。 这可以帮助脚本编写者为用户制作一个可感知变量的界面。 对于 LC 无法访问的其他地方,可以使用 {{int:Conversionname}} 来获取当前的用户界面语言/变量。

小工具PreviewWithVariant允许维基人在编辑器预览中检查转换结果。 您可以为自己的 wiki 进行配置。

"外语标记 "模板(如 {{lang}} )应在引用的外文文本周围添加 "禁用转换 "标记 text 以避免错误转换。 在简体/繁体维基百科中,这成为日文汉字和越南汉文的一个问题,而在标有拉丁文的维基百科中,这一问题应立即得到解决。

通过WikitextLC模块,可以在 Lua 输出中轻松插入 LC 命令。 NoteTACGroup系统允许访问预定义的特定主题转换集。 Module:地区用词允许自适应输出 "foo,在 PLACE 和 PLACE 中称为 bar,在 PLACE 中称为 baz"。

对 URL 的自动标题重定向可能会给没有此功能的界面带来明显的不便。 有关 Lua 任务,请参阅 "T49725",有关 section-anchor 任务,请参阅 "T160952"。


参见

书写方向

许多书写系统的字符从左往右写(LTR),行文自上而下(TtB)。

一些常见的脚本(尤其是阿拉伯语和希伯来语)会从右向左 (RTL) 书写字符--有关我们如何使用 HTML 输出和 CSS 样式处理从右向左和混合双向文本的更多详情,请参阅方向性支持

请注意,个别语言可与具有不同方向性的脚本一起使用,例如哈萨克语和库尔德语支持拉丁语和阿拉伯语变体。

还要注意的是,World Wide Web Consortium定义了更多用于网页的方向性,例如东北亚的从上到下,线条从左到右或从右到左堆叠。[2]

字体渲染与输入

许多脚本都没有方便用户使用的合适字体。 这可能是因为操作系统没有提供这些字体,或者用户不知道如何安装,或者没有足够的权限来安装。 通用語言選擇器 扩展试图通过将字体嵌入维基本身来解决这个问题。 字体将由服务器提供,用户系统无需安装字体。

UniversalLanguageSelector 增加了对键入特定脚本的支持,因此用户无需依赖外部工具或系统支持。

参考

  1. 台湾和香港是使用相同繁体字书写的两个主要变体,但由于市场分离和受当地zho 语言的影响,在短语用法上存在显著差异,因此您可能希望至少将 CN、TW 和 HK 保留在您的变体列表中。 如果您坚持要将中文变体的范围扁平化为基于脚本的 Simp/Trad 分离,请遵循记者在phab:T149278中的做法。
  2. CSS 编写模式 3 级