Jump to content

Sistemas de escritura

From mediawiki.org
This page is a translated version of the page Writing systems and the translation is 100% complete.
i18n docs

Esta página brinda información básica sobre la compatibilidad con varios aspectos de los sistemas de escritura: idiomas que utilizan varias escrituras; dirección de escritura; representación y entrada de fuentes.

Escrituras múltiples, dialectos múltiples

Muchos idiomas se escriben con varias escrituras. A menudo, esto es posible pero carece de soporte en el software y, a veces, es difícil, si no imposible, de implementar. Algunos idiomas tienen un LanguageConverter que agrega soporte para múltiples sistemas de escritura.

Algunos idiomas tienen dialectos muy similares que se escriben en la(s) misma(s) escritura(s) y pueden — a nivel técnico — considerarse igualmente como escrituras diferentes.

LanguageConverter

Para documentación de cómo usar LanguageConverter, véase Sistemas de escritura/Sintaxis

LanguageConverter (LC) es un sistema basado en variantes de idioma que convierte automáticamente el contenido de una página en una variante diferente. Una variante es principalmente el mismo idioma en una escritura diferente. Para utilizar LanguageConverter, ve a tus preferencias de internacionalización. Si estás en una wiki que admite conversión, verás una opción adicional para elegir la escritura.

Phab:T21044 -- ¡esto necesita más documentación!

Está implementado para los siguientes idiomas (a julio de 2023; veáse languagesWithVariants para obtener la lista más reciente):

  • balinés (ban): Balinese (ban-bali), Latin (ban-latn) [1.36+]
  • tártaro de Crimea (crh): Latin (crh-latn), Cyrillic (crh-cyrl)
  • inglés (en): Normal (en), Pig Latin (en-x-piglatin) (para pruebas, solo cuando $wgUsePigLatinVariant está activado)
  • chino gan (gan): Simplified (gan-hans), Traditional (gan-hant)
  • inuktitut (iu): Latin (ike-latn), Syllabics (ike-cans) [1.18+]
  • kazajo (kk): Cyrillic (kk-cyrl), Latin (kk-latn), Arabic (kk-arab) Suspendido en 2023, consulta los motivos en phab:T268143 y phab:T350684.
  • kurdo (ku): Latin (ku-latn), Arabic (ku-arab) [1.11+]
  • serbocroata (sh): Cyrillic (sh-cyrl), Latin (sh-latn) [1.40+]
  • tashelhit (shi): Tifinagh (shi-tfng), Latin (shi-latn) [1.19+]
  • serbio (sr): Cyrillic (sr-ec), Latin (sr-el)
  • tayiko (tg): Cyrillic (tg-cyrl), Latin (tg-latn)
  • Talysh (tly): Cyrillic (tly-cyrl), Latin (tly-latn) [1.36+]
  • uzbeko (uz): Cyrillic (uz-cyrl), Latin (uz-latin) [1.20+]
  • chino wu (wuu): Simplified (wuu-hans), Traditional (wuu-hant) [1.41+]
  • tamazight estándar marroquí (zgh): Tamazigh (zgh-tfng), Latin (zgh-latn) [1.42+]
  • chino (zh):
    • chino simplificado (zh-hans): China (zh-cn), Singapore (zh-sg), Malaysia (zh-my)
    • chino tradicional (zh-hant): Taiwan (zh-tw), Hong Kong (zh-hk),[1] Macau (zh-mo)

¡Y es necesario para muchos más idiomas!

Las etiquetas de código de idioma para tipos de escritura deben seguir el estándar ISO 15924. Sin embargo, por razones históricas, el serbio es una excepción, con sr-ec en lugar de sr-cyrl y sr-el en lugar de sr-latn. Esto está en discusión en phab:T117845.

Una limitación actual de este sistema es que puede ser particularmente malo para tratar con múltiples sistemas de escritura basados en la misma escritura subyacente. Los wikipedistas chinos ocasionalmente usan => (unidireccional) para casos fallidos. Como LC siempre intenta comerse la mayor parte de palabras usando strtr en PHP, -{}- (dividir palabras) a menudo también será útil.

Configuración de soporte

Las funciones wgULS/wgUVS en la biblioteca de sitio de zhwp (obsoleta, véase zh:Wikipedia:HanAssist para la versión actual) permiten una fácil selección de variantes en las interfaces de usuario. Esto puede ayudar a los escritores de scripts a producir una interfaz con reconocimiento de variantes para los usuarios. Para otros lugares inaccesibles por LC, se puede usar {{int:Conversionname}} para buscar el idioma/variante de la interfaz de usuario actual.

El accesorio PreviewWithVariant permite a los wikipedistas comprobar los resultados de conversión en la vista previa del editor. Puedes configurarlo para tu propia wiki.

Las plantillas de "marcador de idioma extranjero" como {{lang}} deben agregar marcadores de "deshabilitar conversión" -{ texto }- alrededor del texto en idioma extranjero para evitar errores de conversión. En las Wikipedias Hans/Hant, esto se convierte en una preocupación para el kanji japonés y el Han Nom vietnamita, mientras que en las Wikipedias con texto en alfabeto latino marcado para conversión, esta preocupación debería ser inmediata.

El módulo WikitextLC permite insertar fácilmente comandos LC en la salida de Lua. Los sistemas NoteTA y CGroup permiten acceder a conjuntos predefinidos de conversiones específicas de materias. Module:地区用词 permite una salida adaptativa de la forma "foo, conocido en LUGAR y LUGAR como bar, y en LUGAR como baz".

La redirección automática de títulos en las URL puede causar aparentes inconvenientes para las interfaces sin esta función. Consulta T49725 para la tarea Lua y T160952 para la tarea de anclaje de sección.

Redirección de URL

En algunas instalaciones de MediaWiki, se utiliza una URL corta . Por ejemplo, en Wikipedia en chino, en lugar de https://zh.wikipedia.org/wiki/维基百科 (si no se especifica la variante) o https://zh.wikipedia.org/w/index.php?title=维基百科&variant=zh-cn (si se especifica la variante sin reglas de reescritura), se puede utilizar una URL corta tal como https://zh.wikipedia.org/zh-cn/维基百科 como enlace temporal a la variante de escritura especificada (zh-cn en este caso).

Este comportamiento se puede apreciar en varias versiones idiomáticas de Wikipedia, como Wikipedia en chino, Wikipedia en serbio, etc. Sin embargo, otras como Wikipedia en chino gan y Wikipedia en balinés a menudo mantienen la URL larga con index.php&variant=.

Esto está controlado por $wgVariantArticlePath y las reglas de reescritura del servidor web (consulta los manuales de URL cortas en Apache y nginx ).

Véase también

Direccionalidad

La mayoría de los sistemas de escritura funcionan como caracteres escritos de izquierda a derecha (LTR), con líneas apiladas de arriba hacia abajo (TtB).

En algunas tipos de escritura comunes (árabe y hebreo en particular) se escriben los caracteres de derecha a izquierda (RTL); veáse soporte de direccionalidad para obtener más detalles sobre cómo manejamos el texto bidireccional de derecha a izquierda y mixto con salida en HTML y estilos CSS.

Ten en cuenta que se puede utilizar un idioma particular con escrituras que tienen diferentes direccionalidades, como el kazajo y el kurdo, que admiten variantes latina y árabe.

Ten en cuenta también que el World Wide Web Consortium ha definido más direccionalidades para el uso en páginas web, como las de arriba hacia abajo del noreste de Asia, con líneas apiladas de izquierda a derecha o de derecha. a la izquierda.[2]

Representación y entrada de fuentes

Muchos tipos de escritura no disponen de fuentes adecuadas fácilmente accesibles para los usuarios. Esto puede deberse a que los sistemas operativos no envían estas fuentes o a que los usuarios no saben cómo instalarlas o no tienen los permisos necesarios para hacerlo. La extensión de Selector Idioma Universal intenta resolver esto incrustando las fuentes en la propia wiki. Las fuentes se servirán desde el servidor y el sistema del usuario no necesitaría tener las fuentes instaladas.

UniversalLanguageSelector agrega soporte para poder escribir un determinado tipo de escritura, por lo que los usuarios no tienen que depender de herramientas externas o soporte en sus sistemas.

Referencias

  1. Taiwán y Hong Kong son dos variantes principales escritas en la misma escritura tradicional con diferencias significativas en el uso de frases debido a la separación del mercado y la influencia de los idiomas locales zho, por lo que es probable que desees mantener al menos CN, TW y HK en tu lista de variantes. Si insistes en reducir el alcance de las variantes chinas a una separación Simp/Trad basada en tipos de escritura, sigue lo que hizo el autor en phab:T149278.
  2. CSS Writing Modes Level 3