Ingeniería de idiomas de Wikimedia/Boletín/2024/Enero

From mediawiki.org
This page is a translated version of the page Wikimedia Language engineering/Newsletter/2024/January and the translation is 100% complete.

Bienvenido a la edición de Enero de 2024 del boletín Lenguaje e internacionalización' del Equipo de lenguas' de la Fundación Wikimedia.

Este boletín le ofrece actualizaciones trimestrales sobre el desarrollo de nuevas funciones, mejoras en diversos 'proyectos técnicos relacionados con lenguas y trabajos de apoyo, reuniones de la comunidad e ideas para participar en la contribución a los proyectos.

Noticias destacadas

Mahuton, un wikimedista beninés sobre la construcción de un teclado para editar artículos fácilmente en Fon en Wikimedia Hackathon 2018, Barcelona.

Lanzamiento oficial de la Wikipedia Fon tras cinco años de desarrollo en la Incubadora Wikimedia

Fon Wikipedia, nacida en el Wikimedia Hackathon 2018 de Barcelona, ¡se ha lanzado oficialmente tras graduarse de la Incubadora! El fon es hablado por millones de personas en Benín y Togo y es la lengua materna para muchos. También se usa ampliamente en Benín como lengua nacional. Tomó cinco años crear la nueva Fon Wikipedia. Dado que mucha gente no sabía escribir en Fon, y que las lenguas nativas de África reciben menos atención que otras, crear una comunidad que apoyara el proyecto fue un duro reto para los miembros de la comunidad que lo iniciaron.[1] También, descubre más sobre los cuatro nuevos proyectos lingüísticos Wikimedia que fueron aprobados recientemente (Wikipedia Dagaare, Wikipedia Moroccan Amazigh, Wikipedia Toba Batak, y Wikiquote Banjar).

Presentación de Sentencex, herramienta para mejorar el procesamiento del lenguaje natural (PLN) y la extracción de frases multilingües

El equipo de lenguas acaba de lanzar una nueva herramienta llamada Sentencex, disponible ahora tanto en Python como en Javascript. La segmentación de frases, una parte esencial del procesamiento del lenguaje natural, consiste en descomponer un texto en frases individuales. Este proceso tiene varios usos y ayuda a mejorar la funcionalidad y la velocidad del lenguaje, especialmente en el nuevo sistema de traducción automática de Wikimedia (MinT) y en el proyecto de traducción de secciones.[2]

Puedes encontrar la herramienta en GitHub y ver en acción.

El servicio de traducción MinT está disponible para 55 nuevas Wikipedias, duplica el contenido y ocupa el segundo lugar en uso

Representación gráfica de los idiomas apoyados por MinT por primera vez.

El nuevo servicio de traducción automática, MinT, que ahora ofrece traducción automática por primera vez a 55 Wikipedias, ha tenido un impacto positivo en las comunidades lingüísticas de Wikimedia. Este amplio soporte lingüístico casi ha duplicado las traducciones publicadas, y los artículos creados con MinT tienen una baja tasa de borrado (1,72%). MinT se utiliza ahora en el 8% de las traducciones publicadas con Content Translation, lo que lo convierte en el segundo servicio de traducción más utilizado en Wikipedia, después de Google Translate, en tan sólo unos meses.[3]

Servicio abierto de identificación lingüística disponible ahora para más de 200 idiomas

El equipo Language creó un servicio abierto de identificación de idiomas para detectar automáticamente el idioma en el que está escrito un texto determinado y simplificar así la interacción de los usuarios con las plataformas Wikimedia. El servicio admite la detección de 201 idiomas, y cualquiera puede acceder a la API para utilizar el servicio. Actualmente se están llevando a cabo las comprobaciones finales del servicio y la evaluación de su capacidad para soportar un tráfico elevado.[4]

Manuscrito antiguo.

Wikisource reconoce ahora textos manuscritos con Transkribus

El reconocimiento de texto manuscrito ya está activo en Wikisource a través del motor Transkribus OCR. Transkribus, una plataforma impulsada por IA, simplifica el manejo de documentos manuscritos o impresos ofreciendo varios modelos adaptados a diferentes tipos de escrituras, periodos históricos y otros factores. El motor Transkribus ya está disponible como opción junto a Google y Tesseract y actualmente está operativo en las Wikisources listadas en esta página.[5]

Panel de traducción de secciones unificado para usuarios de computadores de escritorio y teléfonos móviles

El equipo de lenguas está trabajando activamente en la adopción de un panel unificado de traducción de secciones para usuarios de computadores de escritorio y teléfonos móviles. Originalmente diseñado para teléfonos móviles en la Traducción de Contenidos, ahora se está perfeccionando para servir como un panel unificado en varias plataformas, proporcionando un entorno de traducción mejorado. Actualmente, en modo beta, puedes probarlo en Wikipedia de prueba o en cualquier wiki habilitada para la Traducción de Secciones utilizando el parámetro URL "unified-dashboard=true" (por ejemplo, ig.wikipedia.org/wiki/Special:ContentTranslation?unified-dashboard=true).

Este panel unificado ofrece una experiencia de traducción transversal perfecta. Los usuarios pueden comenzar a traducir en su computador de escritorio y continuar en un dispositivo móvil, o viceversa. También admite traducciones de secciones en el computador de escritorio, dando a los usuarios flexibilidad en todos los dispositivos.

Reuniones y eventos comunitarios

Involúcrate

Esté atento a la próxima publicación. Puedes suscribirte a este boletín.

Referencias