Wikimedia Sprachtechnologie/Newsletter/2024/April

From mediawiki.org
This page is a translated version of the page Wikimedia Language engineering/Newsletter/2024/April and the translation is 90% complete.
Outdated translations are marked like this.

Willkommen zur Ausgabe April 2024 des Newsletters Sprache und Internationalisierung des Wikimedia Foundation Language Teams!

Dieser Newsletter informiert dich vierteljährlich über Updates zu neuen Entwicklungen von Features, Verbesserungen in verschiedenen sprachbezogenen technischen Projekten und Unterstützung, Community-Versammlungen und Ideen, wie du zu den Projekten beitragen kannst.

Abonniere den Newsletter

Wichtige Highlights

Yoruba Wikipedia erreicht 25 Millionen Aufrufe

Eine Teilnehmende bei der Veranstaltung Yoruba Storytelling

Die Yoruba-Sprachversion von Wikipedia ist unter dem Namen "Yoruba Wikipedia" bekannt und hat die Webadresse "yo.wikipedia.org". Obwohl sie im Oktober 2002 gegründet wurde, wurde der Großteil ihres Inhalts bis 2018 von Nicht-Muttersprachlern auf Yoruba verfasst. Das lag vor allem daran, dass es an muttersprachlichen Autor/innen in Yoruba mangelte.

Im Jahr 2023 erreichte die Yoruba-Wikipedia einen bedeutenden Meilenstein: Sie wurde mit 25 Millionen Aufrufen zur meistgelesenen nigerianischsprachigen Wikipedia und zur meistbesuchten Website in Yoruba$ref. Diese bemerkenswerte Leistung ist größtenteils den umfangreichen Beiträgen der Benutzergruppe der Wikimedianer/innen von Yoruba und anderen freiwilligen Mitgliedern der Yoruba Wikipedia Community zu verdanken. Mit Stand vom 15. Februar 2024 umfasst die Yoruba-Wikipedia insgesamt 33.745 Artikel und wird von 110 aktiven Autor/innen unterstützt, die regelmäßig zum Wachstum der Seite beitragen.[1] These edits include edits made by bots and automated tools. This remarkable achievement is largely attributed to the substantial contributions of the Yoruba Wikimedians User Group and other volunteer members of the Yoruba Wikipedia community. As of February 15, 2024, Yoruba Wikipedia features a total of 33,745 articles and is supported by 110 active editors who regularly contribute to its growth.

Einblicke aus der MinT Forschung

Kürzlich hat das Sprachteam der Wikimedia Foundation eine Studie initiiert, um herauszufinden, wie MinT mehr Menschen beim Lesen und Schreiben in der Wikipedia unterstützen kann, insbesondere in Sprachen, die zum ersten Mal Unterstützung durch maschinelle Übersetzung erhalten oder in denen zusätzliche maschinelle Übersetzungsoptionen verfügbar sind. In Zusammenarbeit mit Anagram Research testeten sie Ideen, um die Erfahrungen der Menschen mit der maschinellen Übersetzung zu bewerten.

Ziel der Studie war es: 1) neue Wege zu finden, um mehr Inhalte anzuzeigen und zu Beiträgen zu ermutigen, und 2) zu verstehen, wie Menschen maschinelle Übersetzung in Sprachen mit weniger Ressourcen nutzen, insbesondere dort, wo sich die Übersetzungsmöglichkeiten verbessern. Sie untersuchten auch, wie MinT dabei helfen kann, Sprachbarrieren für Wissen zu überwinden. An der Studie nahmen Sprecher/innen der Sprachen Hindi, Chhattisgarhi und Awadhi teil. Ausführliche Ergebnisse findest du hier.

Übersetzungstools für 28 Wikipedias aktiviert

Im Rahmen der Boost-Initiative zur Unterstützung der Erstellung von Inhalten auf verschiedenen Wikipedia-Seiten mit Hilfe von Übersetzungstools wurden die Tools Content und Section Translation für die 28 Wikipedias aktiviert. Diese Wikipedias wurden ausgewählt, weil sie das Potenzial haben, mit diesen Tools zu wachsen. Für 23 dieser Sprachen wurde MinT als Standarddienst in Content Translation eingestellt. Bevor diese Option aktiviert wurde, wurden diese Communities von Wikipedia eingeladen, die Qualität der maschinellen Übersetzung in ihren Wikis zu testen. Nach Konsultation von ihnen wurde diese Option als Standard festgelegt.

Diese Übersetzungstools sind im Wiki verfügbar, wo die entsprechenden Sprachen durch das MADLAD-400 open source translation model von Google Research unterstützt werden. MinT wurde entwickelt, um einen maschinellen Übersetzungsdienst mit mehreren Modellen anzubieten. Da das Sprachenteam der Foundation erwägt, das MADLAD-Modell in Zukunft in MinT zu integrieren, wird dies dazu beitragen, ihren Einfluss zu maximieren, wenn maschinelle Übersetzungsfunktionen aktiviert sind.

Tutorial für Übersetzungs-Administrator/innen

RAdimer-WMF, Associate in Movement Communications bei der Wikimedia Foundation und ehrenamtlicher Wikimedia-Mitarbeiter, hat einen Blogbeitrag mit dem Titel "Understanding translation administration" verfasst, der einen konzeptionellen Überblick über die Verwendung der Translate-Erweiterung für Personen bietet, die neu im Wikimedia Movement sind oder daran interessiert sind, Administrator/innen für Übersetzungen zu werden. Im ersten Abschnitt des Beitrags werden die wichtigsten Konzepte vorgestellt, während der zweite Teil praktische Beispiele für die Vorbereitung von Seiten für die Übersetzung enthält. Aus dem Blogbeitrag:

Die Translate Erweiterung ermöglicht es uns, übersetzbare Seiten zu erstellen und zu verwalten. Ein Verständnis der Prozesse und Features ist für eine effektive Präsentation von Inhalten in mehrsprachigen Wikis unerlässlich, die von großen Projekten wie dem Jahresplan der Foundation über CentralNotice-Banner bis hin zu einzelnen Seiten reichen. Wenn du dich mit diesem Tool auskennst, stehen dir eine Reihe von Möglichkeiten offen, um die Zugänglichkeit von Wiki-Inhalten zu verbessern und es Benutzern/in mit diversem sprachlichen Hintergrund zu ermöglichen, sich gemeinsam mit den Ideen der Seite auseinanderzusetzen.

MinT-Integration in ein KDE-Projekt

Subtitle Composer, ein Open-Source textbasierter Editor von Untertiteln, der vom KDE Desktop Projekt entwickelt wurde, hat kürzlich Unterstützung für MinT[2] integriert, so dass Benutzer/innen Untertitel nahtlos übersetzen können. Das Subtitle Composer-Team hat die Integration von MinT in dieses Projekt eigenständig und ohne direkte Beteiligung oder Unterstützung des Sprachenteams der Foundation vorgenommen. Dies ist ein bedeutender Fortschritt, der die Zugänglichkeit und Nutzbarkeit von MinT über seine ursprüngliche Verwendung in Wikimediaprojekten hinaus erweitert. Mit der neuen Unterstützung von MinT können Benutzer/innen Untertitel nun noch effizienter und genauer übersetzen.

2 Millionen Übersetzungen seit der Einführung der Übersetzungs-Tools

Die Gesamtzahl der Übersetzungen, die seit der Einführung der Tools für Content Translation und Section Translation auf Wikipedias veröffentlicht wurden, hat kürzlich einen bedeutenden Meilenstein von 2 Millionen erreicht. Darin enthalten sind verschiedene Arten von Übersetzungen, wie das Erstellen oder Erweitern von Artikeln oder Abschnitten. Dies zeigt, wie groß der Einfluss und die Verbreitung dieser Übersetzungs-Tools in allen Sprachen ist, die Wikipedia nutzen.

Die Übersetzungsarbeit von Kiwix

Stephane Coillet-Matillon, Mitbegründer von Kiwix, und Ruby D-Brown von der Open West Afrika Foundation diskutierten während des February Language Community Meeting über die laufenden Übersetzungsbemühungen von Kiwix, um Benutzeroberflächen in technischen Tools inklusiver zu gestalten.

Kiwix ist ein freies und quelloffenes Projekt, das es Benutzer/innen ermöglicht, offline auf eine Vielzahl von Inhalten zuzugreifen, darunter auch Wikipedia. Die Teilnahme ihres Teams am Wikimedia Tech Safari Program hat dazu beigetragen, die Benutzeroberflächen sprachlich inklusiv zu gestalten, so dass sie für alle leichter zu nutzen sind. Sie erzählten, wie durch technische Veranstaltungen, die von der afrikanischen Gruppe organisiert wurden, das Übersetzen für nur 20 Minuten zu einem Teil der Tagesaktivitäten wurde und alle Teilnehmenden begeisterte. Außerdem betonten sie, wie wichtig es ist, mit potenziellen Übersetzenden in Kontakt zu bleiben, um sie weiterhin einzubinden. Diese Zusammenarbeit zeigt das Engagement von Wikimedia, Wissen für alle zugänglich zu machen, egal wo sie sich befinden oder welche Sprache sie sprechen.

Community-Versammlungen und Veranstaltungen

  • Die Let's Connect Community veranstaltete im März einen Connect-a-thon zum Thema Übersetzung und Content Translation.
  • Falls du die zweite Community-Versammlung im Februar verpasst hast, kannst du das nachholen, indem du dir die Videoaufzeichnung ansiehst und die Notizen liest. Halte dich auf den Mailinglisten auf dem Laufenden, um Updates für das nächste Treffen im Mai zu erhalten.
  • Die Celtic Knot Wikimedia Languages Conference fördert die Zusammenarbeit zwischen Personen, die mit Minderheitensprachen arbeiten, und erleichtert den Informationsaustausch. Nach Jahren der Online-Treffen wird die Konferenz vom 25. bis 27. September 2024 in Waterford, Irland, stattfinden. Bleib dran für Updates zur Veranstaltung und zur Teilnahme, die bald auf der Celtic_Knot_Conference_2024-Metaseite zu finden sein werden.
  • Santhosh Thottingal vom Sprachteam der Foundation veranstaltete eine AMA (Ask Me Anything)-Session zum Thema Sprachberechnung und Schriftgestaltung auf dem developersindia channel on Reddit.

Beteilige dich

Bleib dran für die nächste Veröffentlichung! Du kannst dich für diesen Newsletter anmelden Abonnieren.

Einzelnachweise