Structured Data Across Wikimedia/fr

Données structurées au sein de Wikimedia (Structured Data Across Wikimedia – SDAW) est un projet qui nous aidera à structurer le contenu sur les pages de wikitexte de façon à les rendre reconnaissables automatiquement par des machines (machine-recognizable) ainsi que reliables entre elles automatiquement par des machines (machine-relatable), afin de rendre plus facile et plus accessible la lecture, l’édition et la recherche au sein des projets et sur l’Internet.

Cela aidera les utilisateurs à associer les contenus entre les projets Wikimedia, aidera les lecteurs à entrer plus profondément dans l’écosystème de connaissances Wikimedia et aidera les contributeurs à mieux propager l’information au sein des projets et au-delà, de façon similaire à Wikidata. Le projet fournira également un lieu pour expérimenter des outils d’édition assisté par ordinateur pour rendre plus facile et plus accessible l’édition pour davantage de contributeurs de part le monde.

Contexte
Ce projet vient à la suite du développement similaire terminé sur Commons, en tant que partie de la précédente subvention Données structurées sur Commons (Structured Data on Commons &mdash; SDC), et sera partiellement financé par une subvention de trois ans de la Fondation Sloan. Le travail sur SDC nous a rendu plus attentifs au besoin de métadonnées plus avancées pour tous les contenus afin que les APIs puissent fournir de meilleurs résultats de recherche, ce qui permet en retour de rendre le contenu plus accessible, plus facilement trouvable, traduisible et utilisable pour d’autres besoins.

Le projet a trois principaux objectifs :


 * 1) Permettre aux machines de reconnaître le contenu Wikimedia et suggérer des liens vers d’autres contenus Wikimedia. Nous travaillons actuellement sur le premier cas au travers du projet de suggestion d'images.
 * 2) Imaginer un moyen de structurer les articles et les pages pour permettre de nouveaux formats de contenu – tel que du contenu proposé en plus petites parties facilement séparables qui soient plus accessibles pour les lecteurs, afin de les utiliser et de les partager.
 * 3) Donner aux utilisateurs Wikimedia un moyen plus attrayant et plus efficace de rechercher et trouver du contenu, s’appuyant sur la recherche de médias (MediaSearch) et explorant de nouvelles façons d’améliorer la recherche au sein des Wikipédias en utilisant des données structurées.

Ce qui change
Les objectifs du projet sont de concevoir et de réaliser le prototype d'un nouveau système dont le but serait d'être assez flexible pour distribuer tout type de métadonnées dont on pourrait avoir besoin dans un futur proche.

Nous avons identifié trois projets principaux que nous allons développer comme partie de notre travail :


 * 1) la Suggestion d'images, une fonctionnalité pour les utilisateurs expérimentés qui les aidera à illustrer les articles Wikipedia
 * 2) les Métatonnées de section, connu également comme Eléments de section (Section topics), pour décrire le contenu d'une section d'un article Wikipedia
 * 3) les Améliorations de la recherche (Search improvements), qui vont utiliser le contenu structuré pour proposer aux utilisateurs une manière plus conviviale et efficace de chercher et trouver du contenu dans les Wikipedias.

Suggestion d'images
L'interface utilisateur de la Suggestion d'images permet le développement de systèmes pour les données structurées, au travers de tous les projets Wikimedia.

Ce travail reposera sur le travail déjà commencé comme partie du projet de tâche structurée Ajouter une image. Mais il se focalisera sur l'amélioration du processus pour les utilisateurs expérimentés. En particulier, nous allons cibler les utilisateurs qui ont fait des modifications ou qui suivent un article donné ou un ensemble d'articles, car ils semblent être plus experts sur le sujet et porter un certain intérêt à l'amélioration de cet ou ces article(s).

Projet Eléments Section
Le projet des Eléments section (Section Topics project) identifie les sections d'un article et crée des éléments pour chacune d'elles en utilisant plusieurs méthodes telles que :


 * un algorithme qui détecte les éléments Wikidata basés sur les liens bleus des sections (développé en partenariat avec les équipes des Données structurées, de la Recherche et la Plateforme de données)
 * la possibilité de reconnaître automatiquement les sections d'un article (développé en partenariat avec les équipes des Données structurées et de la Plateforme de données).

One of the first use cases we envisioned for section topics will be section-level image suggestions, which will use the blue-links algorithm and section identification infrastructure above, and be delivered both via the newcomer experience and via notifications for experienced contributors. This will build upon the work done on image suggestions and will be developed in partnership with the Structured Data, Data Platform, Research, Search, Android, and Growth teams.

Ces éléments ne seront pas modifiés et n'impacteront pas l'expérience actuelle d'édition pour les utilisateurs. Toutes ces activités seront automatiques et ne dépendront pas des actions des contributeurs. Currently, this project is in its development phase, and there are still aspects that may require further investigation and/or feedback from users.

Améliorations de la recherche
The Search Improvements project will use structured content to give users a more inviting and more efficient way to search and find content on the Wikipedias. By improving Special:Search, we want to enable users to find the information they are looking for, or that they may not have noticed, or previously come across through existing search.

We aim to identify and define incremental “special search” improvements that use structured content, to assist users in finding the content they are looking for, especially in those language wikis that have fewer articles.

Ce que nous ne voulons pas faire

 * 1) laisser les utilisateurs en dehors du processus
 * 2) encombrer les utilisateurs avec trop de nouveaux contenus à modérer
 * 3) ajouter un biais quelconque aux projets Wikimedia
 * 4) ajouter des vecteurs supplémentaires pour le vandalisme
 * 5) introduire trop de complexité dans nos systèmes

2022

 * La phase de test de la Suggestion d'images a commencé sur les Wikipedias en catalan, finnois, hongrois et norvégien.

2022

 * First round of Image Suggestions testing on Portuguese, Russian and Indonesian Wikipedia successfully concluded.
 * Project pages updated to reflect the new current status of the initiative.

2022

 * The second year report for Structured Data Across Wikimedia has been published.
 * DPLA was awarded SDAW grant funding to drive the reuse of described and attributed images. You can read more about it at DPLA's 2022 SDAW project announcement.
 * Une consultation générale à propos des Améliorations de la recherche est ouverte.

2022

 * Project pages updated to reflect the new current status of the initiative and the three main projects to be developed.
 * La Wikipedia indonésienne s'est ajoutée comme troisième communauté de test.

2022

 * Establishing contact with Portuguese and Russian Wikipedia community as first tester communities for Image Suggestions.

2021

 * Project is moving to a first test stage, that is experimenting with the use of notifications to alert users of potential useful images for Wikipedia articles.

Mai-août 2021

 * Looking for feedback about the Image Suggestions project, through individual invitations and a month-long RfC specifically targeted to 4 Wikipedias + Commons

2021

 * Attente de commentaires sur ces idées.
 * Working on rough wireframes and mockups to help explore these ideas.
 * Exploring infrastructure to support this work via the Technical Decision Making Forum process. See.

Second semestre 2020

 * Building MediaSearch on Commons.
 * MediaSearch A/B test - conducted between 10 and 17 September 2020.

Vos commentaires
Project feedback is and will always be welcome. We are especially interested in your ideas about the extent to which you want to keep the “human-in-the-loop” throughout the topical metadata creation process. We are looking forward to hearing from you about the following open questions:


 * 1) Vos attentes concernant le projet
 * 2) What do users expect from this project? What are the necessary actions to be addressed?
 * 3) How do you envision this metadata being used? Can you think of ways it would aid in your workflows?
 * 4) Modération des métadonnées
 * 5) Est-ce que la modération est nécessaire pour éviter le vandalisme et / ou le biais ?
 * 6) Si la modération est nécessaire, comment peut-elle être gérée effectivement ?
 * 7) Ajout et confirmation des métadonnées
 * 8) Est-ce qu'il faut donner aux utilisateurs la possibilité d'approuver ou de rejeter les métadonnées suggérées automatiquement par le système ?
 * 9) Do users want to be able to add additional metadata beyond what is suggested by the automated system?
 * 10) Do you think it may just be sufficient for users to have the opportunity to send feedback with suggestions on how to improve the machine generated metadata, when necessary?
 * 11) Droits d'affichage et de modification
 * 12) Voulons-nous que les métadonnées soient visibles pour tous les utilisateurs, ou pour certaines classes d'utilisateurs ?
 * 13) Voulons-nous que les métadonnées soient modifiables par tous les utilisateurs, ou par certaines classes d'utilisateurs ?

Also, more specific feedback about related projects can generally be left on the projects' talk pages:
 * MediaSearch dans Commons
 * Suggestions d'images

Financement
Partial funding for this work is provided by a from the Alfred P. Sloan Foundation, to further the work done by the first round of funding to develop Structured Data on Commons.