Données structurées de Wikimedia/Eléments Section

From mediawiki.org
This page is a translated version of the page Structured Data Across Wikimedia/Section Topics and the translation is 100% complete.

Cette page décrit le travail entrepris pour architecturer et concevoir les fonctionnalités permettant d'identifier les éléments de section (éléments Wikidata présents dans les liens wiki) dans un article Wikipedia, actuellement en développement dans l'équipe des Données structurées de Wikimedia.

Contexte

Pour d'autres informations concernant l'architecture de l'outil actuel, voir : Structured Data Across Wikimedia/Section Topics/Data Pipeline.

Le projet des Eléments section identifie les sections dans un article et crée les éléments correspondant à ces sections en s'appuyant sur plusieurs critères tels que :

  • un algorithme qui détecte les éléments Wikidata basés sur les liens bleus des sections (développé en partenariat avec les équipes des Données structurées, de la Recherche et la Plateforme de données)
  • la possibilité de reconnaître automatiquement les sections d'un article (développé en partenariat avec les équipes des Données structurées et de la Plateforme de données).

Un des premiers cas d'utilisation que nous avons envisagé pour les entités de section est la suggestion d'image pour la section; elle utilise l'algorithme des liens en bleu et l'infrastructure d'identification des sections ci-dessus et sera disponible au travers de l'expérience des nouveaux venus et via les notifications pour les contributeurs plus expérimentés. Ceci sera fait en s'appuyant sur le travail réalisé sur les suggestions d'images et sera développé en partenariat avec les équipes des Données structurées, de la Plateforme de données, de la Recherche Research et Search, de Android, et de Croissance.

Ces éléments ne changeront pas et n'impacteront pas non plus l'expérience d'édition des utilisateurs. Toutes ces activités se feront automatiquement et ne dépendront d'aucune action venant des contributeurs. Actuellement ce projet est dans sa phase de développement et il y a encore des aspects qui nécessisent des investigations supplémentaires et / ou des commentaires de la part des utilisateurs.

Exemples d'éléments section potentiels

Vous trouverez ci-dessous quelques exemples d'éléments de section extraits d'articles Wikipedia, pendant un test réalisé sur les Wikipedias anglaise et russe. Actuellement nous travaillons sur une maniére de déterminer les sujets les plus significatifs d'une section donnée, en utilisant une fonction pondérée TF-IDF.

Exemple 1 (Wikipedia anglophone)
Article : Campbell Island, New Zealand
Section : History
Exemples d'éléments section :World War II”, “Pinniped”, “Brig”, “Great Depression”, “Perseverance Harbour
Exemple 2 (Wikipedia anglophone)
Article : Dorothy E. Smith
Section : Biography
Exemples d'éléments section :Toronto”, “University of British Columbia”, “London School of Economics”, “Vancouver”, “University of California, Berkeley
Exemple 3 (Wikipedia anglophone)
Article : Battle of Surabaya
Section : Background
Exemples d'éléments section :Sukarno”, “Mohammad Hatta”, “Jakarta”, “Proclamation of Indonesian Independence”, “East Java
Exemple 4 (Wikipedia anglophone)
Article : Tour of Greece
Section : Anciens gagnants (notez que la section entière est un tableau)
Exemples d'éléments section: Noms des gagnants du tour, rangés en fonction du score de relevance : “Ioannis Tamouridis”, “Valeriy Dmitriyev”, “Henri Manders”, “Thomas Liese”, “Assan Bazayev”, etc.
Exemple 5 (Wikipedia russe)
Article : Адлон (отель)
Section : История
Exemples d'éléments section:Дитрих, Марлен”, “Вторая мировая война”, “Чаплин, Чарльз”, “Вильгельм II (император Германии)”, “Шинкель, Карл Фридрих”, “Первая мировая война
Exemple 6 (Wikipedia russe)
Article : Военная стратегия
Section : История
Exemples d'éléments section :Сунь-цзы”, “Наполеон I”, “Первая мировая война”, “Искусство войны”, “Блицкриг”, “Александр Македонский”, “Вторая мировая война

Développement prévu dans l'avenir

En se basant sur la viabilité de ces options, le projet vise et également à utiliser les éléments de section pour améliorer la détection de notre SEO[1] par les moteurs de recherche externes, comme suite de l'expérience conduite dans la tâche T302735.

Références

  1. SEO — Search Engine Optimization