Structured Data Across Wikimedia/Section Topics/fr

Cette page décrit le travail entrepris pour architecturer et concevoir les fonctionnalités permettant d'identifier les éléments de section dans un article Wikipedia, actuellement en développement dans l'équipe des Données structurées de Wikimedia.

Contexte
Le projet des Eléments section identifie les sections dans un article et crée les éléments correspondant à ces sections en s'appuyant sur plusieurs critères tels que :
 * un algorithme qui détecte les éléments Wikidata basés sur les liens bleus des sections (développé en partenariat avec les équipes des Données structurées, de la Recherche et la Plateforme de données)
 * la possibilité de reconnaître automatiquement les sections d'un article (développé en partenariat avec les équipes des Données structurées et de la Plateforme de données).

One of the first use cases we envisioned for section topics will be section-level image suggestions, which will use the blue-links algorithm and section identification infrastructure above, and be delivered both via the newcomer experience and via notifications for experienced contributors. This will build upon the work done on image suggestions and will be developed in partnership with the Structured Data, Data Platform, Research, Search, Android, and Growth teams.

These elements will not change, nor impact the current editing experience for users. All these activities will be automatic and will not depend on any action from editors. Currently, this project is in its development phase, and there are still aspects that may require further investigation and/or feedback from users.

Exemples d'éléments section potentiels
The following are some examples of section topics extracted from Wikipedia articles, during a test run on English and Russian Wikipedias. Currently, we are working on a way to determine the most relevant topics for any given section, through a custom TF-IDF weight function.


 * Exemple 1 (Wikipedia anglophone)
 * Article : Campbell Island, New Zealand
 * Section : History
 * Exemples d'éléments section : “World War II”, “Pinniped”, “Brig”, “Great Depression”, “Perseverance Harbour”


 * Exemple 2 (Wikipedia anglophone)
 * Article : Dorothy E. Smith
 * Section : Biography
 * Exemples d'éléments section : “Toronto”, “University of British Columbia”, “London School of Economics”, “Vancouver”, “University of California, Berkeley”


 * Exemple 3 (Wikipedia anglophone)
 * Article : Battle of Surabaya
 * Section : Background
 * Exemples d'éléments section : “Sukarno”, “Mohammad Hatta”, “Jakarta”, “Proclamation of Indonesian Independence”, “East Java”


 * Exemple 4 (Wikipedia anglophone)
 * Article : Tour of Greece
 * Section : Anciens gagnants (notez que la section entière est un tableau)
 * Exemples d'éléments section: Noms des gagnants du tour, rangés en fonction du score de relevance : “Ioannis Tamouridis”, “Valeriy Dmitriyev”, “Henri Manders”, “Thomas Liese”, “Assan Bazayev”, etc.


 * Exemple 5 (Wikipedia russe)
 * Article : Адлон (отель)
 * Section : История
 *  Example of section topics : “Дитрих, Марлен”, “Вторая мировая война”, “Чаплин, Чарльз”, “Вильгельм II (император Германии)”, “Шинкель, Карл Фридрих”, “Первая мировая война”


 * Example 6 (Russian Wikipedia)
 *  Article:  Военная стратегия
 *  Section:  История
 *  Example of section topics:  “Сунь-цзы”, “Наполеон I”, “Первая мировая война”, “Искусство войны”, “Блицкриг”, “Александр Македонский”, “Вторая мировая война”

Further planned development
Based on the viability of those options, the project also aims at using section topics to improve our SEO reach with outside search engines, as a follow up to the experiment conducted in.