Structured Data Across Wikimedia/Section Topics/ru

На этой странице описывается ход работы по разработке и созданию функции «Темы по разделам» для статей Википедии, который в настоящее время разрабатывается командой по Структурированным Данным Викимедиа.

Предыстория
Проект «Темы по разделам» определит разделы в статье и создаст соответствующие темы для этих разделов, опираясь на несколько элементов, таких как:
 * алгоритм, который обнаружит элементы Викиданных на основе синих ссылок раздела (который будет разработан в сотрудничестве с командами по Структурированным Данным, Исследованиям и командой Платформа Данных);
 * возможность автоматического определения разделов в статье (которая будет разработана в сотрудничестве с командами по Структурированным Данным и Платформы Данных).

Одним из первых вариантов использования, которые мы предусмотрели для «Темы по разделам», будут предложения изображений на уровне секций, которые будут использовать алгоритм синих ссылок и инфраструктуру идентификации разделов, описанную выше, и будут предоставляться как через интерфейс новичков, так и через уведомления для опытных участников. Это будет основано на работе проделанной для «рекомендуемых изображений» и будет разработано в партнерстве с командами Структурированных Данных, Data Platform, Research, Search, Android и Growth.

Все эти элементы не изменят и не повлияют на текущий процесс правок для пользователей. Все эти действия будут выполняться автоматически и не будут зависеть от каких-либо действий редакторов. В настоящее время проект находится на стадии разработки и все еще существуют аспекты, которые могут потребовать дальнейшего изучения и/или отзывов от пользователей.

Примеры потенциальных «тем по разделам»
Ниже приведены некоторые примеры разделов, извлеченных из статей Википедии во время тестового запуска в английской и русской Википедии. В настоящее время мы работаем над способом определения наиболее соответствующих тем для любого данного раздела с помощью пользовательской функции взвешивания TF-IDF.


 * Пример 1 (Английская Википедия)
 * Статья: Campbell Island, New Zealand
 * Раздел: History
 * Пример «темы по разделам» “World War II”, “Pinniped”, “Brig”, “Great Depression”, “Perseverance Harbour”


 * Пример 2 (Английская Википедия)
 *  Article:  Dorothy E. Smith
 *  Section:  Biography
 *  Example of section topics:  “Toronto”, “University of British Columbia”, “London School of Economics”, “Vancouver”, “University of California, Berkeley”


 * Example 3 (English Wikipedia)
 *  Article:  Battle of Surabaya
 *  Section:  Background
 *  Example of section topics:  “Sukarno”, “Mohammad Hatta”, “Jakarta”, “Proclamation of Indonesian Independence”, “East Java”


 * Example 4 (English Wikipedia)
 *  Article:  Tour of Greece
 *  Section:  Past winners (note: the whole section is a table)
 *  Example of section topics : Names of tour’s winners, ordered by relevance score: “Ioannis Tamouridis”, “Valeriy Dmitriyev”, “Henri Manders”, “Thomas Liese”, “Assan Bazayev”, etc.


 * Example 5 (Russian Wikipedia)
 *  Article:  Адлон (отель)
 *  Section:  История
 *  Example of section topics : “Дитрих, Марлен”, “Вторая мировая война”, “Чаплин, Чарльз”, “Вильгельм II (император Германии)”, “Шинкель, Карл Фридрих”, “Первая мировая война”


 * Example 6 (Russian Wikipedia)
 *  Article:  Военная стратегия
 *  Section:  История
 *  Example of section topics:  “Сунь-цзы”, “Наполеон I”, “Первая мировая война”, “Искусство войны”, “Блицкриг”, “Александр Македонский”, “Вторая мировая война”

Further planned development
Based on the viability of those options, the project also aims at using section topics to improve our SEO reach with outside search engines, as a follow up to the experiment conducted in.