Structured Data Across Wikimedia/ru

Структурированные Данные Викимедиа (коротко SDAW) - проект, который поможет нам структурировать контент на страницах вики-текста таким образом, чтобы оно было машинно-распознаваемым, чтобы упростить чтение, редактирование и поиск в проектах и в Интернете, для их более доступности.

Это поможет пользователям связать контент между проектами Викимедиа, поможет читателям глубже погрузиться в экосистему знаний «Викимедиа» и поможет участникам распространять информацию между проектами и за их пределами таким же способом, как Викиданные. Проект также предоставит площадку для экспериментов с компьютерными инструментами редактирования, чтобы упростить редактирование и сделать его более доступным для большего числа редакторов по всему миру.

Предыстория
Этот проект является продолжением аналогичного проекта, которая была завершена на Викискладе в рамках предыдущего гранта Структурированные данные на Викискладе (SDC) и будет частично финансироваться за счет трехлетнего гранта «Sloan Foundation». Работа над SDC позволила нам осознать необходимость более продвинутых метаданных для всего контента и API для предоставления лучших результатов поиска, что в свою очередь, сделало бы контент более доступным, видимым, переводимым и пригодным для других нужд.

У проекта три основных целей:
 * 1) Позволить машинам распознавать контент Викимедиа и предлагать связь с другим контентом Викимедиа. Мы изучаем это в первую очередь в рамках проекта «рекомендаций по изображениям».
 * 2) Разработать способ выстраивания статей и страниц, позволяющий создавать новые форматы контента – контент, который легко предоставляемый в виде небольших, легко усваиваемых фрагментов, более доступным читателям для использования и обмена.
 * 3) Предоставить пользователям Викимедиа более привлекательный и эффективный способ поиска и нахождения контента, опираясь MediaSearch и изучая новые способы улучшения поиска в Википедиях с использованием структурированных данных.

Что меняется
Цель этого проекта - разработать и создать прототип новой системы, которая должна быть достаточно удобным, чтобы обслуживать все виды метаданных, которые нам могут понадобиться для поддержки в ближайшем будущем.

We identified three main projects that we will develop, as part of our work:
 * 1) Image suggestion, a feature for experienced users to help illustrate Wikipedia articles;
 * 2) Sectional metadata, also known as Section topics, in order to describe what a section of a Wikipedia article is about;
 * 3) Search experimentations, that will use structured content to give users a more inviting and efficient way to search and find content on the Wikipedias.

Image suggestion
The Image Suggestion UI aims at developing systems for structured data across all Wikimedia projects.

This work will build on the work already begun as part of the “Add an image” structured task project. However, its focus will be shifted towards improving the processes for experienced contributors. In particular, we will target users who have edited or watched a particular article or set of articles, since they are likely to be experts in the topic and to have interest in seeing that article(s) improve.

Section topics
The Section Topics project will identify sections in an article and create topics accordingly for those sections, drawing on several elements:
 * an algorithm that detects Wikidata items based on the section’s blue links (which will be developed in partnership with the Structured Data, Research, Machine Learning, and Data Platform teams);
 * the ability to automatically identify sections in an article (which will be developed in partnership with the Structured Data and Data Platform teams);
 * section-level image suggestions, which will use the blue-links algorithm and section identification infrastructure above, and be delivered both via the newcomer experience and via notifications for experienced contributors.

This last point will build upon the prior image suggestions work and will be developed in partnership with the Structured Data, Machine Learning, Data Platform, Research, Search, and Growth teams.

These elements will not change, nor impact the current editing experience for users. All these activities will be automatic and will not depend on any action from users who edit an article. Currently, this project is still in the investigating phase, and there are still aspects that may require further investigation and/or feedback from users.

Based on the viability of those options, the project also aims at:
 * using section topics to improve our SEO reach with outside search engines (in partnership with the Web team)
 * establishing partnerships with the larger Wikimedia community to show the impact of our new tools (in partnership with the Structured Data, Growth, and Community Programs (GLAM/Campaigns) teams).

Search experimentation
The Search Experimentation project will use structured content to give users a more inviting and more efficient way to search and find content on the Wikipedias.

We aim to identify and define incremental “special search” improvements that use structured content, to assist users in finding the content they are looking for, especially in those language wikis that have fewer articles.

Also this project is currently still in the investigating phase, and there are still aspects that may require further investigation and/or feedback from users.

Чего мы не хотим сделать?

 * 1) Оставить пользователей вне процесса
 * 2) Перегружать пользователей слишком большим количеством нового контента для отслеживания
 * 3) Добавить любую дополнительную предвзятость к проектам Викимедиа
 * 4) Добавить дополнительные возможности для вандализма
 * 5) Внести слишком много сложностей в наши системы

2022

 * Project pages updated to reflect the new current status of the initiative and the three main projects to be developed.

2022

 * Establishing contact with Portuguese and Russian Wikipedia community as first tester communities for Image Suggestions.

2021

 * Проект переходит к первому этапу тестирования, стартует эксперимент с использованием уведомлений для оповещения пользователей о возможных полезных изображениях для статей Википедии.

Май-Август 2021

 * Получение отзывов о проекте «Рекомендации по изображениям» при помощи индивидуальных приглашений и месячного обсуждения в RFC, специально предназначенного для 4 Википедий + Викисклада

2021

 * Получение отзывов об этих идеях.
 * Работа над первичными скелетами и макетами, чтобы помочь изучить эти идеи.
 * Изучение инфраструктуры для поддержки этой работы в рамках процесса «Форума по Принятию Технических Решений». Проверьте.

Вторая половина 2020 года

 * Создание «MediaSearch» на Викискладе.
 * MediaSearch A/B test - проводится в период с 10 по 17 сентября 2020 года.

Отзывы
Отзывы по проекту всегда приветствовались и будут приветствоваться. Нас особенно интересуют ваши идеи о том, в какой степени вы хотите поддержать идею «человека в цикле» на протяжении всего процесса создания тематических метаданных. Мы ожидаем от вас получить ответы на следующие вопросы:
 * 1) Ваши ожидания относительно проекта
 * 2) Чего пользователи ожидают от этого проекта? Какие необходимые шаги необходимо предпринять?
 * 3) Как вы представляете себе использование этих метаданных? Можете ли вы подумать о том, как это могло бы помочь вам в вашей работе?
 * 4) Модерация метаданных
 * 5) Необходима ли модерация, чтобы избежать вандализма и/или предвзятости?
 * 6) Если необходима модерация, то как ею можно эффективно управлять?
 * 7) Добавление и подтверждение метаданных
 * 8) Хотят ли пользователи иметь возможность подтверждать или отклонять метаданные, предлагаемые автоматизированной системой?
 * 9) Хотят ли пользователи иметь возможность добавлять дополнительные метаданные сверх того, что предлагается автоматизированной системой?
 * 10) Считаете ли вы, что пользователям может быть полезной иметь возможность отправлять отзывы с предложениями о том, как улучшить метаданные, созданные автоматизированной системой, когда это необходимо?
 * 11) Преимущества для визуализации и редактирования
 * 12) Хотим ли мы, чтобы метаданные были видны всем пользователям или только определенным пользователям?
 * 13) Хотим ли мы, чтобы метаданные были доступны для редактирования, для всех пользователей или только для конкретных пользователей?

Кроме этого, более конкретные отзывы о проектах, можно оставить на страницах обсуждения проектов:
 * MediaSearch на Викискладе
 * Рекомендации по изображениям

Финансирование
Частичное финансирование предоставлено Фонда Альфреда П. Слоана для продолжения работы, проделанной в рамках первого раунда финансирования по разработке Структурированных Данных на Викискладе.