Structured Data Across Wikimedia/ru

Структурированные Данные Викимедиа (коротко SDAW) - проект, который поможет нам структурировать контент на страницах вики-текста таким образом, чтобы оно было машинно-распознаваемым, чтобы упростить чтение, редактирование и поиск в проектах и в Интернете, для их более доступности.

Это поможет пользователям связать контент между проектами Викимедиа, поможет читателям глубже погрузиться в экосистему знаний «Викимедиа» и поможет участникам распространять информацию между проектами и за их пределами таким же способом, как Викиданные. Проект также предоставит площадку для экспериментов с компьютерными инструментами редактирования, чтобы упростить редактирование и сделать его более доступным для большего числа редакторов по всему миру.

Предыстория
Этот проект является продолжением аналогичного проекта, которая была завершена на Викискладе в рамках предыдущего гранта Структурированные данные на Викискладе (SDC) и будет частично финансироваться за счет трехлетнего гранта «Sloan Foundation». Работа над SDC позволила нам осознать необходимость более продвинутых метаданных для всего контента и API для предоставления лучших результатов поиска, что в свою очередь, сделало бы контент более доступным, видимым, переводимым и пригодным для других нужд.

У проекта три основных целей:
 * 1) Позволить машинам распознавать контент Викимедиа и предлагать связь с другим контентом Викимедиа. Мы изучаем это в первую очередь в рамках проекта «рекомендаций по изображениям».
 * 2) Разработать способ выстраивания статей и страниц, позволяющий создавать новые форматы контента – контент, который легко предоставляемый в виде небольших, легко усваиваемых фрагментов, более доступным читателям для использования и обмена.
 * 3) Предоставить пользователям Викимедиа более привлекательный и эффективный способ поиска и нахождения контента, опираясь MediaSearch и изучая новые способы улучшения поиска в Википедиях с использованием структурированных данных.

Что меняется
Цель этого проекта - разработать и создать прототип новой системы, которая должна быть достаточно удобным, чтобы обслуживать все виды метаданных, которые нам могут понадобиться для поддержки в ближайшем будущем.

Мы определили три главных проекта, которые мы будем развивать в рамках нашей работы:
 * 1) Рекомендуемые изображения - инструмент для опытных пользователей, помогающая добавлять иллюстрации к статьям Википедии;
 * 2) Метаданные по разделам, также известен как Темы по разделам, для описания того, о чем раздел статьи Википедии;
 * 3) Поисковые эксперимент, которые будут использовать структурированный контент, чтобы предоставить пользователям более привлекательный и эффективный способ поиска и находки контента в Википедии.

Рекомендуемые изображения
Пользовательский интерфейс для инструмента «Рекомендуемые изображения» нацелен на разработку систем для структурированных данных во всех проектах Викимедиа.

Эта работа будет основываться на то, что уже начата в рамках проекта структурированной задачи «Добавить изображение». Однако, фокус нашего проекта будет смещен в сторону улучшения процессов для опытных участников. В частности, мы будем ориентироваться на пользователей, которые редактировали или смотрели определенную статью или набор статей, поскольку они, скорее всего, являются профи в данной тематике и заинтересованы в улучшении этой статьи (или статей).

Темы по разделам
Проект «Темы по разделов» определит разделы в статье и создаст соответствующие темы для этих разделов, опираясь на несколько элементов:
 * алгоритм, который обнаружит элементы Викиданных на основе синих ссылок раздела (который будет разработан в сотрудничестве с командами по Структурированным Данным, Исследованиям, Машинному Обучению и командой Платформа Данных);
 * возможность автоматического определения разделов в статье (которая будет разработана в сотрудничестве с командами по Структурированным Данным и Платформы Данных);
 * предложения по изображениям на уровне разделов, которые будут использовать алгоритм синих ссылок и инфраструктуру идентификации разделов, описанные выше, в следствии чего будут предоставлять рекомендации, как для новичков, так и через уведомления для опытных участников.

Этот последний пункт будет основан на предыдущей работе по «Рекомендуемым изображениям» и будет разработан в сотрудничестве с командами по Структурированным Данным, Исследованиям, Машинному Обучению, Платформа Данных, Поиску и Развитию.

Все эти элементы не изменят и не повлияют на текущий процесс правок для пользователей. Все эти действия будут выполняться автоматически и не будут зависеть от каких-либо действий пользователей, редактирующих статью. В настоящее время проект все еще находится на стадии исследования и все еще существуют аспекты, которые могут потребовать дальнейшего изучения и/или отзывов от пользователей.

Based on the viability of those options, the project also aims at:
 * using section topics to improve our SEO reach with outside search engines (in partnership with the Web team)
 * establishing partnerships with the larger Wikimedia community to show the impact of our new tools (in partnership with the Structured Data, Growth, and Community Programs (GLAM/Campaigns) teams).

Search experimentation
The Search Experimentation project will use structured content to give users a more inviting and more efficient way to search and find content on the Wikipedias.

We aim to identify and define incremental “special search” improvements that use structured content, to assist users in finding the content they are looking for, especially in those language wikis that have fewer articles.

Also this project is currently still in the investigating phase, and there are still aspects that may require further investigation and/or feedback from users.

Чего мы не хотим сделать?

 * 1) Оставить пользователей вне процесса
 * 2) Перегружать пользователей слишком большим количеством нового контента для отслеживания
 * 3) Добавить любую дополнительную предвзятость к проектам Викимедиа
 * 4) Добавить дополнительные возможности для вандализма
 * 5) Внести слишком много сложностей в наши системы

2022

 * Project pages updated to reflect the new current status of the initiative and the three main projects to be developed.

2022

 * Establishing contact with Portuguese and Russian Wikipedia community as first tester communities for Image Suggestions.

2021

 * Проект переходит к первому этапу тестирования, стартует эксперимент с использованием уведомлений для оповещения пользователей о возможных полезных изображениях для статей Википедии.

Май-Август 2021

 * Получение отзывов о проекте «Рекомендации по изображениям» при помощи индивидуальных приглашений и месячного обсуждения в RFC, специально предназначенного для 4 Википедий + Викисклада

2021

 * Получение отзывов об этих идеях.
 * Работа над первичными скелетами и макетами, чтобы помочь изучить эти идеи.
 * Изучение инфраструктуры для поддержки этой работы в рамках процесса «Форума по Принятию Технических Решений». Проверьте.

Вторая половина 2020 года

 * Создание «MediaSearch» на Викискладе.
 * MediaSearch A/B test - проводится в период с 10 по 17 сентября 2020 года.

Отзывы
Отзывы по проекту всегда приветствовались и будут приветствоваться. Нас особенно интересуют ваши идеи о том, в какой степени вы хотите поддержать идею «человека в цикле» на протяжении всего процесса создания тематических метаданных. Мы ожидаем от вас получить ответы на следующие вопросы:
 * 1) Ваши ожидания относительно проекта
 * 2) Чего пользователи ожидают от этого проекта? Какие необходимые шаги необходимо предпринять?
 * 3) Как вы представляете себе использование этих метаданных? Можете ли вы подумать о том, как это могло бы помочь вам в вашей работе?
 * 4) Модерация метаданных
 * 5) Необходима ли модерация, чтобы избежать вандализма и/или предвзятости?
 * 6) Если необходима модерация, то как ею можно эффективно управлять?
 * 7) Добавление и подтверждение метаданных
 * 8) Хотят ли пользователи иметь возможность подтверждать или отклонять метаданные, предлагаемые автоматизированной системой?
 * 9) Хотят ли пользователи иметь возможность добавлять дополнительные метаданные сверх того, что предлагается автоматизированной системой?
 * 10) Считаете ли вы, что пользователям может быть полезной иметь возможность отправлять отзывы с предложениями о том, как улучшить метаданные, созданные автоматизированной системой, когда это необходимо?
 * 11) Преимущества для визуализации и редактирования
 * 12) Хотим ли мы, чтобы метаданные были видны всем пользователям или только определенным пользователям?
 * 13) Хотим ли мы, чтобы метаданные были доступны для редактирования, для всех пользователей или только для конкретных пользователей?

Кроме этого, более конкретные отзывы о проектах, можно оставить на страницах обсуждения проектов:
 * MediaSearch на Викискладе
 * Рекомендации по изображениям

Финансирование
Частичное финансирование предоставлено Фонда Альфреда П. Слоана для продолжения работы, проделанной в рамках первого раунда финансирования по разработке Структурированных Данных на Викискладе.