Structured Data Across Wikimedia/Image Suggestions/ru

На этой странице описывается ход работы по разработке и созданию функционала по рекомендациям изображений для опытных участников, который в настоящее время разрабатывается командой по Структурированным Данным Викимедиа.

Эта работа будет основана на работе уже начатой в рамках проекта структурированной задачи «Добавить изображение». Однако фокус этого проекта будет смещен в сторону улучшения процессов для опытных участников. В частности, мы будем ориентироваться на пользователей, которые редактировали или смотрели определенную статью или набор статей, поскольку они скорее всего являются экспертами по данной теме и заинтересованы в улучшении этой статьи или статей.

После сбора первоначальных отзывов из нескольких сообществ, проект переходит к первому этапу тестирования, который заключается в экспериментах с использованием уведомлений для оповещения пользователей о потенциально полезных изображениях для статей Википедии.

Предыстория
Пользовательский интерфейс (UI) для рекомендуемых изображений является ключевым компонентом проекта «SDAW», направленного на разработку систем структурированных данных во всех проектах Викимедиа.

Изображения являются ключевыми для иллюстрации концепций и помогают людям понять предметы. Учитывая, что Викисклад содержит более 65 миллионов изображений, мы считаем, что возможно сделать Википедию значительно более иллюстрированной с помощью изображений с Викисклада. Мы считаем, что структурированные данные могут открыть надежный канал для обогащения контента между Викискладом и Википедией. Это, в свою очередь, поможет нам расширять и разнообразить участников, улучшать контент для читателей и сокращать пробелы в контенте.

Несмотря на это, во многих Википедиях более половины статей не содержат никаких изображений. В основном это связано со сложностью текущего процесса добавления медиафайлов и установления связей между контентом и изображениями. Мы хотим упростить этот процесс.

С чего мы начинаем
Как мы уже сказали, инструмент будет основываться на работе, уже проделанной для проекта структурированной задачи «Добавить изображение». API по предложениям изображений, созданный командой «Platform Engineering», объединяет результаты «Image Suggestions Algorithm» и «MediaSearch» для предоставления предложений по сопоставлению изображений со статьями без иллюстраций, используя следующий подход:
 * 1) Проверка элемента Викиданных для статьи.
 * 2) Если ли там находится изображение, предлагает это изображение.
 * 3) Если у статьи есть категория на Викискладе, предлагает изображение из этой категории.
 * 4) Проверяет статьи на ту же тему в других языковых разделах Википедии. Предлагает главное изображение из этих статей.
 * 5) «MediaSearch» на Викискладе ищет по названию статьи, который сочетает традиционный текстовый поиск со структурированными данными из Викисклада и Викиданных. Если изображение занимает достаточно высокое место в результатах, предлагает это изображение.

В изначальных тестах объединённые алгоритмы могут предлагать изображения почти для 40% ещё не проиллюстрированных статей в конкретной Википедии. В настоящее время мы проводим дальнейшее тестирование точности совпадений. Кроме того, команды «Android» и «Growth» тестируют идеи, которые используют «API по предложениям изображений», чтобы новички могли добавлять изображения в статьи через интерфейс предлагаемых задач.

Мы также экспериментируем с добавлением результатов из «Image Suggestions Algorithm» непосредственно в «MediaSearch». Мы надеемся, что это упростит процесс технически и улучшит результаты поиска «MediaSearch». Проверьте на Фабрикаторе для получения дополнительной информации.

Что мы хотим сделать
В настоящее время проект экспериментирует с подходом, основанным на уведомлениях. Цель состоит в том, чтобы встроить предложения в существующие процессы деятельности участников в Википедии посредством еженедельных уведомлений, тем самым повышая вероятность того, что они рассмотрят такие предложения и добавят выбранные изображения в рамках своего текущего процесса редактирования. Участники могут выбрать редактирование с помощью викитекста (кода) или визуального редактора, а также просмотреть изображение и информацию о статье в уведомлении.

Предварительный рабочий процесс
Ниже приведен текущий предварительный рабочий процесс, который мы определили для этого этапа тестирования. Сбоку, вы можете найти ссылка на соответствующую задачу на Фабрикаторе.
 * 1) Уведомления отправляются еженедельно всем участникам, у которых есть не менее 500 правок, в заранее определенный день и время (например, каждый понедельник в 08:00 по UTC), по всему миру → проверьте  на Фабрикаторе
 * 2) Уведомление содержит ссылку на персональные настройки участников, чтобы они могли отказаться от уведомлений → на тему отказа на уведомлений проверьте задачу  в Фабрикаторе
 * 3) * Опция «Предложения по изображениям» будет добавлен в нижнюю часть списка уведомлений участников о добавлении/отказе.
 * 4) Предложения будут выбраны случайным образом из списка совпадающих последних изображений для статей без иллюстраций, с использованием алгоритмов описанных выше.
 * 5) Участники будут избраны случайным образом из группы участников, которые:
 * 6) * имеют не менее 500 правок в проекте
 * 7) * не отказался от уведомлений
 * 8) * получили до 2 уведомлений об изображениях за конкретную неделю
 * 9) Инструмент проверит список наблюдения участника на наличие статей, отредактированных за последние 30 дней
 * 10) * Если участник уже получил уведомление об ID статьи, инструмент переходит к следующей статье
 * 11) * В противном случае инструмент соответствует одному предложению и отправляет уведомление
 * 12) Если совпадения по изображениям остаются, то инструмент проверяет наличие других статей в списках наблюдения участников
 * 13) Процесс уведомления будет генерироваться еженедельно, пока совпадения по изображениям не будут исчерпаны или не останется подходящих участников
 * 14) * Если изображение было размещено в статье, соответствующее уведомление будет удалено из списка
 * 15) * Уведомления для конкретной статьи о совпадении изображений будет показано конкретному участнику только один раз
 * 16) * Одно и то же совпадение по изображению может быть отправлено для рассмотрения нескольким участникам (за исключением случая, когда изображение было добавлено в статью).

Пользовательский опыт
Основываясь на информации, предоставленной в уведомлении, участник сможет:
 * 1) выполнить свой обычный процесс добавления изображений (например, добавить изображение с помощью функции «вставки» в викитексте или визуальном редакторе).
 * 2) * в этом случае участнику будет предоставлена только возможность просмотреть совпадение — никакой дополнительной помощи или функции предоставлено не будет
 * 3) кликнуть на «Просмотреть изображение» в уведомлении
 * 4) * это перенаправит участника на изображение на Викискладе
 * 5) кликнуть на кнопку «Просмотреть статью» в уведомлении
 * 6) * это перенаправит участника на статью в Википедии

Идеи на будущее
Ниже в списке перечислены все идеи, которые выходят за рамки текущего этапа тестирования, но могут быть разработаны в будущем:
 * Предложения участникам, загрузившим на Викисклад изображения, подходящие для каких-то статей
 * Предложения, предоставленные другими способами, помимо уведомлений (напр., предложения в диалоговым окне поиска изображений в «VisualEditor»)
 * Иллюстрированные статьи
 * Рекомендация для изображения на уровне раздела
 * Инструмент, который поможет участникам добавлять изображения в статьи
 * Целевая страница, которая позволит участникам просматривать несколько предложений за раз
 * Ограничить уведомления только для участников, у которых в истории есть добавления изображений в статьи за последние 30 дней

Показатели и аналитика
Мы планируем измерить следующие показатели, чтобы проанализировать эффективность текущего тестирования и определить, является ли инструмент успешным:
 * 1) Количество отправленных уведомлений
 * 2) Число открытых уведомлений о предложениях по изображениям (показатель взаимодействия с уведомлениями)
 * 3) Количество отказов (небольшое количество отказов = уведомления полезны)
 * 4) Число предложенных изображений, которые будут добавлены в соответствующие статьи в течение месяца с момента получения уведомления
 * 5) Число предложенных изображений, не отклоненных из соответствующих статей (низкая частота отказа = хорошее качество предложенных совпадений)

Чего мы не хотим сделать?

 * Создать новый инструмент, который останется неиспользованным из-за отсутствия интереса для использования
 * Раздражать участников слишком большим количеством уведомлений
 * Поощрять правки, которые в подавляющем большинстве случаев будут отменены
 * Поощрять правки, которые противоречат существующей политике и/или практике (НТЗ, оригинальные исследования...)
 * Поощрять правки, которые вносят дополнительную предвзятость в статью

Отзывы
Отзывы по проекту всегда приветствуется и будут приветствоваться. Нас особенно интересуют ваши идеи и мы с нетерпением ждем ваших ответов на странице обсуждения по следующим вопросам:
 * 1) Каково ваше мнение о шагах, изложенных выше?
 * 2) Должны ли мы помогать редакторам с добавлением изображений в статьи?
 * 3) Как мы можем помочь участникам убедиться, что они следуют правилам конкретной Википедии при выборе и размещении изображения?
 * 4) Как мы можем помочь участникам добавлять соответствующие подписи к изображениям?
 * 5) Как мы можем помочь участникам добавлять соответствующие краткие описания?

Консультации

 * Август 2021: Первый раунд отзывов (основной RFC для Википедии, основной RFC для Викисклада)

Что из себя представляет инструмент для рекомендации изображений?
Инструмент «Рекомендуемые изображения» является ключевым компонентом проекта Структурированные Данные Викимедиа и его цель облегчить пользователям поиск потенциальных изображений и медиа для статей, которые в настоящее время без иллюстраций.

Пересекается ли инструмент «Рекомендуемые изображения» каким-то образом с инструментом «Добавить изображение» от команды роста?
Технически да. Эти два инструмента используют один и тот же алгоритм, но они также служат разным целям:
 * инструмент «Добавить изображение» предназначен для новичков и менее опытных участников, у которых практически нет опыта добавления изображений в статьи;
 * инструмент «Рекомендуемые изображения» предназначен для более опытных участников, у которых уже есть опыт добавления изображений и других медиа файлов в статьи (т.е. пользователей с более чем 500 правками).

Какова связь между инструментом рекомендации изображений и Структурированными данными на Викискладе?
Этот инструмент будет использовать данные, поступающие из Викиданных, а также Структурированные Данные из Викисклада, чтобы найти потенциальные медиа файлы для добавления в статьи Википедии, где нет изображений.

Более конкретно, инструмент проверит соответствующий элемент в Викиданных и проверит, есть ли там изображение (через Wikidata property P18) или связанная категория на Викисклад (через Wikidata property P373). Если в обоих случаях потенциальные изображения не будут найдены, инструмент проверит другие статьи Википедии на других языках, чтобы узнать, есть ли соответствующие изображение, которое можно найти. Наконец, инструмент выполнит поиск в «MediaSearch» на Викискладе по названию статьи и если какое-то изображение занимает достаточно высокое место в результатах поиска, инструмент выберет это изображение.