Структурированные Данные Викимедиа/Рекомендуемые изображения

From mediawiki.org
This page is a translated version of the page Structured Data Across Wikimedia/Image Suggestions and the translation is 100% complete.

На этой странице описывается ход работы по разработке и созданию функционала по рекомендациям изображений для опытных участников, который в настоящее время разрабатывается командой по Структурированным Данным Викимедиа.

Эта работа будет основана на работе уже начатой в рамках проекта структурированной задачи «Добавить изображение». Однако фокус этого проекта будет смещен в сторону улучшения процессов для опытных участников. В частности, мы будем ориентироваться на пользователей, которые редактировали или смотрели определенную статью или набор статей, поскольку они скорее всего являются экспертами по данной теме и заинтересованы в улучшении этой статьи или статей.

После сбора первоначальных отзывов из нескольких сообществ, проект переходит к первому этапу тестирования, который заключается в экспериментах с использованием уведомлений для оповещения пользователей о потенциально полезных изображениях для статей Википедии.

Предыстория

Пользовательский интерфейс (UI) для рекомендуемых изображений является ключевым компонентом проекта «SDAW», направленного на разработку систем структурированных данных во всех проектах Викимедиа.

Изображения являются ключевыми для иллюстрации концепций и помогают людям понять предметы. Учитывая, что Викисклад содержит более 65 миллионов изображений, мы считаем, что возможно сделать Википедию значительно более иллюстрированной с помощью изображений с Викисклада. Мы считаем, что структурированные данные могут открыть надежный канал для обогащения контента между Викискладом и Википедией. Это, в свою очередь, поможет нам расширять и разнообразить участников, улучшать контент для читателей и сокращать пробелы в контенте.

Несмотря на это, во многих Википедиях более половины статей не содержат никаких изображений. В основном это связано со сложностью текущего процесса добавления медиафайлов и установления связей между контентом и изображениями. Мы хотим упростить этот процесс.

Проект

С чего мы начинаем

Как мы уже сказали, инструмент будет основываться на работе, уже проделанной для проекта структурированной задачи «Добавить изображение». API по предложениям изображений, созданный командой «Platform Engineering», объединяет результаты «Image Suggestions Algorithm» и «MediaSearch» для предоставления предложений по сопоставлению изображений со статьями без иллюстраций, используя следующий подход:

  1. Проверка элемента Викиданных для статьи.
    1. Если ли там находится изображение image (P18), предлагает это изображение.
    2. Если у статьи есть категория на Викискладе Commons category (P373), предлагает изображение из этой категории.
  2. Проверяет статьи на ту же тему в других языковых разделах Википедии. Предлагает главное изображение из этих статей.
  3. «MediaSearch» на Викискладе ищет по названию статьи, который сочетает традиционный текстовый поиск со структурированными данными из Викисклада и Викиданных. Если изображение занимает достаточно высокое место в результатах, предлагает это изображение.

В изначальных тестах объединённые алгоритмы могут предлагать изображения почти для 40% ещё не проиллюстрированных статей в конкретной Википедии. В настоящее время мы проводим дальнейшее тестирование точности совпадений. Кроме того, команды «Android» и «Growth» тестируют идеи, которые используют «API по предложениям изображений», чтобы новички могли добавлять изображения в статьи через интерфейс предлагаемых задач.

Мы также экспериментируем с добавлением результатов из «Image Suggestions Algorithm» непосредственно в «MediaSearch». Мы надеемся, что это упростит процесс технически и улучшит результаты поиска «MediaSearch». Проверьте задача T283869 на Фабрикаторе для получения дополнительной информации.

Что мы хотим сделать

Для previous mockups and ideas, см.: Structured Data Across Wikimedia/Image Suggestions/2021-02.
Для more information about the current tool architecture, см.: Structured Data Across Wikimedia/Image Suggestions/Data Pipeline.

В настоящее время проект экспериментирует с подходом, основанным на уведомлениях. Цель состоит в том, чтобы встроить предложения в существующие процессы деятельности участников в Википедии посредством еженедельных уведомлений, тем самым повышая вероятность того, что они рассмотрят такие предложения и добавят выбранные изображения в рамках своего текущего процесса редактирования. Участники могут выбрать редактирование с помощью викитекста (кода) или визуального редактора, а также просмотреть изображение и информацию о статье в уведомлении.

Рабочий процесс

Этот макет представляет собой приблизительное представление о том, как уведомления могут отображаться в уведомлениях у пользователя.

Ниже приводится текущая схема работы. Везде, где это необходимо, дается ссылка на соответствующую задачу на Phabricator.

  1. Уведомления отправляются еженедельно всем участникам, у которых есть не менее 500 правок, в заранее определенный день и время (например, каждый понедельник в 08:00 по UTC), по всему миру → проверьте задача T292147 на Фабрикаторе
  2. Уведомление содержит ссылку на персональные настройки участников, чтобы они могли отказаться от уведомлений → на тему отказа на уведомлений проверьте задачу задача T292146 в Фабрикаторе
    • Опция «Предложения по изображениям» будет добавлен в нижнюю часть списка уведомлений участников о добавлении/отказе.
  3. Предложения будут выбраны случайным образом из списка совпадающих последних изображений для статей без иллюстраций, с использованием алгоритмов описанных выше.
  4. Участники будут избраны случайным образом из группы участников, которые:
    • имеют не менее 500 правок в проекте
    • не отказался от уведомлений
    • получили до 2 уведомлений об изображениях за конкретную неделю
  5. Инструмент проверит список наблюдения участника на наличие статей, отредактированных за последние 30 дней
    • Если участник уже получил уведомление об ID статьи, инструмент переходит к следующей статье
    • В противном случае инструмент соответствует одному предложению и отправляет уведомление
  6. Если совпадения по изображениям остаются, то инструмент проверяет наличие других статей в списках наблюдения участников
  7. Процесс уведомления будет генерироваться еженедельно, пока совпадения по изображениям не будут исчерпаны или не останется подходящих участников
    • Уведомления для конкретной статьи о совпадении изображений будет показано конкретному участнику только один раз
    • Одно и то же совпадение по изображению может быть отправлено для рассмотрения нескольким участникам (за исключением случая, когда изображение было добавлено в статью).

Пользовательский опыт

Основываясь на информации, предоставленной в уведомлении, участник сможет:

  1. выполнить свой обычный процесс добавления изображений (например, добавить изображение с помощью функции «вставки» в викитексте или визуальном редакторе).
    • в этом случае участнику будет предоставлена только возможность просмотреть совпадение — никакой дополнительной помощи или функции предоставлено не будет
  2. кликнуть на «Просмотреть изображение» в уведомлении
    • это перенаправит участника на изображение на Викискладе
  3. кликнуть на кнопку «Просмотреть статью» в уведомлении
    • это перенаправит участника на статью в Википедии

Идеи на будущее

Ниже в списке перечислены все идеи, которые выходят за рамки текущего этапа тестирования, но могут быть разработаны в будущем:

  • Предложения участникам, загрузившим на Викисклад изображения, подходящие для каких-то статей
  • Предложения, предоставленные другими способами, помимо уведомлений (напр., предложения в диалоговым окне поиска изображений в «VisualEditor»)
  • Иллюстрированные статьи
  • Рекомендация для изображения на уровне раздела
  • Инструмент, который поможет участникам добавлять изображения в статьи
  • Целевая страница, которая позволит участникам просматривать несколько предложений за раз
  • Ограничить уведомления только для участников, у которых в истории есть добавления изображений в статьи за последние 30 дней

Показатели и аналитика

Мы планируем измерить следующие показатели, чтобы проанализировать эффективность текущего тестирования и определить, является ли инструмент успешным:

  1. Количество отправленных уведомлений
  2. Число открытых уведомлений о предложениях по изображениям (показатель взаимодействия с уведомлениями)
  3. Количество отказов (небольшое количество отказов = уведомления полезны)
  4. Число предложенных изображений, которые будут добавлены в соответствующие статьи в течение месяца с момента получения уведомления
  5. Число предложенных изображений, не отклоненных из соответствующих статей (низкая частота отказа = хорошее качество предложенных совпадений)

Чего мы не хотим сделать?

  • Создать новый инструмент, который останется неиспользованным из-за отсутствия интереса для использования
  • Раздражать участников слишком большим количеством уведомлений
  • Поощрять правки, которые в подавляющем большинстве случаев будут отменены
  • Поощрять правки, которые противоречат существующей политике и/или практике (НТЗ, оригинальные исследования...)
  • Поощрять правки, которые вносят дополнительную предвзятость в статью

Отзывы

Отзывы по проекту всегда приветствуется и будут приветствоваться. Нас особенно интересуют ваши идеи и мы с нетерпением ждем ваших ответов на странице обсуждения по следующим вопросам:

  1. Каково ваше мнение о шагах, изложенных выше?
  2. Должны ли мы помогать редакторам с добавлением изображений в статьи?
  3. Как мы можем помочь участникам убедиться, что они следуют правилам конкретной Википедии при выборе и размещении изображения?
  4. Как мы можем помочь участникам добавлять соответствующие подписи к изображениям?
  5. Как мы можем помочь участникам добавлять соответствующие краткие описания?

Консультации

ЧаВо

Что из себя представляет инструмент для рекомендации изображений?

Инструмент «Рекомендуемые изображения» является ключевым компонентом проекта Структурированные Данные Викимедиа и его цель облегчить пользователям поиск потенциальных изображений и медиа для статей, которые в настоящее время без иллюстраций.

Пересекается ли инструмент «Рекомендуемые изображения» каким-то образом с инструментом «Добавить изображение» от команды роста?

Технически да. Эти два инструмента используют один и тот же алгоритм, но они также служат разным целям:

  • инструмент «Добавить изображение» предназначен для новичков и менее опытных участников, у которых практически нет опыта добавления изображений в статьи;
  • инструмент «Рекомендуемые изображения» предназначен для более опытных участников, у которых уже есть опыт добавления изображений и других медиа файлов в статьи (т.е. пользователей с более чем 500 правками).

Какова связь между инструментом рекомендации изображений и Структурированными данными на Викискладе?

Этот инструмент будет использовать данные, поступающие из Викиданных, а также Структурированные Данные из Викисклада, чтобы найти потенциальные медиа файлы для добавления в статьи Википедии, где нет изображений.

Более конкретно, инструмент проверит соответствующий элемент в Викиданных и проверит, есть ли там изображение (через Wikidata property P18) или связанная категория на Викисклад (через Wikidata property P373). Если в обоих случаях потенциальные изображения не будут найдены, инструмент проверит другие статьи Википедии на других языках, чтобы узнать, есть ли соответствующие изображение, которое можно найти. Наконец, инструмент выполнит поиск в «MediaSearch» на Викискладе по названию статьи и если какое-то изображение занимает достаточно высокое место в результатах поиска, инструмент выберет это изображение.

Как работают уведомления?

Инструмент будет выбирать до двух статей без иллюстраций в неделю из списка статей в списке наблюдения пользователя. Каждое конкретное совпадение статьи и изображения будет показано пользователю только раз. При отборе будут приоритетны статьи, отредактированные по крайней мере раз за последние 30 дней.

Если пользователь уже получил уведомление по конкретной статье, инструмент перейдет к следующей статье в списке. Процесс уведомления пользователя будет генерироваться еженедельно, пока изображение не совпадет или соответствующие пользователи не будут исчерпаны.

Какие изображения будут предложены при совпадении?

Для статей будут предложены изображения только из Викисклада. Мы не планируем распространять уведомления также на локально загруженные изображения.

Как выключить уведомления?

Если вы не хотите получать уведомления (больше), перейдите к Special:GlobalPreferences, затем перейдите на вкладку «Уведомления» и удалите галочки, связанные с «Рекомендуемыми Изображениями». Учтите: это работает только в том случае, если вы получаете доступ к глобальным настройкам через один из проектов, в которых включены «Рекомендуемые Изображения» (пока это: Каталонская, Финская, Венгерская, Индонезийская, Норвежская, Португальская и Русская Википедия).

Могу ли я использовать уведомления о рекомендуемых изображениях для мероприятий или кампаний?

Да. Это возможно с определенными ограничениями. Перейдите к «Уведомлениям на основе категорий» для получения инструкций.