Cross-wiki Search Result Improvements/uk

Нова ціль
Відділ відкриттів шукає спосіб видавати результати пошуку з інших проектів Вікімедіа тією ж мовою (що просто називають крос-вікі або інтер-вікі пошуком).

For example, if you were on the French Wikivoyage and searched for "milk" you would be presented with the expected matching articles from the French Wikipedia and results from other French Wikimedia projects (i.e.: fr.wiktionary and fr.wikiquote).

Ця сторінка — спроба підсумувати деякі наші думки і ми запрошуємо усіх дописувачів відкрито обговорити цю потенційну зміну на сторінці обговорення.

'' Ця ідея відмінна, але пов'язана з новою функцією, яку Команда пошуку відкриттів увімкнула раніше цього року. Нова функція показує результати рядом інших мовних розділів Вікіпедії, якщо схоже на те, що користувач використав іншу мову для написання запиту, бо локальних результатів менше, ніж два. Тема цієї сторінки — нове відображення результатів пошуку з інших вікіпроектів тією ж мовою — буде додана до нової функції визначення мови, а не замінюватиме її.''

Обґрунтування
Пошук у всіх проектах Вікімедіа зараз працює так: кожен мовний проект має власний окремий індекс пошуку. Це означає, що є зараз неможливо здійснити пошук потрібних результатів у всіх вікіпроектах одночасно. Однак, у бекенді мова запиту та сама (не залежно від проекту) і відвідувачам може бути цікавою інформація з сестринського проекту їхньою мовою.

Надання результатів пошуку з усіх проектів (тією ж мовою) дасть відвідувачам більше інформації, зробить інші проекти більш видимими і збільшить результативність пошуку для відвідувачів Вікімедіа, в тому числі, за рахунок меншої кількості нульових результатів.

Відображення додаткових результатів пошуку з проектів не лише збільшить переходи у сестринські проекти, але також дасть можливість відкривати для себе більше цікавих статей і, можливо, заоходить до більшого внеску.

Чому цього досі не зробили?
Чому немає одного гігантського індексу пошуку у всіх проектах всіма мовами?
 * Одна з причин — технічна складність: розмір такого індексу складатиме сотні гігабайтів. Наприклад, індекс бази даних усіх статей англомовної Вікіпедії складає 200 гігабайтів. Якщо мати лише один величезний індекс бази даних, це негативно вплине на швидкість видачі результатів пошуку.
 * Інша причина «одномовного» підходу до результатів пошуку полягає в тому, що вірогідно, не буде корисно шукати одну тему усіма мовами. Якщо зробити пошук по словах «Paris, France» і отримати в загальному ту ж саму статтю французькою, німецькою й англійською, це навряд чи дуже допоможе в пошуку нової інформації.

Вікіпроекти англійською мовою доволі великі:
 * індекс усіх сторінок англомовних статей англійської Вікіпедії складає близько 200 ГБ;
 * англійських Вікіновин — близько 15 ГБ;
 * англійських Вікіджерел — близько 6 ГБ.

Відображення додаткових результатів може вплинути на хід роботи багатьох наявних вікі.
 * Це може вірогідно вплинути на ботів, дописувачів, дослідників, читачів тощо.

План
Першої чверті (липень-вересень 2016 року) команда проектування продовжить працювати над такими чотирма основними кроками:

Перший


 * Поєднати індекси однією й тією ж мовою.
 * Запитати допомоги у спільноти — що включає обговорення на цій сторінці.
 * Команди пошуку та дизайну у Фонді Вікімедіа створять макети того, як ці нові результати пошуку можуть відображатися.

Другий

До кінця наступної чверті (орієнтовно жовтень-грудень 2016) команда порівняє задовільність пошуку. Це буде зроблено:


 * після того, як крос-вікі індекс буде готовий для кількох попередньо вибраних мов;
 * після проведення A/B тестів для збору даних реального часу для аналізу.

Третій


 * Коли завершиться згадане вище, ми вірогідно випустимо цю нову функцію як одну з бета-функцій для подальших відгуків і тестування спільнотою.

Четвертий


 * Запровадження в роботу у деяких вікі.

Поточні приклади пошуку
Уже є декілька рішень від спільноти, як надати додаткові відсилання до інших проектів Вікімедіа та статей тією ж мовою. Невеликий набір прикладів:

Поточні сторінки результатів пошуку у вікі кількома мовами:


 * Гаїтянська креольська:
 * https://ht.wikipedia.org/wiki/Espesyal:Chache/Milk
 * Результати додаються унизу сторінки через mw:Extension:ArticlePlaceholder
 * Французька:
 * https://fr.wikipedia.org/w/index.php?title=Spécial:Recherche&profile=default&fulltext=Search&search=milk&searchengineselect=mediawiki
 * Результати додаються унизу сторінки через d:User:Yair_rand/WikidataInfo.js
 * Італійська:
 * https://it.wikipedia.org/w/index.php?search=milk&title=Speciale:Ricerca&fulltext=1
 * Результати додаються унизу сторінки через d:User:Yair_rand/WikidataInfo.js
 * Навігаційний шаблон збоку сторінки додається через w:it:MediaWiki:Search-interwiki-custom

Додаток зовнішнього пошуку:
 * mw:MediaWiki:Gadget-externalsearch.js
 * Цей додаток шукає по власному списку технічних сайтів, видаючи багатовкладковий список результатів і пояснений більше на сторінці Wikimedia technical search
 * Ось знімок екрана цієї дії (нажаль, пошук для «google.com/cse» може запустити повідомлення спам-фільтру у деяких браузерах)

Як ці додаткові результати пошуку можуть відображатися?
Вигляд результатів пошуку відкритий для обговорення і у нас є декілька грубих чернеток, які ви можете побачити нижче, і більше можливостей дизайну на сторінці «Дизайн». Тут є кілька прикладів того, як нова сторінка результатів пошуку може виглядати, що базуються на наявних рішеннях в інших вікі:

Допоможіть нам обрати рішення
Будь ласка, залиште зараз свій відгук!
 * Щоб розробити архітектуру і дизайн технічного рішення, треба щонайменше два квартали.
 * Команда хотіла б мати, що тестувати і що показувати спільноті наприкінці 2016 року.

Запитання
Команда має багато запитань, і це те, на що ми хочемо отримати відгуки від спільноти:

робити внесок?]]
 * 1) Як ми хочемо, щоб нові додаткові релевантні результати пошуку відображалися?
 * 2) Чи результати з будь-якої вікі, у якій ви зараз є, мають показуватися першими, а тоді щоб була опція показати більше з інших вікі?
 * 3) Чи додаткові результати мають іти впереміш з результатами локальної вікі?
 * 4) Чи додаткові результати мають показуватися окремо збоку (або знизу) сторінки результатів?
 * 5) Чи потрібна нам опція вимкнути ці інші релевантні результати пошуку (на рівні користувача та/або проекту)?
 * 6) * Це може бути пошук за ключовим словом, а може бути кнопка, яку натискає відвідувач
 * 7) * Це також може бути подібно до, наприклад, ключового слова, яке дозволяє шукати зображення лише у локальній вікі, а не файли з Вікісховища.
 * 8) Додаткові результати краще показувати списком чи у вигляді таблиці?
 * 9) Чи треба включати відповідні метадані (зображення та/або короткий опис) разом з результатами пошуку?
 * 10) Чи треба в результат включати розмір статті (напр.:  ) і дату створення/редагування?
 * 11) Чи треба вказувати, що натиснувши на результат ви перейдете в інший вікіпроект?
 * 12) Скільки результатів з інших вікі треба показувати — 1, 2, 3 чи більше?
 * 13) Чи треба обмежити наявний метод відображення результатів з вікі, де здійснювався пошук?
 * 14) * Зараз ми показуємо до 10 тисяч результатів, розбитих на сторінки, але тести показують, за зазвичай переходять лише на перші три.
 * 15) Чи ми хочемо, щоб ці нові результати пошуку працювали у всіх проектах Вікімедіа?
 * 16) Наприклад, якщо я у Вікіцитатах, чи хочу я також бачить релевантні результати пошуку з Вікімандрів, Вікіпедії чи Вікіновин?
 * 17) Або, якщо я у Вікіпедії, просто показати мені результати з інших проектів?
 * 18) Чи будуть ці інші релевантні результати пошуку корисними і заохотять до глибшого дослідження інших проектів?
 * 19) Чи дратує бачити результати з інших вікі?
 * 20) І навпаки, чи заохочують вони користувача отримувати більше знань?
 * 21) Яку вагу треба надавати результатам з інших вікіпроектів у результатах?
 * 22) [[Topic:Tatx44liaktu6imo|Чи заохотить користувачів відображення додаткових результатів пошуку з інших вікі
 * 1) Тобто якщо ви шукаєте   і не бачите статті про неї у Вікімандрах (а я шукаю у Вікіцитатах), чи це заохотить вас започаткувати статтю?
 * 2) Чи треба обмежити кількість мов, якими проводити пошук?
 * 3) Тобто, чи запровадите це лише для топ-50?
 * 4) Або лише використовувати мови, де ми виявляємо запити іншою мовою ніж вікі, де знаходиться користувач?

Див. також

 * - Нотатки й ілюстрації з дизайну того, як можуть виглядати результати пошуку

Завдання на Фабрикаторі:


 * https://phabricator.wikimedia.org/T137312
 * https://phabricator.wikimedia.org/T136639
 * https://phabricator.wikimedia.org/T139310

Замітки з обговорень:


 * https://etherpad.wikimedia.org/p/interwiki-implications
 * https://etherpad.wikimedia.org/p/inter-wiki
 * https://etherpad.wikimedia.org/p/multi_project_indices