Cross-wiki Search Result Improvements/uk

Нова ціль
Відділ відкриттів шукає спосіб видавати результати пошуку з інших проектів Вікімедіа тією ж мовою (що просто називають крос-вікі або інтер-вікі пошуком).

For example, if you were on the French Wikivoyage and searched for "milk" you would be presented with the expected matching articles from the French Wikipedia and results from other French Wikimedia projects (i.e.: fr.wiktionary and fr.wikiquote).

Ця сторінка — спроба підсумувати деякі наші думки і ми запрошуємо усіх дописувачів відкрито обговорити цю потенційну зміну на сторінці обговорення.

'' Ця ідея відмінна, але пов'язана з новою функцією, яку Команда пошуку відкриттів увімкнула раніше цього року. Нова функція показує результати рядом інших мовних розділів Вікіпедії, якщо схоже на те, що користувач використав іншу мову для написання запиту, бо локальних результатів менше, ніж два. Тема цієї сторінки — нове відображення результатів пошуку з інших вікіпроектів тією ж мовою — буде додана до нової функції визначення мови, а не замінюватиме її.''

Обґрунтування
Пошук у всіх проектах Вікімедіа зараз працює так: кожен мовний проект має власний окремий індекс пошуку. Це означає, що є зараз неможливо здійснити пошук потрібних результатів у всіх вікіпроектах одночасно. Однак, у бекенді мова запиту та сама (не залежно від проекту) і відвідувачам може бути цікавою інформація з сестринського проекту їхньою мовою.

Надання результатів пошуку з усіх проектів (тією ж мовою) дасть відвідувачам більше інформації, зробить інші проекти більш видимими і збільшить результативність пошуку для відвідувачів Вікімедіа, в тому числі, за рахунок меншої кількості нульових результатів.

Відображення додаткових результатів пошуку з проектів не лише збільшить переходи у сестринські проекти, але також дасть можливість відкривати для себе більше цікавих статей і, можливо, заоходить до більшого внеску.

Чому цього досі не зробили?
Чому немає одного гігантського індексу пошуку у всіх проектах всіма мовами?
 * Одна з причин — технічна складність: розмір такого індексу складатиме сотні гігабайтів. Наприклад, індекс бази даних усіх статей англомовної Вікіпедії складає 200 гігабайтів. Якщо мати лише один величезний індекс бази даних, це негативно вплине на швидкість видачі результатів пошуку.
 * Інша причина «одномовного» підходу до результатів пошуку полягає в тому, що вірогідно, не буде корисно шукати одну тему усіма мовами. Якщо зробити пошук по словах «Paris, France» і отримати в загальному ту ж саму статтю французькою, німецькою й англійською, це навряд чи дуже допоможе в пошуку нової інформації.

Вікіпроекти англійською мовою доволі великі:
 * індекс усіх сторінок англомовних статей англійської Вікіпедії складає близько 200 ГБ;
 * англійських Вікіновин — близько 15 ГБ;
 * англійських Вікіджерел — близько 6 ГБ.

Відображення додаткових результатів може вплинути на хід роботи багатьох наявних вікі.
 * Це може вірогідно вплинути на ботів, дописувачів, дослідників, читачів тощо.

План
Першої чверті (липень-вересень 2016 року) команда проектування продовжить працювати над такими чотирма основними кроками:

Перший


 * Поєднати індекси однією й тією ж мовою.
 * Запитати допомоги у спільноти — що включає обговорення на цій сторінці.
 * Команди пошуку та дизайну у Фонді Вікімедіа створять макети того, як ці нові результати пошуку можуть відображатися.

Другий

До кінця наступної чверті (орієнтовно жовтень-грудень 2016) команда порівняє задовільність пошуку. Це буде зроблено:


 * після того, як крос-вікі індекс буде готовий для кількох попередньо вибраних мов;
 * після проведення A/B тестів для збору даних реального часу для аналізу.

Третій


 * Коли завершиться згадане вище, ми вірогідно випустимо цю нову функцію як одну з бета-функцій для подальших відгуків і тестування спільнотою.

Четвертий


 * Запровадження в роботу у деяких вікі.

Поточні приклади пошуку
Уже є декілька рішень від спільноти, як надати додаткові відсилання до інших проектів Вікімедіа та статей тією ж мовою. Невеликий набір прикладів:

Поточні сторінки результатів пошуку у вікі кількома мовами:


 * Гаїтянська креольська:
 * https://ht.wikipedia.org/wiki/Espesyal:Chache/Milk
 * Результати додаються унизу сторінки через mw:Extension:ArticlePlaceholder
 * Французька:
 * https://fr.wikipedia.org/w/index.php?title=Spécial:Recherche&profile=default&fulltext=Search&search=milk&searchengineselect=mediawiki
 * Результати додаються унизу сторінки через d:User:Yair_rand/WikidataInfo.js
 * Італійська:
 * https://it.wikipedia.org/w/index.php?search=milk&title=Speciale:Ricerca&fulltext=1
 * Результати додаються унизу сторінки через d:User:Yair_rand/WikidataInfo.js
 * Навігаційний шаблон збоку сторінки додається через w:it:MediaWiki:Search-interwiki-custom

Додаток зовнішнього пошуку:
 * mw:MediaWiki:Gadget-externalsearch.js
 * Цей додаток шукає по власному списку технічних сайтів, видаючи багатовкладковий список результатів і пояснений більше на сторінці Wikimedia technical search
 * Ось знімок екрана цієї дії (нажаль, пошук для «google.com/cse» може запустити повідомлення спам-фільтру у деяких браузерах)

Як ці додаткові результати пошуку можуть відображатися?
Вигляд результатів пошуку відкритий для обговорення і у нас є декілька грубих чернеток, які ви можете побачити нижче, і більше можливостей дизайну на сторінці «Дизайн». Тут є кілька прикладів того, як нова сторінка результатів пошуку може виглядати, що базуються на наявних рішеннях в інших вікі:

Допоможіть нам обрати рішення
Будь ласка, залиште зараз свій відгук!
 * Щоб розробити архітектуру і дизайн технічного рішення, треба щонайменше два квартали.
 * Команда хотіла б мати, що тестувати і що показувати спільноті наприкінці 2016 року.

Запитання
Команда має багато запитань, і це те, на що ми хочемо отримати відгуки від спільноти:


 * 1) Як ми хочемо, щоб нові додаткові релевантні результати пошуку відображалися?
 * 2) Чи результати з будь-якої вікі, у якій ви зараз є, мають показуватися першими, а тоді щоб була опція показати більше з інших вікі?
 * 3) Чи додаткові результати мають іти впереміш з результатами локальної вікі?
 * 4) Чи додаткові результати мають показуватися окремо збоку (або знизу) сторінки результатів?
 * 5) Чи потрібна нам опція вимкнути ці інші релевантні результати пошуку (на рівні користувача та/або проекту)?
 * 6) * Це може бути пошук за ключовим словом, а може бути кнопка, яку натискає відвідувач
 * 7) * Це також може бути подібно до, наприклад, ключового слова, яке дозволяє шукати зображення лише у локальній вікі, а не файли з Вікісховища.
 * 8) Додаткові результати краще показувати списком чи у вигляді таблиці?
 * 9) Чи треба включати відповідні метадані (зображення та/або короткий опис) разом з результатами пошуку?
 * 10) Чи треба в результат включати розмір статті (напр.:  ) і дату створення/редагування?
 * 11) Чи треба вказувати, що натиснувши на результат ви перейдете в інший вікіпроект?
 * 12) Скільки результатів з інших вікі треба показувати — 1, 2, 3 чи більше?
 * 13) Чи треба обмежити наявний метод відображення результатів з вікі, де здійснювався пошук?
 * 14) * Зараз ми показуємо до 10 тисяч результатів, розбитих на сторінки, але тести показують, за зазвичай переходять лише на перші три.
 * 15) Do we want these new search results to work across all Wikimedia projects?
 * 16) For example, if I'm on Wikiquote, do I want to also see relevant search results from Wikivoyage, Wikipedia or Wikinews?
 * 17) Or, if I'm on Wikipedia, just show me results from other projects?
 * 18) Would these other relevant search results be useful and encourage deeper exploration into various topics?
 * 19) Is it annoying to see the other wiki search results?
 * 20) Conversely, does it encourage a user to discover more knowledge?
 * 21) How much weight do we give results from other wiki projects in the results?
 * 22) Will the display of the additional search results from other wikis encourage contributions from editors?
 * 23) i.e.: if you search for   and don't see a Wikivoyage article about it (while I'm searching on Wikiquote), would that encourage you to start an article for it?
 * 24) Should we limit the amount of languages we search in?
 * 25) i.e.: only use the top 50 languages to implement this in?
 * 26) Or, only use the languages that we are detecting queries in an other language than the wiki the user is on?