Help:CirrusSearch/uk

CirrusSearch — новий пошуковий рушій для MediaWiki. Він відзначається ключовими покращеннями порівняно зі старим рушієм, LuceneSearch. На цій сторінці описані нові чи інакші властивості цього пошуковика порівняно з попереднім.

Часті запитання
Якщо ви не знайшли відповіді на ваше запитання, не вагайтеся запитувати на сторінці обговорення, і хтось вам відповість.

Що покращилося?
Новий пошуковий рушій відрізняється трьома основними покращеннями порівняно зі старим рушієм, а саме:


 * Краща підтримка пошуку різними мовами.
 * Швидше оновлення пошукового індексу, що означає, що зміни у статтях відображаються у пошукових результатах набагато швидше.
 * Розкриття шаблонів, що означає, що увесь вміст статті, включно з наповненням шаблонів, тепер відображатиметься в результатах пошуку.

Оновлення
Оновлення пошукового індексу відбуваються в реальному часі. Зміни шаблонів мають відображатися в статтях, які включають шаблони, протягом кількох хвилин. Зміни до шаблонів залежать від черговості завдань, тому їх реальне проявлення може відбуватись по-різному. Щоб проштовхнути зміни у статті, можна зробити "нульове редагування", але при нормальній роботі двигуна це не знадобиться.

Варіанти пошуку
Варіанти фрази чи слова, що з'являються у спадному меню після початку пошукового набору, чітко відповідають назвам статей, ранжованих за кількістю зовнішніх посилань на них. Нічого не дає розпочинати пошук зі знаку ~ бо йому не відповідає жодна стаття; також у будь-який момент можна, натиснувши "Enter", перескочити на сторінку результатів пошуку.

Символи ASCII, наголоси і діакритичні знаки увімкнуті в англійському тексті, але виникають певні проблеми з форматуванням результатів. Див. 52656.

Повнотекстовий пошук
Повнотекстовий пошук (той, який прямо веде вас до сторінки результатів) відбувається за заголовками, перенаправленнями, назвами розділів та всім текстом статей, так що тут нічого надзвичайного не буде. Головна новина в тому, що відтепер розкриваються також шаблони.

Також тут виявлені, але ще не виправлені деякі помилки:


 * Пряма збіжність фраз (без врахування похідних слів) не завжди акуратно виділяється

Фільтри (intitle:, incategory:, linksto:)


Ми доволі таки ускладнили синтаксис навколо цих фільтрів.


 * intitle:foo
 * Знаходить сторінки, в заголовку яких є "foo" (з врахуванням похідних).
 * intitle:"foo bar"
 * Знаходить сторінки, в заголовку яких є "foo" і "bar" (обидва з врахуванням похідних).
 * intitle:foo bar
 * Знаходить сторінки, в заголовку яких є "foo" і в заголовку або в тексті є "bar".
 * -intitle:foo bar
 * Знаходить сторінки, в заголовку яких нема "foo" і заголовок або текст містить "bar".
 * intitle: foo bar
 * Синтаксична помилка, призводить до пошуку сторінок, заголовок чи текст котрих містить "intitle:", "foo" і "bar".
 * incategory:Music
 * Знаходить сторінки, включені до категорії Category:Music
 * incategory:"music history"
 * Знаходить сторінки, включені до категорії Category:Music_history
 * incategory:"musicals" incategory:"1920"
 * Знаходить сторінки, включені одночасно до категорій Category:Musicals та Category:1920
 * -incategory:"musicals" incategory:"1920"
 * знаходить сторінки, включені до категорії Category:1920, але не включені до Category:Musicals
 * cow*
 * знаходить сторінки, заголовок або текст котрих містить слова, що починаються з "cow"
 * linksto:Help:CirrusSearch
 * знаходит статті, що посилаються на дану сторінку
 * -linksto:Help:CirrusSearch CirrusSearch
 * знаходит статті, які згадують CirrusSearch, але не посилаються на сторінку Help:CirrusSearch

Оператор "prefix":
В його теперішньому вигляді синтаксис оператора "prefix:" передбачає масу функцій, так що він реорганізований на максимально вузьку роботу.


 * prefix:cow
 * Знаходить у просторі імен статті, назва яких починається зі слова "cow".
 * domestic prefix:cow
 * Знаходить у просторі імен статті, назва яких починається зі слова "cow" і в тексті яких є слово "domestic".
 * domestic prefix:Cow/
 * Знаходить у просторі імен усі під-сторінки статті "Cow", в яких зустрічається слово "domestic". Це доволі поширений спосіб пошуку, часто запускається з використанням особливого параметру URL:.
 * domestic prefix:Talk:Cow/
 * Знаходить у просторі імен обговорень всі додаткові сторінки від сторінки обговорення "Talk:Cow", на яких зустрічається слово "domestic".
 * cow prefix:Pink Floyd/
 * Знаходить у просторі імен змісту всі додаткові сторінки статті "Pink Floyd", на яких є слово "cow". Пробіл значення не має.

Завважте, старе правило, що в кінці запиту слід вставляти "prefix:", все ще діє.

Спеціальні префікси

 * morelike:Endothermic
 * Знаходить статті, в тексті яких є слова, подібні на "Endothermic".
 * Talk:Foo
 * Знаходить у просторі обговорень статті, назва або текст яких містить слово "foo".

Може ви мали на увазі...
Фраза "Може ви мали на увазі..." застосовується, щоб підказати, що введений вами запит містить неточності, і не подібен на назву статті. Це щоб ви знали. Пропоновані варіанти часом теж не є ближчі до істини 😊.

Бажана збіжність фрази
Якщо ви не застосували надто специфічного пошукового синтаксису, пошук в першу чергу спрямовується на точний відповідник. Насправді важко точно сказати, скільки "спеціального синтаксису" можна вважати надмірним. Одним словом, якщо у вашому запиті будуть якісь закручені вирази, прямий пошук вимикається.

Розмитий пошук
Вставлення символу ~ після пошукової фрази (але без подвійних лапок) вмикає розмитий пошук. Можна також вказати число від 0 до 1 для керування пропорцією "нечіткості", наприклад: кошмар~.9 або блискавка~.1 чи блискавка~0.1. Ближче до одиниці буде менш розмитий пошук.

Пошук фраз і близькість слів
Взявши слова в лапки, тим самим ви задаєте, що ці слова мають стояти близько між собою. Можете додати ~ і тоді після лапок число, яке визначає бажану близькість між словами. Також цю близькість означають терміном "злитність фрази". За умовчанням злитність дорівнює 1.

Цитати і дослівна збіжність
Лапки допомагають встановити точнішу відповідність запиту. Можна додати ~ після лапок, щоб добитись чіткішої збіжності, до якої ми звикли і прагнемо.

Оператор "prefer-recent:"
Ви можете загострити увагу пошуку на недавно редагованих статтях додаванням "prefer-recent:" на початку вашого запиту. За умовчанням це додасть 60% переваги результатам пошуку, знайденим експоненційно відносно часу від вашої останньої правки з періодом напіврозпаду 160 днів. Оператор prefer-recent: можна видозмінити за такою схемою: "prefer-recent:<пропорція_результатів_за_час>, <період_напіврозпаду_(днів)>". <Пропорція_результатів_за_час> виражається числом від 0 до 1 включно. <Період_напіврозпаду_(днів)> має бути більшим від 0, але дозволяє десяткові дроби. Ці числа добре працюють, поки вони малі. Я тестував число близьке до .0001, що тривало 8.64 секунди.

Це значення буде увімкнуте за умовчанням у Wikinews,але я не бачу причин, чому б не активувати її при будь-якому пошуку.

Оператор hastemplate:
Ви можете обмежити пошук лише статтями, які містять шаблон, додавши до пошуку параметр. Ми спробували використати синтаксис включення шаблонів, щоб вираз  шукав статті з якісними знімками в шаблонах , і   може знаходити статті з включенням   серед основного простору імен. Можна не додавати лапок, якщо в назві, яку ви шукаєте, нема пробілів. відбере сторінки, на яких є цей шаблон.

Можна комбінувати всі можливі варіанти цього цікавого пошукового синтаксису, наприклад, щоб отримати лише китайські зображення і лише середньої якості:.

Оператор "boost-templates:"
You can boost pages scores based on what templates they contain. This can be done directly in the search via  or you can set the default for all searches via the new   message. replaces the contents of  if the former is specified. The syntax is a bit funky but was chosen for simplicity. Some examples:


 * Find files in the China category sorting quality images first.
 * Find files in the China category sorting quality images first.


 * Find files in the China category sorting quality images first and low quality images last.
 * Find files in the China category sorting quality images first and low quality images last.


 * Find files about popcorn sorting quality images first and low quality images last. Remember that through the use of the  message this can be reduced to just.
 * Find files about popcorn sorting quality images first and low quality images last. Remember that through the use of the  message this can be reduced to just.

Don't try to add decimal points to the percentages. They don't work and search scoring is such that they are unlikely to matter much.

A word of warning about : if you add really really big or small percentages they can poison the full text scoring. Think, for example, if enwiki boosted featured articles by a million percent. Then searches for terms mentioned in featured articles would find the featured articles before exact title matches of the terms. Phrase matching would be similarly blown away so a search like  would find a featured article with those words scattered throughout it instead of the article for Brave New World.

Sorry for the inconsistent  in the name. Sorry again but the quotes are required on this one. Sorry also for the funky syntax. Sorry we don't try to emulate the template transclusion syntax like we do with.

insource:
will search text just in the wikitext. This will pick up template parameter names, URLs in link tags, etc. It has two flavors:
 * and
 * These work pretty similarly to  or regular text search in that they are fast but ignore punctuation.


 * and
 * These run Regular expressions against the page source. They aren't efficient and we only allow a few of them to run at a time on the search cluster but they are very powerful.  This link contains an explanation of the syntax and this link contains an actual grammar for the Regular Expression language. The version with the extra   runs the expression case insensitive and is even less efficient.  Note that if the regexp contains whitespace, you must either escape each space character (\ ) or put everything after   in quotes (insource:"/foo bar/").
 * Tip: These return much much faster if there are other filters. Instead of searching for   search for.

Auxiliary Text
Cirrus considers some text in the page to be "auxiliary" to what the page is actually about. Examples include table contents, image captions, and "This article is about the XYZ. For ZYX see ZYX" style links. You can also mark article text as auxiliary by adding the  class to the html element containing the text.

Auxiliary text is worth less than the rest of the article text and it is in the snippet only if there are no main article snippets matching the search.

Lead Text
Cirrus assumes that non-auxiliary text that is between the top of the page and the first heading is the "lead in" paragraph. Matches from the lead in paragraph are worth more in article ranking.