Help:CirrusSearch/it

CirrusSearch is a new search engine for MediaWiki. The Wikimedia Foundation migrated to CirrusSearch since it features key improvements over the previously used search engine, LuceneSearch. Questa pagina descrive le caratteristiche che sono nuove o differenti in confronto alle soluzioni precedenti.

Domande frequenti
Se la tua domanda non trova risposta qui, per piacere chiedi in discussione e qualcuno ti risponderà.

Che cosa è migliorato?
Il nuovo motore di ricerca offre miglioramenti cruciali rispetto al vecchio, cioè:


 * ricerca migliorata in molteplici lingue,
 * aggiornamenti più rapidi degli indici, cioè le modifiche alle pagine sono incluse nei risultati di ricerca molto più velocemente,
 * Expanding templates, meaning that all content from a template is now reflected in search results.

Aggiornamenti
Gli aggiornamenti all'indice di ricerca sono eseguiti quasi in tempo reale. Dovresti essere in grado di cercare il testo delle tue modifiche immediatamente dopo averle eseguite. Le modifiche ai template dovrebbero avere effetto negli articoli che li includono in pochi minuti. Le modifiche ai template, tuttavia, rientrano in una job queue (coda di lavoro) e pertanto le performance possono variare. Una modifica nulla all'articolo forzerà comunque l'aggiornamento ma non è richiesta se tutto procede per il verso giusto.

Suggerimenti di ricerca
I suggerimenti di ricerca che ottieni quando scrivi nella casella di ricerca che ti mostra possibili pagine, sono sostanzialmente i titoli delle voci ordinati per numero di collegamenti in entrata. Tieni conto che se inizia una ricerca con la tilde '~' sarà disattivata la funzione di completamento automatico e potrai raggiungere direttamente il titolo che scriverai premendo il tasto invio.

La lettura dei caratteri ASCII/accentati/diacritici è abilitata per i testi in lingua inglese, ma ci sono dei problemi di formattazione con il risultato. Vedi 52656.

Ricerca nel testo
La funzionalità di ricerca testuale, che porta alla pagina dei risultati della ricerca, effettua la ricerca nel titolo, nei rinvii, nei titoli dei paragrafi e nel testo delle voci, quindi non dovrebbe presentare problemi. Il cambiamento principale è nei template, che sono "espansi" per permettere la ricerca anche all'interno del loro testo.

Stemming
Esiste già un supporto per dozzine di lingue, ma tutte le lingue sono richieste. Attualmente sono molte le lingue a essere supportate in elasticsearch.org; dai uno sguardo alla loro documentazione per inviare richieste o patch.

Filtri (intitle:, incategory: e linksto:)


Abbiamo migliorato un po' la sintassi.


 * intitle:foo
 * Find articles whose title contains foo. Stemming is enabled for foo.
 * intitle:"fine line"
 * Find articles whose title contains fine then line. Stemming is enabled. Matches The finest (lines) but not The finest ever lines.
 * intitle:foo bar
 * Find articles whose title contains foo and whose title or text contains bar.
 * -intitle:foo bar
 * Trova le voci il cui titolo non contiene "foo" e il cui titolo o il testo contiene "bar".
 * Intitle: bar foo
 * Errore di sintassi, esegue la ricerca delle voci il cui titolo o testo contiene "intitle" ":", "foo" e "bar".
 * Incategory:Musica
 * Trova le voci che sono nella Categoria:Musica
 * Incategory:"storia della musica"
 * Trova le voci che sono nella Categoria:Storia_della_musica
 * Incategory:incategory "musical": "1920"
 * Trova le voci che sono contemporaneamente nella Categoria:Musicals e nella Categoria:1920
 * -incategory:Incategory "musical": "1920"
 * Trova le voci che non sono nella Categoria:Musical, ma sono nella categoria:1920
 * Mucca*
 * Trova le voci il cui titolo o il testo contengono parole che iniziano con "mucca"
 * Linksto:Help:CirrusSearch
 * Trova le voci che contengono collegamenti alla pagina Help:CirrusSearch
 * -linksto: Help:CirrusSearch CirrusSearch
 * Trova le voci che menzionano CirrusSearch ma non sono collegate alla pagina Help:CirrusSearch

prefix:
Il prefisso: la sintassi nella forma corrente è invocata con una serie di funzionalità in modo da essere ricreata il più esattamente possibile.

Si noti che si può ancora utilizzare la vecchia regola di dover scrivere prefix: alla fine del testo da ricercare.

morelike:
The  query works by choosing a set of words in the input articles and run a query with the chosen words. You can tune the way it works by adding the following parameters to the search results URL: These settings can be made persistent by overriding  in Help:System message.
 * Find articles whose text is most similar to the text of the given articles.
 * Find articles about stinging insects.
 * Find templates about regex searching for template usage on the wiki.
 * Find articles about stinging insects.
 * Find templates about regex searching for template usage on the wiki.
 * Find templates about regex searching for template usage on the wiki.
 * : Minimum number of documents (per shard) that need a term for it to be considered.
 * : Maximum number of documents (per shard) that have a term for it to be considered.
 * : Maximum number of terms to be considered.
 * : Minimum number of times the term appears in the input to doc to be considered. For small fields this value should be 1.
 * : Minimal length of a term to be considered. Defaults to 0.
 * : The maximum word length above which words will be ignored. Defaults to unbounded (0).
 * (comma separated list of values): These are the fields to use. Allowed fields are,  ,  ,  ,   and.
 * ( | ): use only the field data. Defaults to : the system will extract the content of the   field to build the query.
 * : The percentage of terms to match on. Defaults to 0.3 (30 percent).
 * Example:

Namespace
A search domain consisting of one namespace can be specified at the beginning of a query. Two or more namespaces may be set at the search results page, Special:Search, in the Advanced dialog. This can be set for the query, or for the user's default search domain. Enter a namespace name, or enter, or enter a colon    for mainspace.

Namespace aliases are accepted. For the File namespace,  is accepted.


 * Find articles in the Talknamespace whose title or text contains the word "foo".
 * Find articles in the File namespace on this wiki and commons whose title or text contains the word "foo".
 * Add  to the File namespace query to remove the results from commons.
 * Find articles in the File namespace on this wiki and commons whose title or text contains the word "foo".
 * Add  to the File namespace query to remove the results from commons.
 * Add  to the File namespace query to remove the results from commons.

You cannot use an interwiki prefix as a namespace to search other projects.

Forse cercavi:
I suggerimenti "Forse cercavi:" sono progettati per controllare che non si sia fatto un errore nello scrivere una frase non comune che potrebbe essere il titolo di una voce. A volte la funzione sembra suggerire più cose di quanto dovrebbe.

Prefer phrase matches
If you don't have too much special syntax in your query we'll give perfect phrase matches a boost. I'm being intentionally vague because I'm not sure exactly what "too much special syntax" should be. Right now if you add any explicit phrases to your search we'll turn off this feature.

Ricerche vaghe
Inserendo un ~ "dopo" il termine da ricercare si attiva la funzione di ricerca vaga (fuzzy search). Puoi anche inserire un numero da 0 a 1 (decimali compresi) per regolare il grado di vaghezza. Esempio: nightmare~.9 cercherà il termine "nightmare" con una vaghezza di 0.9. Più vicino ad 1 è il numero che inserisci, meno vaga sarà la ricerca.

Ricerca di frasi
Surrounding some words with quotes declares that you are searching for those words close together. You can add a ~ and then a number after the second quote to control just how close you mean. The default "closeness" is zero. One means one extra word allowed, and so on. For more than two words in the phrase, the closeness equals the total number of extra words, provided that all the words are also in order left to right.

For the closeness value of words given in right to left order, count and discard all the extra words, then add twice the the total count of remaining words minus one (in other words, add twice the number of segments). For the full proximity algorithm, see Elastic Search.

An explicit AND is required between two phrases because of the "inner" quotation marks.

Virgolette e risultati esatti
Le virgolette daranno come risultato l'esatto termine cercato. Puoi aggiungere una tilde ~ per rendere la ricerca più aggressiva.

prefer-recent:
Puoi decidere di visualizzare per prime le pagine modificate di recente inserendo il prefisso prefer-recent: alla tua stringa di ricerca. Per default, quest'opzione scalerà del 60% i risultati con un tempo dall'ultima modifica di 160 giorni. Questo comportamento di default può essere modificato in questo modo: "prefer-recent:, ". "percentuale di quanto vanno scalati i risultati" deve essere un numero tra 0 e 1 inclusi. "emivita in giorni" deve essere maggiore di zero ma accetta anche valori decimali. Questo parametro lavora tanto meglio quanto più è piccolo. Se ad esempio si inserisce .0001 si ricercano le pagine con emivita di 8.64 secondi.

Questa funzionalità potrà essere attivata di default su Wikinews, ma tu potrai usarla ogni volta che vorrai nelle tue ricerche su ogni progetto.

hastemplate:
You can find pages that use a certain template by adding the filter  to the search. We provide for the usual "syntactic sugar" of template calls. This means the lenient pagename and fullpagename capitalization works, and the main namespace abbreviation, ":" works. For example to find which pages transclude Quality image the full search (in all your preferred namespaces) can be: , and for that same template name in the main namespace, this works. You can omit the quotes if the template title does not contain a space. will filter pages that do not contain that template.

For wikitext that calls a template directly, you can use insource:, but hastemplate: searches the "post-expansion inclusion", so hastemplate: can find a template acting only temporarily as a "secondary template" or "meta-template", which are seen in neither the source nor content, ( but only included as a helper to any other template producing the final content). All content from a template is now reflected in search results is still the relevant philosophy here.

boost-templates:
Puoi anche dare priorità alle pagine basandoti sui template in esse contenuti. Ciò può essere fatto direttamene scrivendo  o puoi decidere che ciò avvenga di default per ogni ricerca inserendo.

Il codice  sostituisce il contenuto di   se il primo è esplicitato. La sintassi è un po' bizzarra ma è stata scelta per questioni di semplicità. Alcuni esempi:


 * Cercherà le immagini della categoria Cina che abbiano anche il template "Quality Image"
 * Cercherà le immagini della categoria Cina che abbiano anche il template "Quality Image"


 * Troverà le immagini nella categoria Cina visualizzando prima quelle d'alta qualità e poi quelle di bassa qualità.
 * Troverà le immagini nella categoria Cina visualizzando prima quelle d'alta qualità e poi quelle di bassa qualità.


 * Troverà le immagini che rimandano a "popcorn" visualizzando prima quelle d'alta qualità e poi quelle di bassa qualità.
 * Troverà le immagini che rimandano a "popcorn" visualizzando prima quelle d'alta qualità e poi quelle di bassa qualità.

Ricorda che il codice  è la stessa cosa che inserire direttamente.

Non inserire un decimale nelle percentuali. Non funzionano con questo sistema di ricerca e restituirà un risultato indesiderato.

Una nota il merita il codice : se aggiungi percentuali molto piccole o molto grandi esse possono contaminare il risultato della ricerca. Pensa per esempio se su en.wikipedia volessi dare priorità ad una percentuale molto molto alta di articoli in vetrina. In questo caso le ricerche per un dato termine visualizzerebbero solo articoli in vetrina contenenti quel nome anche se magari esiste una pagina con l'esatto titolo della ricerca ma non viene visualizzato perché non in vetrina.

Sorry for the inconsistent  in the name. Sorry again but the quotes are required on this one. Sorry also for the funky syntax. Sorry we don't try to emulate the template transclusion syntax like we do with.

insource:
This can pick up template arguments, URLs, links, html, etc. It has two forms, one is an indexed search, and the other is regex based.

Tip: Instead of running a bare insource:/regexp/, these return much much faster when you limit the regexp search-domain to the results of one or more index-based searches. An "exact string" regexp search is a basic search; it will simply "quote" the entire regexp, or "backslash-escape" all non-alphanumeric characters in the string. All regexp searches also require that the user develop a simple filter to generate the search domain for the regex engine to search:



Any search without a namespace or prefix searches your default search domain, settable at Special:Search. It is commonly reset by power users to All namespaces, but if this occurs for a bare regexp search, then on a large wiki it will probably incur an HTML timeout before completing the search.

A regex search actually scours each page character-by character. By contrast, an indexed search actually queries a few records from a database separate from the wiki, and provides nearly instant results. When using a regex, include other search terms to limit the regex search domain as much as possible. There are many search terms that use an index and so instantly provide a highly refined search domain for the /regexp/. In order of general effectiveness:


 * insource:"" with quotation marks, duplicating the regexp except without the slashes or escape characters, is ideal.
 * intitle, incategory, and linksto are excellent filters.
 * "word1 word2 word3", with or without the quotation marks, are OK.
 * hastemplate: if it produces less than a few hundred thousand pages, is OK.
 * namespace: is practically useless, but may enable a slow regexp search to complete.

The prefix operator is especially useful with a { {FULLPAGENAME}} or a subdirectory argument. To develop a new regexp, or refine a complex regexp, use  in any edit box. Search terms that do not increase the efficiency of a regexp search are the page-scoring operators: morelike, boost-template, and prefer-recent.

==== Metacharacters ==== This section covers how to escape metacharacters.

For the actual meaning of the metacharacters see the explanation of the syntax. For the formal definition see the Lucene grammar for regular expressions.

The use of a regexp to search for an exact string that includes non-alphanumeric characters is a basic search. It finds regular expression metacharacters literally by placing the entire regexp inside double quotation marks, which blindly "quotes" or "escapes" any possible metacharacters from their advanced search meaning. An advanced search usually escapes metacharacters one at a time with a backslash.

For example  matches a '2', a literal plus sign, another '2', an equals sign, a '4' and a literal dot, with one possible space character between each math term. The equals sign has no special, metacharacter meaning in CirrusSearch, and so need not be escaped, but its OK to escape or quote any character because it basically has no effect. An exact-string search usually "quotes" the regexp because this will neutralize all metacharacter meanings.

Inside double quotes you must use backslash-escape to escape a double-quote character. For example .

Inside the regexp you must use the backslash-escape to quote any slash character that is not delimiting the regexp. For example .

The square-bracket notation for creating your own character-class also escapes metacharacters. To target a literal right square bracket in your character-class pattern, it must be backslash escaped, otherwise it can be interpreted as the closing delimiter of the character-class pattern definition. The first position of a character class will also escape the right square bracket. Inside the delimiting square brackets of a character class, the dash character also has special meaning (range) but can it too can be included literally in the class the same way as the right square bracket can. For example both of these patterns target character that is either a dash or a right square bracket or a dot:  or.

Advanced example
For example, using metacharacters to find the usage of a template called Val having, inside the template call, an unnamed parameter containing a possibly signed, three to four digit number, possibly surrounded by space characters, AND on the same page, inside a template Val call, a named argument "fmt=commas" having any allowable spaces around it, (it could be the same template call, or a separate one):



It is fast because it uses two filters so that every page the regexp crawls has the highest possible potential. Assuming your search domain is set to ALL, it searches the entire wiki, because it offers no namespace or prefix.

Testo ausiliario
CirrusSearch considererà alcuni testi come "ausiliari" a ciò di cui la pagina tratta. Esempi sono le tabelle, le didascalie delle immagini e le frasi di disambiguazione. Puoi anche impostare un certo testo come ausiliario inserendo la classe  durante la redazione della pagina. In tal caso Cirrus lo riconoscerà immediatamente come ausiliario.

Il testo ausiliario sarà considerato meno importante e sarà visualizzato solo in mancanza di altri articoli che soddisfino la ricerca.

Testo principale
Cirrus assume che il testo ausiliario sia tra l'inizio della pagina e la prima sezione vera e propria. Risultati provenienti dal primo paragrafo di un articolo sono molto importanti ai fini del ranking di una articolo.

Commons
Per default quando si cerca qualcosa preceduto dal prefisso, Cirrus cercherà anche in Commons oltre che nel progetto in questione. Puoi disabilitare questa impostazione inserendo  alla stringa di ricerca. Per specificare uno specifico namespace, per esempio File, si usa la sintassi. Se non stai usando uno specifico namespace, la sintassi sarà simile a.