Help:CirrusSearch/it

CirrusSearch è il nuovo motore di ricerca per MediaWiki. Offre alcuni miglioramenti cruciali rispetto al vecchio LuceneSearch. Questa pagina descrive le caratteristiche che sono nuove o differenti in confronto alle soluzioni precedenti.

Domande frequenti
Se la tua domanda non trova risposta qui, per piacere chiedi in discussione e qualcuno ti risponderà.

Che cosa è migliorato?
Il nuovo motore di ricerca offre miglioramenti cruciali rispetto al vecchio, cioè:


 * ricerca migliorata in molteplici lingue,
 * aggiornamenti più rapidi degli indici, cioè le modifiche alle pagine sono incluse nei risultati di ricerca molto più velocemente,
 * Expanding templates, meaning that all content from a template is now reflected in search results.

Aggiornamenti
Gli aggiornamenti all'indice di ricerca sono eseguiti quasi in tempo reale. Dovresti essere in grado di cercare il testo delle tue modifiche immediatamente dopo averle eseguite. Le modifiche ai template dovrebbero avere effetto negli articoli che li includono in pochi minuti. Le modifiche ai template, tuttavia, rientrano in una job queue (coda di lavoro) e pertanto le performance possono variare. Una modifica nulla all'articolo forzerà comunque l'aggiornamento ma non è richiesta se tutto procede per il verso giusto.

Suggerimenti di ricerca
I suggerimenti di ricerca che ottieni quando scrivi nella casella di ricerca che ti mostra possibili pagine, sono sostanzialmente i titoli delle voci ordinati per numero di collegamenti in entrata. Tieni conto che se inizia una ricerca con la tilde '~' sarà disattivata la funzione di completamento automatico e potrai raggiungere direttamente il titolo che scriverai premendo il tasto invio.

La lettura dei caratteri ASCII/accentati/diacritici è abilitata per i testi in lingua inglese, ma ci sono dei problemi di formattazione con il risultato. Vedi 52656.

Ricerca nel testo
La funzionalità di ricerca testuale, che porta alla pagina dei risultati della ricerca, effettua la ricerca nel titolo, nei rinvii, nei titoli dei paragrafi e nel testo delle voci, quindi non dovrebbe presentare problemi. Il cambiamento principale è nei template, che sono "espansi" per permettere la ricerca anche all'interno del loro testo.

Stemming
Esiste già un supporto per dozzine di lingue, ma tutte le lingue sono richieste. Attualmente sono molte le lingue a essere supportate in elasticsearch.org; dai uno sguardo alla loro documentazione per inviare richieste o patch.

Filtri (intitle:, incategory: e linksto:)


Abbiamo migliorato un po' la sintassi.


 * intitle:foo
 * Find articles whose title contains foo. Stemming is enabled for foo.
 * intitle:"fine line"
 * Find articles whose title contains fine then line. Stemming is enabled. Matches The finest (lines) but not The finest ever lines.
 * intitle:foo bar
 * Find articles whose title contains foo and whose title or text contains bar.
 * -intitle:foo bar
 * Trova le voci il cui titolo non contiene "foo" e il cui titolo o il testo contiene "bar".
 * Intitle: bar foo
 * Errore di sintassi, esegue la ricerca delle voci il cui titolo o testo contiene "intitle" ":", "foo" e "bar".
 * Incategory:Musica
 * Trova le voci che sono nella Categoria:Musica
 * Incategory:"storia della musica"
 * Trova le voci che sono nella Categoria:Storia_della_musica
 * Incategory:incategory "musical": "1920"
 * Trova le voci che sono contemporaneamente nella Categoria:Musicals e nella Categoria:1920
 * -incategory:Incategory "musical": "1920"
 * Trova le voci che non sono nella Categoria:Musical, ma sono nella categoria:1920
 * Mucca*
 * Trova le voci il cui titolo o il testo contengono parole che iniziano con "mucca"
 * Linksto:Help:CirrusSearch
 * Trova le voci che contengono collegamenti alla pagina Help:CirrusSearch
 * -linksto: Help:CirrusSearch CirrusSearch
 * Trova le voci che menzionano CirrusSearch ma non sono collegate alla pagina Help:CirrusSearch

prefix:
Il prefisso: la sintassi nella forma corrente è invocata con una serie di funzionalità in modo da essere ricreata il più esattamente possibile.


 * prefix:mucca
 * Trova le voci il cui titolo inizia con la parola "mucca".
 * domestica prefix:mucca
 * Trova le voci il cui titolo inizia con la parola "mucca" e che contengono la parola "domestica".
 * domestica prefix:Mucca/
 * Trova tutte le sotto-pagine della voce "Mucca" che contengono la parola "domestica". Si tratta di una ricerca molto comune ed è spesso realizzata utilizzando uno speciale parametro URL chiamato.
 * domestica prefix:Discussione:Mucca/
 * Trova tutte le sotto-pagine della pagina di discussione "Discussione:Mucca" che contengono la parola "domestica".
 * mucca prefix:Pink Floyd/
 * Trova tutte le sotto-pagine della voce "Pink Floyd" che contengono la parola "mucca". In questo caso lo spazio tra le parole "Pink Floid" è ininfluente.

Si noti che si può ancora utilizzare la vecchia regola di dover scrivere prefix: alla fine del testo da ricercare.

Prefissi particolari

 * Find articles whose text is most similar to the text of the given articles.
 * The  query works by choosing a set of words in the input articles and run a query with the chosen words. You can tune the way it works by adding the following parameters to the search results URL:
 * : Minimum number of documents (per shard) that need a term for it to be considered.
 * : Maximum number of documents (per shard) that have a term for it to be considered.
 * : Maximum number of terms to be considered.
 * : Minimum number of times the term appears in the input to doc to be considered. For small fields this value should be 1.
 * : Minimal length of a term to be considered. Defaults to 0.
 * : The maximum word length above which words will be ignored. Defaults to unbounded (0).
 * (comma separated list of values): These are the fields to use. Allowed fields are,  ,  ,  ,   and.
 * ( | ): use only the field data. Defaults to : the system will extract the content of the   field to build the query.
 * : The percentage of terms to match on. Defaults to 0.3 (30 percent).
 * Example:
 * These settings can be made persistent by overriding  in Help:System message.
 * Find articles in the talk namespace whose title or text contains the word foo
 * Trova le pagine del namespace File sia locali che su Commons, il cui titolo o testo contiene "Esempio"
 * Puoi aggiungere il codice  alla ricerca (p.es.  ) ed eseguirà la ricerca solo tra i file locali non visualizzando i risultati da Commons.
 * Trova le pagine del namespace File sia locali che su Commons, il cui titolo o testo contiene "Esempio"
 * Puoi aggiungere il codice  alla ricerca (p.es.  ) ed eseguirà la ricerca solo tra i file locali non visualizzando i risultati da Commons.
 * Puoi aggiungere il codice  alla ricerca (p.es.  ) ed eseguirà la ricerca solo tra i file locali non visualizzando i risultati da Commons.
 * Puoi aggiungere il codice  alla ricerca (p.es.  ) ed eseguirà la ricerca solo tra i file locali non visualizzando i risultati da Commons.

Forse cercavi:
I suggerimenti "Forse cercavi:" sono progettati per controllare che non si sia fatto un errore nello scrivere una frase non comune che potrebbe essere il titolo di una voce. A volte la funzione sembra suggerire più cose di quanto dovrebbe.

Prefer phrase matches
If you don't have too much special syntax in your query we'll give perfect phrase matches a boost. I'm being intentionally vague because I'm not sure exactly what "too much special syntax" should be. Right now if you add any explicit phrases to your search we'll turn off this feature.

Ricerche vaghe
Inserendo un ~ "dopo" il termine da ricercare si attiva la funzione di ricerca vaga (fuzzy search). Puoi anche inserire un numero da 0 a 1 (decimali compresi) per regolare il grado di vaghezza. Esempio: nightmare~.9 cercherà il termine "nightmare" con una vaghezza di 0.9. Più vicino ad 1 è il numero che inserisci, meno vaga sarà la ricerca.

Ricerca di frasi
Includere alcune frasi tra parentesi forzerà la ricerca di articoli che contengono quelle parole vicine tra loro. Puoi aggiungere anche una tilde ~ e poi un numero per controllare quanto vicini al testo cercato devono essere i risultati. Il nome tecnico per questa "vicinanza" è "phrase slop". Il valore di default è "molto vicino" cioè 1.

Virgolette e risultati esatti
Le virgolette daranno come risultato l'esatto termine cercato. Puoi aggiungere una tilde ~ per rendere la ricerca più aggressiva.

prefer-recent:
Puoi decidere di visualizzare per prime le pagine modificate di recente inserendo il prefisso prefer-recent: alla tua stringa di ricerca. Per default, quest'opzione scalerà del 60% i risultati con un tempo dall'ultima modifica di 160 giorni. Questo comportamento di default può essere modificato in questo modo: "prefer-recent:, ". "percentuale di quanto vanno scalati i risultati" deve essere un numero tra 0 e 1 inclusi. "emivita in giorni" deve essere maggiore di zero ma accetta anche valori decimali. Questo parametro lavora tanto meglio quanto più è piccolo. Se ad esempio si inserisce .0001 si ricercano le pagine con emivita di 8.64 secondi.

Questa funzionalità potrà essere attivata di default su Wikinews, ma tu potrai usarla ogni volta che vorrai nelle tue ricerche su ogni progetto.

hastemplate:
You can find pages that use a certain template by adding the filter  to the search. We provide for the usual "syntactic sugar" of template calls. This means the lenient pagename and fullpagename capitalization works, and the main namespace abbreviation, ":" works. For example to find which pages transclude Quality image the full search (in all your preferred namespaces) can be: , and for that same template name in the main namespace, this works. You can omit the quotes if the template title does not contain a space. will filter pages that do not contain that template.

For wikitext that calls a template directly, you can use insource:, but hastemplate: searches the "post-expansion inclusion", so hastemplate: can find a template acting only temporarily as a "secondary template" or "meta-template", which are seen in neither the source nor content, ( but only included as a helper to any other template producing the final content). All content from a template is now reflected in search results is still the relevant philosophy here.

boost-templates:
Puoi anche dare priorità alle pagine basandoti sui template in esse contenuti. Ciò può essere fatto direttamene scrivendo  o puoi decidere che ciò avvenga di default per ogni ricerca inserendo.

Il codice  sostituisce il contenuto di   se il primo è esplicitato. La sintassi è un po' bizzarra ma è stata scelta per questioni di semplicità. Alcuni esempi:


 * Cercherà le immagini della categoria Cina che abbiano anche il template "Quality Image"
 * Cercherà le immagini della categoria Cina che abbiano anche il template "Quality Image"


 * Troverà le immagini nella categoria Cina visualizzando prima quelle d'alta qualità e poi quelle di bassa qualità.
 * Troverà le immagini nella categoria Cina visualizzando prima quelle d'alta qualità e poi quelle di bassa qualità.


 * Troverà le immagini che rimandano a "popcorn" visualizzando prima quelle d'alta qualità e poi quelle di bassa qualità.
 * Troverà le immagini che rimandano a "popcorn" visualizzando prima quelle d'alta qualità e poi quelle di bassa qualità.

Ricorda che il codice  è la stessa cosa che inserire direttamente.

Non inserire un decimale nelle percentuali. Non funzionano con questo sistema di ricerca e restituirà un risultato indesiderato.

Una nota il merita il codice : se aggiungi percentuali molto piccole o molto grandi esse possono contaminare il risultato della ricerca. Pensa per esempio se su en.wikipedia volessi dare priorità ad una percentuale molto molto alta di articoli in vetrina. In questo caso le ricerche per un dato termine visualizzerebbero solo articoli in vetrina contenenti quel nome anche se magari esiste una pagina con l'esatto titolo della ricerca ma non viene visualizzato perché non in vetrina.

Sorry for the inconsistent  in the name. Sorry again but the quotes are required on this one. Sorry also for the funky syntax. Sorry we don't try to emulate the template transclusion syntax like we do with.

insource:
searches wikitext. It has two flavors: one is delimited by /by slashes/:
 * and
 * These are like regular content search in that they are fast and case-insensitive, but they only recognize letters and numbers and spaces, and ignore the non-alphanumeric characters such as brackets, punctuation marks, or math symbols.


 * and
 * This can pick up template arguments, URLs, links, html etc. They are as thorough and precise as possible because they search wikitext by Regular expressions. They aren't efficient and we only allow a few of them to run at a time on the search cluster, but they are very powerful. The version with the extra   runs the expression case-insensitive, and is even less efficient.


 * Tip: Instead of running insource: searches directly, these return much much faster if they never run alone, but always alongside other items in the query to act as filters results, such as:


 * For a successful released in the wild, use
 * to hone the regex. A regexp typically needs development and testing with some target test data.
 * To search for the regex metacharacters literally, you must escape them, usually one at a time by backslash-escape. Two other ways to escape characters exist that use delimiters to escape a set of characters: double-quote-escape, and square-bracket escape. Inside these you can still backslash-escape the double-quote or square bracket characters: "A literal \" character", or [-.\]]: a literal dash, dot, or right square bracket. Since the slash delimits the entire regexp, it must always be escaped inside the regexp.  Inside a template, a regexp search for a pipe character is also template-escaped: the search box version of insource:/\|/ becomes the template version insource/\{ {!}}/. For the metacharacters and there meanings see the explanation of the syntax.  For the formal definition see the Lucene grammar for regular expressions.
 * To search for the regex metacharacters literally, you must escape them, usually one at a time by backslash-escape. Two other ways to escape characters exist that use delimiters to escape a set of characters: double-quote-escape, and square-bracket escape. Inside these you can still backslash-escape the double-quote or square bracket characters: "A literal \" character", or [-.\]]: a literal dash, dot, or right square bracket. Since the slash delimits the entire regexp, it must always be escaped inside the regexp.  Inside a template, a regexp search for a pipe character is also template-escaped: the search box version of insource:/\|/ becomes the template version insource/\{ {!}}/. For the metacharacters and there meanings see the explanation of the syntax.  For the formal definition see the Lucene grammar for regular expressions.


 * For example, to find usage of a template called Val with an unnamed parameter of three to four digits having a possible minus sign and, on the same page, Val with a named argument "fmt=commas":

Testo ausiliario
CirrusSearch considererà alcuni testi come "ausiliari" a ciò di cui la pagina tratta. Esempi sono le tabelle, le didascalie delle immagini e le frasi di disambiguazione. Puoi anche impostare un certo testo come ausiliario inserendo la classe  durante la redazione della pagina. In tal caso Cirrus lo riconoscerà immediatamente come ausiliario.

Il testo ausiliario sarà considerato meno importante e sarà visualizzato solo in mancanza di altri articoli che soddisfino la ricerca.

Testo principale
Cirrus assume che il testo ausiliario sia tra l'inizio della pagina e la prima sezione vera e propria. Risultati provenienti dal primo paragrafo di un articolo sono molto importanti ai fini del ranking di una articolo.

Commons
Per default quando si cerca qualcosa preceduto dal prefisso, Cirrus cercherà anche in Commons oltre che nel progetto in questione. Puoi disabilitare questa impostazione inserendo  alla stringa di ricerca. Per specificare uno specifico namespace, per esempio File, si usa la sintassi. Se non stai usando uno specifico namespace, la sintassi sarà simile a.

Vedi anche

 * Specifiche complete