Help:CirrusSearch/pt-br

O modo mais rápido de encontrar informações em projetos da Wikimedia é procurá-las diretamente. Em todas as páginas há uma caixa de .

CirrusSearch é uma extensão do MediaWiki que utiliza o Elasticsearch para fornecer recursos de pesquisa melhorados para a pesquisa padrão do MediaWiki. A Fundação Wikimedia usa o CirrusSearch em todos os seus projetos. Esta página descreve as funcionalidades do CirrusSearch. Se a sua pergunta não for respondida aqui, sinta-se livre para perguntar na página de discussão e alguém responderá para você.

Para informações sobre a extensão do MediaWiki, veja Extension:CirrusSearch.

Como funciona
Insira palavras chaves e frases e pressione Enter ou Return em seu teclado. Ou clique no ícone da lupa, Buscar ou no botão Ir. Se uma página possui o mesmo título que o inserido por você (ou você usar o botão Ir) você será direcionado a esta página. Caso o contrário, examina-se todas as páginas na wiki e apresenta-se uma lista de artigos que corresponde aos seus termos pesquisados ou uma mensagem te informando que nenhuma página possui todas as palavras-chave e frases.

Se você clicar no botão "" sem preencher algo, você será levado para a página "Special:Search", que oferece opções extra de busca (também disponível a partir de qualquer página que lista resultados de pesquisa).

Talvez você ache útil restringir a pesquisa para páginas com um espaço de nomes particular, por exemplo, buscar apenas dentre as páginas de. Verifique os espaços de nomes necessários para esta pesquisa.

Por padrão apenas os espaços de nomes especificados em suas preferências serão pesquisados. Usuários com sessão ativa podem mudar as suas preferências para especificar os espaços de nomes que querem pesquisar por padrão. Isso pode ser feito marcando ou desmarcando caixas na seção "busca" das preferências de usuário.

O que foi melhorado?
O CirrusSearch dispõe de três melhorias principais em relação à pesquisa padrão do MediaWiki, nomeadamente:


 * Melhor suporte para pesquisas em diferentes idiomas.
 * Atualizações mais rápidas para o índice de pesquisa, ou seja, as alterações nos artigos são refletidas muito mais rápido nos resultados.
 * Abrangência em predefinições, o que significa que todo o conteúdo de uma predefinição será refletido nos resultados da pesquisa.

Qual é a frequência de atualização do índice de pesquisa?
Atualizações ao índice de pesquisa são feitas quase em tempo real. Mudanças em artigos devem, imediatamente, aparecer nos resultados da pesquisa. Mudanças em predefinições devem, em poucos minutos, ter efeito nos artigos que as incluam. As mudanças em predefinições usam a fila de espera, por isso o desempenho pode variar. Uma edição nula ao artigo forçará a mudança, mas isso não deverá ser necessário se tudo estiver a correr bem.

Sugestões de pesquisa
As sugestões de busca mostradas quando você digita na caixa de pesquisa que exibem páginas candidatas são ordenadas por uma medição aproximada da qualidade do artigo. Isso leva em conta o número de wikilinks recebidos, o tamanho da página, o número de links externos, o número de seções e o número de redirecionamentos. Sugestões de busca podem ser ignoradas e consultas farão com que se vá diretamente para a página de resultados. Adicione um til  antes da consulta. Por exemplo, "~Frida Kahlo". As sugestões de busca ainda aparecerão, mas pressionar a tecla Enter a qualquer momento te levará para a página de resultados. Transformação de ASCII/acentuação/diacríticos é padrão para texto em inglês, mas há alguns problemas de formatação com o resultado. Veja.

Pesquisa completa de texto
Uma "pesquisa completa de texto" é uma "pesquisa indexada". Todas as páginas são armanezadas no banco de dados da wiki e todas as palavras nelas são armazenadas no banco de dados de pesquisa, que é um indicador para o texto completo da wiki. Cada palavra visível é indexada à lista de páginas onde é encontrada, então uma busca por uma palavra é tão rápido quanto procurar um registro único. Além disso, dadas quaisquer mudanças na redação, o índice de busca é atualizado em segundos.

Há vários índices do "texto completo" da wiki para facilitar os vários tipos de busca necessários. O wikitexto completo é indexado várias vezes dentro de vários índices de propósito especial, cada um analisando o wikitexto de modo que otimize o seu uso. Índices de exemplo incluem:


 * Texto "auxiliar", incluindo hatnotes, legendas, ToC e qualquer wikitexto classificado por um atributo HTML class=searchaux.
 * Texto "introdutório" é o wikitexto entre o topo da página e o primeiro cabeçalho.
 * O texto "categoria" indexa as listagens na parte inferior.
 * Templates são indexados. Se as palavras transcluídas de um template mudam, então todas as páginas a transcluem são atualizadas. (Isso pode demorar um bom tempo dependendo dos trabalhos em espera). Se os subtemplates usados por um template mudarem, o índice é atualizado.
 * Conteúdos de documentos que são armazenados no espaço de nome Ficheiro/Mídia agora são indexados. Milhares de formatos são reconhecidos.

Há suporte para algumas dúzias de idiomas, mas todas as línguas são desejadas. Há uma lista das linguagens atualmente suportadas em elasticsearch.org; veja a documentação para contribuições para submeter solicitações ou correções.

CirrusSearch vai otimizar a sua consulta e executá-la. Os títulos resultantes são ponderados conforme relevância e pesadamente pós-processados, 20 por vez, para a página de resultados de pesquisa. Por exemplo, trechos são colhidos do artigo e termos pesquisados são destacados por texto em negrito.

Resultados de busca vão frequentemente ser acompanhados por vários relatórios preliminares. Eles incluem Você quis dizer (correção de ortografia) e, quando nenhum resultado for de outro modo encontrado, ele dirá Mostrando resultados para (consulta corrigida) e busque por (sua consulta).

Funcionalidades de pesquisa também incluem:


 * organizar sugestões de navegação pelo número de links recebidos.
 * Começar com o caracter til  para desabilitar navegação e sugestões de tal forma que também preserve classificação de página.
 * Correspondência esperta de caracteres ao normalizar (ou "transformar") caracteres não presentes no teclado em caracteres de teclado.
 * Palavras e frases que correspondem são destacadas em negrito na página de resultados de busca. O destaque é um analisador cosmético, enquanto o analisador de busca-indexação realmente encontra a página, e eles podem não estar 100% em sincronia, especialmente para expressões regulares. O destaque pode corresponder mais ou menos acuradamente do que o indexador.

Palavras, frases e modificadores
O termo de busca básico é uma palavra ou uma "frase entre aspas". A pesquisa reconhece uma "palavra" como:


 * uma sequência de dígitos
 * uma sequência de letras
 * subpalavras entre letras/transições de dígitos, como em txt2regex
 * subpalavras dentro de um nomeComposto usando camelCase

Uma "palavra de parada" é uma palavra que é ignorada (porque é comum ou por outras razões). Um termo de busca dado é correspondido com conteúdo (processado na página). Para corresponder com wikitexto no lugar, use o parâmetro de busca insource (Veja seção abaixo). Cada parâmetro de busca tem o seu próprio índice e interpreta seu termo dado de sua própria forma.

Espaço entre palavras, frases, parâmetros e entradas para parâmetros podem incluir instâncias abundantes de espaços em branco e caracteres de espaço cinza. "Caracteres de espaço cinza" são todos os caracteres não-alfanuméricos ~!@#$%^&*_+-={}|[]\:";'<>?,./ . Uma sequência que mistura caracteres de espaço cinza e caracteres de espaço em branco é espaço cinza e é tratado como o limite de uma palavra grande. Espaço em cinza é como índices são feitos e consultas são interpretadas.

Duas exceções são onde 1) uma doispontos:embutidos é uma palavra (sendo tratada como uma letra) e 2) uma vírgula embutida, como em 1,2,3 é tratada como um número. Caracteres de espaço cinza são de outra forma ignorados a não ser que, devido à sintaxe da consulta, eles possam ser interpretados como caracteres modificadores.

Os modificadores são ~ * \? - " ! . Dependendo de sua posição na sintaxe eles podem ser aplicados a um termo, um parâmetro ou a uma consulta completa. Modificadores de palavra e frase são as pesquisas coringa, de proximidade e difusas. Cada parâmetro pode ter seus próprios modificadores, mas em geral:


 * Uma pesquisa de palavra difusa ou frase difusa pode ser o sufixo de um caracter til  (e um número discriminando o grau).
 * Um caracter til  pré-fixado ao primeiro termo da consulta garante resultados de busca em vez de qualquer navegação possível.
 * Um caracter coringa dentro de uma palavra pode ser (com um caracter de escape) um ponto de \? interrogação para um caracter ou um caracter asterisco * para mais.
 * Lógica verdadeira pode interpretar AND e OR, mas parâmetros não podem.
 * Lógica verdadeira entende - ou ! pré-fixados a um termo para inverter o significado usual do termo de "corresponder" para "excluir".
 * Aspas ao redor de palavras marcam uma busca por uma "frase exata". Para parâmetros eles também são necessários para delimitar inserção de múltiplas palavras.
 * Decorrência é automática mas pode ser desativada usando uma "frase exata".

Uma pesquisa por frase pode ser iniciada com várias dicas para o motor de buscas. Cada método de dica tem um efeito colateral de quão tolerante cada combinação de sequência de palavras será. Para dicas de espaço cinza', camelCase ou txt2number'' (texto para número): Um parecer de "busque por" é engatilhado quando uma palavra desconhecida universalmente é ignorada em uma frase.
 * dado words-joined_by_greyspace(characters) (palavras-unidas_por_espaço_cinza) ou #wjcamel (palavrasUnidasPorCaracteresCamelCase), o motor de buscas encontra palavras unidas por caracteres..., em sua forma crua ou em espaço cinza.
 * txt2number (textoparanúmero) representará  (texto para número) ou   (texto-para.número).
 * Palavras de parada são habilitadas para os casos periféricos de uma frase com espaço_cinza ou camelCase. Um exemplo usando the (a), of (de), e a (uma) é que the_invisible_hand_of_a (a_mão_invisível_das_combinações) combina com  (aperto de mão invisível de reuniões).

Cada um dos seguntes tipos de combinação de frases contém e abrange as tolerâncias de combinação do anterior:
 * Uma "frase exata" "entre aspas" irá tolerar (combinação com) espaços cinza. Dado "exact_phrase" ou "exact phrase", ela combinará com.
 * Uma frase_com_espaço_cinza inicia checagens provenientes e de palavras de parada.
 * Dado CamelCase ele irá adicionalmente combinar  todo em caixa baixa porque o CirrusSearch não é sensível a maiúsculas e minúsculas.

Classificação de páginas te poupa de digitar aspas para uma busca de duas palavras. Sem aspas, um índice de pares de palavras é usado para classificar páginas, e encontra as duas palavras em qualquer lugar dela.

Alguns parâmetros interpretam frases com espaços cinzas, mas outros como  apenas interpretam a usual "frase entre aspas".

Note que toda proveniência não é sensível a letras maiúsculas e minúsculas.

Note como a busca por "frase exata" interpretou o caracter de doispontos:incorporado como uma letra, mas não o caracter de underscore_incorporado. Um evento similar ocorre com o caracter vírgula, dentro de um número.

Dado, CirrusSearch, quando em um contexto de "frase exata" (que inclui o contexto de parâmetro insource), não irá combinar  ,  ,  , mas sim combinar apenas.

Fora isso, lembre-se de que para o CirrusSearch palavras são letras, números ou a combinação dos dois, e letras maiúsculas ou minúsculas não importam.

A busca por palavra comum emprega o caracter de espaço e é agressiva com proveniência, e quando as mesmas palavras são unidas por caracteres de espaço cinza ou camelCase elas são agressivas com frases e subpalavras.

Quando palavras comns como "de" ou "o" são incluídas em uma frase de espaço cinza, elas são ignoradas para uma combinação mais agressiva.

Um termo de busca com frase_em_espaço_cinza, ou um camelCase, ou um termo txt2number, combinam as palavras significativas intercambiavelmente. Você pode usar qualquer uma dessas três formas. Agora, camelcase combina com camelCase porque a busca não é sensível a letras maiúsculas e minúsculas, mas camelCase combina com camelcase porque camelCase é mais agressivo. Como no resto da busca, subpalavra "palavras" não são sensíveis a letras maiúsculas e minúsculas. Por comparação a "frase exata" é orientada a espaço cinza e ignora transições numéricas ou de letras e proveniência. "Frases entre aspas" não são sensíveis a letras maiúsculas e minúsculas.

Da tabela podemos deduzir que a busca básica parser_function -"parser function" é a soma das buscas básicas  e.

Fazendo consultas com números, nós observaríamos que: O coringa asterisco * combina um conjunto de letras e dígitos dentro de uma palavra fornecida, mas nunca o caracter de início. Um ou mais caracteres, uma percentagem da palavra, devem proceder o caracter *. O coringa \? representa uma letra ou número; o *\? é também aceito, mas \?* não é reconhecido.
 * Plan9 ou Plan_9 combina com qualquer um destes:, , , ,
 * "plan9" só combina com  (não sensível a maiúsculas e minúsculas)
 * Plan*9 combina com  ou
 * Se a parte inicial é de apenas letras então ele irá limitar a combinação a um conjunto de (zero ou mais) letras.
 * Se há apenas números, então ele irá limitar a combinação a uma sequência de (zero ou mais) números, incluindo também letras ordinais (st, nd, rd), letras maiúsculas ou abreviações de tempo (am ou pm); e ele irá combinar a totalidade de (ambos os lados) de números decimais.
 * Fora isso, a vírgula é considerada um caracter de espaço cinza, e irá delimitar dois números.
 * Dentro de uma "frase exata" combina-se proveniência e composição.

Os coringas são para buscas básicas por palavras, frases e insource, e também podem ser uma alternativa para (algumas) buscas por expressões regulares (explicadas à frente).

Colocar o caracter til ~ após uma palavra ou frase ativa uma busca difusa.
 * Para uma frase, isso é denominado uma busca de proximidade, porque palavras próximas são toleradas em uma aproximação ao invés da frase exata.
 * Por exemplo, "exact one two phrase"~2 é uma combinação para.
 * Para uma palavra, isso significa caracteres extras ou caracteres mudados.
 * Para uma frase, uma busca difusa requer um número inteiro lhe dizendo quantas palavras extras deve-se encaixar, mas para uma palavra uma busca difusa pode ter uma fração decimal, padronizando para word~0.5 ( word~.5 ), onde até duas letras podem ser encontradas trocadas, mudadas ou adicionadas, mas nunca as primeiras duas letras.
 * Para uma frase aproximada, um número grande pode ser usado, mas a busca se torna cara (lenta).
 * Para uma palavra word~.1 é a mais difusa, e word~.9 é a menos difusa, e word~1 não é difusa.

Para que o valor mais próximo necessário combinar em ordem reversa (direita para esquerda), conte e descarte todas as palavras extras e então adicione duas vezes a quantidad total das palavras restantes menus um. (Em outras palavras, adicione duas vezes o número de segmentos). Para o algoritmo de aproximação máxima, veja Elasticsearch slop. Um AND explícito é requerido entre duas frases pois de outra forma as duas "aspas" "internas" são confundidas. Aspas desabilitam proveniência, "but appending"~ reabilita a proveniência.

Insource
Buscas insource podem ser usadas para encontrar qualquer palavra processada em uma página, mas é feita para encontrar qualquer frase que você possa encontrar - incluindo um markup da MediaWiki. Essa frase ignora completamente espaços cinzas: insource: "state state autocollapse" combina com. Insource complementa a si mesmo. Por um lado tem-se uma busca em textos inteiros por qualquer palavra no wikitexto, de maneira instantânea. Por outro, pod-se processar uma busca com expressão regular para qualquer conjunto de caracteres. Expressões regulares analisam todos os caracteres textuais em uma lista de páginas dada; elas não possuem um índice de palavras para acelerar o processo, e ele é interrompido se levar mais de vinte segundos. Expressões regulares são executadas rapidamente, então para limitar análise de níveis de caracteres desnecessários, você fornece a elas uma lista de páginas (um domínio de busca) selecionado por uma busca indexada adicionado à consulta como uma "cláusula", e você faz isso para cada consulta com expressões regulares. . Insource pode atuar das duas formas, e o melhor candidato para insource:/arg/ é frequentemente insource: arg, onde arg é o mesmo.

A sintaxe para expressões regulares é insource: sem espaço, e então /regexp/. (Nenhum outro parâmetro desautoriza um espaço. Todos os parâmetros exceto insource:/regexp/ generosamente aceitam espaço após dois pontos).

Busca indexada insource e função de busca com expressões regulares são similares em vários aspectos: Mas buscas indexadas ignoram todos os espaços cinzas; buscas com coringas não combinam espaços cinzas, então expressões regulares são a única forma de encontrar o exato conjunto de caracteres qualquer um e todos, por exemplo a sequência de dois espaços. Expressões regulares são uma classe inteiramente diferente de ferramentas de busca que tornam a combinação de um conjunto literal fácil (básico, uso por iniciantes), e faz com que combinações por expressões com metacaracteres sejam possíveis (uso avançado) na wiki. Veja abaixo.
 * As duas buscam por apenas wikitexto.
 * Nenhuma delas encontra coisas fornecidas por uma transclusão.
 * Nenhuma delas faz buscas de proveniência, difusas ou por aproximação.
 * Ambas desejam obter o mínimo de resultados, e ambas trabalharam rapidamente quando acompanhadas de outra cláusula.

Prefixo e espaço de nome
Para Pesquisa, um termo de espaço de nomes funciona para especificar o domínio inicial de busca. Ao invés de pesquisar na wiki inteira, o padrão é o espaço de nomes principal (espaço principal).

Apenas um espaço de nomes pode ser configurado através da caixa de consultas da busca. Ele é ou o primeiro termo ou o último termo, em um parâmetro prefixo.

Dois ou mais espaços de nomes podem ser buscados pela janela Avançada da barra de busca encontrada no topo de cada página de resultados de busca, Special:Search. Seu domínio de busca, como um perfil de espaços de nomes, pode ser configurado aqui (sem ir à página de preferências do usuário). A lista de espaços de nomes será então apresentada na primeira página de futuros resultados de busca para indicar o domínio de busca dos resultados. Para desconfigurar isso, selecione o espaço de nomes padrão (mostrado em parênteses), selecione "Lembrar", e pressione Pesquisar.

A barra de busca graficamente configura e indica um domínio de busca. "Conteúdo das páginas" (espaço principal), Multimídia (Arquivo), "Tudo" (tudo mais Arquivo), "Traduções", etc., são hiperlinks que podem ativar a consulta naquele domínio, e então indicar isso ao se tornar inativo (escuro). Mas a consulta irá sobrescrever a barra de busca. Quando um espaço de nomes ou prefixo é usado na consulta, as ativações da barra de busca e indicações podem ser equivocadas, então a barra de busca e a caixa de busca são maneiras mutualmente exclusivas (não complementares) para configurar o domínio de busca.

Um termo de espaço de nomes sobrescreve a barra de busca, e um termo prefixo sobrescreve um espaço de nomes.

Insira um nome de espaço de nomes, ou coloque, ou escreva dois pontos     para designar o espaço principal. Todos não inclui o espaço de nomes Arquivo. Arquivo inclui conteúdo de mídia sob o domínio Commons como PDF, que são todos indexados e pesquisáveis. Quando Arquivo está envolvido, um modificador de espaço de nomes chamado  faz efeito; de outra forma, ele é ignorado. Alcunhas de espaços de nomes são aceitos. Como parâmetros de busca, local e all devem estar em letras minúsculas. Espaços de nomes não são sensíveis a letras maiúsculas e minúsculas.

O parâmetro prefix: combina qualquer número de caracteres primeiros de todos os nomes de páginas em um espaço de nomes. Quando as primeiras letras combinam um espaço de nomes e dois pontos, o domínio de busca muda. Dado um espaço de nomes apenas, prefixo vai combinar todos os nomes de páginas. Dado um caracter apenas, não pode ser - traço ou ' aspas ou " aspas duplas. O último caracter não pode ser dois pontos. Para nomes de páginas que combinam, seus títulos de subpáginas serão combinados por definição. O parâmetro prefixo não permite um espaço antes de um espaço de nomes, mas autoriza um espaço em branco antes de um nome de página.

O parâmetro prefixo vai até o fim para os caracteres do nome da página que talvez contenham " aspas duplas.

A Extensão de tradução cria um tipo de "espaço de nome de idioma", de versões traduzidas de uma página. Mas ao contrário do espaço de nome ou prefixo, que criam um domínio de busca inicial, o parâmetro inlanguage é um filtro disso. (Veja a próxima seção)

Exclua conteúdo do índice de busca
Conteúdo pode ser excluído do índice de busca adicionando-se. Isso irá instruir o CirrusSearch a ignorar este conteúdo do índice de busca (veja para mais contexto)

Adicionalmente, conteúdo pode ser marcado como informação auxiliar adicionando-se. Isso irá instruir o CirrusSearch a mover o conteúdo do texto principal para um campo auxiliar que tem menos importância para busca e delineamento de fragmentos. Essa distinção é usada por ítens como descrições de imagens de thumbnail, seções, 'Veja também', etc.

Filtros
Um filtro pode ter múltiplas instâncias, e instâncias anuladas, e isso pode ser executado como um filtro independente para um domínio de busca. A consulta é formada como termos que filtram um domínio de busca. Um espaço de nomes ou um termo prefixo não é um filtro porque um espaço de nomes não pode ser executado independentemente, e um prefixo não executa anulações.

Adicionar outra palavra, frase ou parâmetro filtra mais. Um resultado de busca altamente refinado por ter muitos filtros Y/N quando toda página nos resultados é abordada. (Neste caso, classificação é largamente irrelevante.) Filtragem se aplica criticamente à adição de um termo de expressão regular; você quer o mínimo de páginas possíveis antes de adicionar uma expressão regular (porque pode ser que não se tenha um índice preparado para sua busca).

Os parâmetros de pesquisa abaixo são filtros.

Insource (explicado acima) é também um filtro, mas insource:/regexp/ não é. Filtros e todos os outros parâmetros de busca são escritos em letras minúsculas. (Espaços de nomes são uma exceção, não sendo sensíveis a letras maiúsculas e minúsculas.)

Em título e em categoria
Buscas por palavras e frases combinam com um título e com a caixa de categoria na parte inferior da página. Mas com esses parâmetros você pode selecionar apenas título ou apenas cateogoria.

Em título e em categoria são parâmetros de busca antigos. Em categoria não busca mais qualquer subcategoria automaticamente, mas agora você pode adicionar múltiplas categorias de nomes de páginas manualmente. Para conseguir com que o parâmetro de pesquisa deepcat adicione até 70 subcategorias em um parâmetro em categoria, incategory:category1|category2|...|category70, você pode adicionar uma linha em seu JavaScript personalizado.
 * cow*
 * Encontra artigos cujo título ou texto contém palavras que começam com cow.
 * intitle:foo
 * Encontra artigos cujo título contém foo. Proveniência é ativada para foo.
 * intitle:"fine line"
 * Encontra artigos cujo título contém fine line. Proveniência é desativada.
 * intitle:foo bar
 * Encontra artigos cujo título contém foo e cujo título ou texto contém bar.
 * -intitle:foo bar
 * Encontre artigos cujos títulos não contenham a palavra "bar", mas, quer seja no título ou texto incluso, possuam a palavra "foo".
 * incategory:Music
 * Encontra artigos que estejam na Categoria:Música
 * incategory:"music history"
 * Encontra artigos que estejam na Categoria:História da música‎
 * incategory:"musicals" incategory:"1920"
 * Encontra artigos que estejam em ambas as categorias, Categoria:Musicais e Categoria:1920
 * -incategory:"musicals" incategory:"1920"
 * Encontra artigos que não estejam na Categoria:Musicais, mas sim na Categoria:1920

Linksto
Linksto encontra wikilinks para um dado nome, e não links para um conteúdo. A entrada é o nome da página canônico, sensível a letras maiúsculas e minúsculas.

Ele deve corresponder à linha de título do conteúdo da página, exatamente, antes de quaisquer modificações de título de letras maiúsculas e minúsculas. (Ele deve corresponder seu { {FULLPAGENAME}}, por exemplo .)

Linksto não encontra redirecionamentos. Ele só encontra [ [wikilinks]], ainda que eles sejam feitos por um template. Ele não encontra um link feito por uma URL, ainda que esta URL seja um link interno da wiki.

Para encontrar todos os wikilinks para um "Help:Cirrus Search", se "Help:Searching" e "H:S" são redirecionamentos para ele:
 * 1) linksto: "Help:Cirrus Search"
 * 2) linksto: Help:Searching
 * 3) linksto: H:S

encontra artigos que mencionam "CirrusSearch" mas não em um wikilink.

Hastemplate
Você pode especificar uso de templates com. Entre com o nome canônico da página para encontrar todos os usos do template, mas o uso de quaisquer de seus redirecionamentos encontrará somente a nomeação. Apelidos de espaços de nomes são aceitos, capitalização é inteiramente ignorada, e redirecionamentos são encontrados, tudo em uma busca de nome. (Compare boost-template sem espaço de nomes padrão; linksto sem apelidos de espaços de nomes, sensível a letras maiúsculas e minúsculas, sem redirecionamentos; intitle sem redirecionamentos.)

Hastemplate encontra usos secundários (ou meta-template) em uma página: ele busca pela inclusão pós-expansão. Essa é a mesma filosofia para palavras e frases de um template, mas aqui é para templates de um template. A página será listada como contendo um conteúdo ainda que este conteúdo não seja visto no wikitexto.


 * hastemplate: "quality image" encontra o uso de "Template:Quality image" em seu domínio de busca padrão (espaços de nomes).
 * : hastemplate: portal:contents/tocnavbar encontra uso de espaço principal de um template "Contents/TOCnavbar" no espaço de nomes Portal.

Para instalações com a extensão Traduzir, buscas com hastemplate são interferidas aonde quer que Template:Translatable template name cobre o nome de template de um template traduzível. Use insource no lugar.

Inlanguage
Para instalações com a extensão Traduzir, inlanguage é importante para buscas altamente refinadas e contagens de páginas.


 * inlanguage: language code

irá produzir resultados de busca naquele idioma apenas.

Por exemplo:


 * para contar todas as páginas em japonês na wiki
 * all: inlanguage: ja


 * para deixar de fora páginas em alemão e espanhol no espaço de nomes Ajuda
 * help: -inlanguage: de -inlanguage: es


 * para ignorar Traduzir, e onde inglês é o idioma de base, adicione
 * inlanguage:en

Contentmodel
A palavra-chave contentmodel: autoriza a limitação da busca para páginas de um modelo de conteúdo específico. Para possíveis modelos confira Content handlers. E.g.:


 * Para ver apenas páginas JSON:
 * contentmodel:json

Ponderação da página
Ponderação determina fragmentos, sugestões e relevância da página. O peso normal é um. Ponderação adicional é dada através de multiplicadores.

Se a consulta é apenas palavras, à páginas que correspondem a elas em ordem são dadas um reforço. Se você adicionar quaisquer frases ''explícitas' à sua busca, ou para outras certas adições, esta ferramenta de "frase preferida" não é aplicada.

Morelike
A consulta morelike: funciona através da escolha de um conjunto de palavras nos artigos de entrada e execução da consulta com as palavras escolhidas. Você pode sintonizar a maneira como funciona ao adicionar os seguintes parâmetros à URL dos resultados de busca: Estas configurações podem ser feitas persistentes ao sobrescrever  em Special:MyLanguage/Help:System message.
 * morelike:page name 1|page name 2|...|page name n
 * Encontra artigos cujo texto é mais similar ao texto dos artigos dados.
 * morelike:wasp|bee|ant
 * Encontra artigos sobre insetos que picam.
 * morelike:template:search|template:regex|template:usage
 * Encontra modelos sobre buscas com expressões regulares para usos de modelos na wiki.
 * cirrusMltMinDocFreq : Número mínimo de documentos (por trecho) que precisam de um termo para que sejam considerados.
 * cirrusMltMaxDocFreq : Número máximo de documentos (por trecho) que possuem um termo para que sejam considerados.
 * cirrusMltMaxQueryTerms : Número máximo de termos a serem considerados.
 * cirrusMltMinTermFreq : Número mínimo d vezes em que o termo aparece na entrada para que o documento seja considerado. Para espaços pequenos ( title ), este valor deve ser 1.
 * cirrusMltMinWordLength : Comprimento mínimo do termo a ser considerado. O padrão é 0.
 * cirrusMltMaxWordLength : O comprimento máximo da palavra acima do qual palavras serão ignoradas. O padrão é ilimitado (0).
 * cirrusMltFields (lista de valores separados por vírgula): Estes são campos para uso. Campos autorizados são title, text , auxiliary_text , opening_text , headings e all.
 * cirrusMltUseFields ( | ): Use apenas o campo de dados. O padrão é : o sistema extrairá o conteúdo do campo   para construir uma consulta.
 * cirrusMltPercentTermsToMatch : A porcentagem dos termos para correspondência. O padrão é 0.3 (30 por cento).
 * Exemplo:

Prefer-recent
Adicionar prefer-recent: em qualquer lugar na consulta dá a artigos recentemente editados um reforço levemente maior do que o reforço normal nas regras de classificação de páginas.

Padroniza-se o reforço a apenas 60% dos pontos, em uma grande janela de tempo de 160 dias, que pode ser inserido na consulta como prefer-recent:0.6,160 .. Isso vai bem com outras regras de classificação de páginas, e é intencional para a maioria das pesquisas.

Você pode manipular as regras: prefer-recent:boost,recent Tecnicamente, "reforço" é a proporção dos pontos para escala, e "recente" é a meia vida em dias. O reforço é mais que o usual multiplicador, é um reforço exponencial. O fator usado no expoente é o tempo desde a última edição.

Por exemplo
 * prefer-recent:,7

Páginas mais velhas que 7 dias são reforçadas pela metade, e páginas mais velhas que 14 dias são reforçadas pela metade da metade, e assim por diante.

Para um simples "organizar por data" em resultados de busca altamente refinados, onde classificação de página e reforço são largamente sem significado, apenas reforce a pontuação inteira:
 * prefer-recent:1,7 (weeks)
 * prefer-recent:1,1 (days)
 * prefer-recent:1,0.0007 (minutes)
 * prefer-recent:1,0.0001 (8.64 seconds)
 * prefer-recent:1,0.00001 (seconds)

Boost-templates
Você pode aumentar a pontuação das páginas baseando-se em que modelos elas contém. Isso pode ser feito diretamente na busca via  ou você pode configurar o padrão para todas as buscas via a nova mensagem. substitui os conteúdos de  se o o primeiro for especificado. A sintaxe é um tanto estranha mas foi escolhida por sua simplicidade. Alguns exemplos:


 * File:boost-templates:"Template:Quality Image|200%" incategory:china
 * Encontra arquivos na categoria China ordenando por maior qualidade de imagem.


 * File:boost-templates:"Template:Quality Image|200% Template:Low Quality|50%" incategory:china
 * Encontra arquivos na categoria China colocando imagens de alta qualidade primeiro e imagens em baixa qualidade por último.


 * File:boost-templates:"Template:Quality Image|200% Template:Low Quality|50%" popcorn
 * Encontra arquivos sobre pipoca colocando imagens de alta qualidade primeiro e de baixa qualidade por último. Lembre-se que durante o uso da mensagem  isso pode ser reduzido para apenas.

Não tente adicionar pontos decimais às porcentagens. Eles não funcionam e a pontuação de busca é tal qual é difícil que seja significante.

Um alerta sobre : se você adicionar porcentagens muito grandes ou muito pequenas elas podem "contaminar" a pontuação do texto inteiro. Pense, por exemplo, se enwiki reforçasse artigos em destaque em milhão. Buscas para termos mencionados em artigos em destaque, então, achariam-nos antes de correspondências exatas de título dos termos. Correspondência de frases seria similarmente afetado então uma busca como  acharia um artigo em destaque com essas palavras espalhadas ao invés de um artigo sobre Brave New World.

Buscas com expressões regulares
Uma busca indexada básica encontra palavras feitas visíveis em uma página. Hifenação, pontuação, parênteses, barra diagonal e outros símbolos matemáticos e computacionais são meros limites para as palavras. Não é possível inclui-los em uma busca indexada.

Elas retornam muito mais rápido quando você limita o domínio da busca por expressões regulares a resultados de uma ou mais buscas baseadas em indexação.

Alerta: Não execute uma busca simples com insource:/regexp/. Ela provavelmente expirará após 20 segundos de qualquer forma, enquanto bloqueia usuários responsáveis.

Uma busca por "conjuntos exatos" com expressões regulares é uma busca básica; ela irá simplesmente "citar" a expressão regular inteira, ou "barra-inverter" todos os caracteres que não são alfanuméricos no conjunto. Todas as buscas com expressões regulares também requerem que o usuário desenvolva um filtro simples para gerar o domínio de busca para o motor de busca de expressões regulares procurar:
 * insource:"debian.reproducible.net" insource: / debian\.reproducible\.net / 
 * insource:"c:\program files (x86)" insource: / C\:\\Program Files \(x86\) /i 
 * insource:"{ {template}}" insource: / "{ {template}}<\/tag>" /
 * insource:"[ [title|link label]]'s" insource: / "[ [title|link label]]'s" /
 * insource: / regexp / prefix:{ {FULLPAGENAME}}

O último exemplo funciona de um link em uma página, mas { {FULLPAGENAME}} não funciona na caixa de pesquisa.

Por exemplo: Special:Search/insource:/regex/ prefix: encontra o termo regex nesta página.

Uma consulta com nenhum espaço de nomes ou prefixo especificado realiza a pesquisa em seu domínio padrão de busca (configurável em qualquer página de resultados d busca, i.e. em Special:Search). Alguns usuários mantém seus domínios de busca padrão em "todos os espaços de nomes", i.e. a wiki inteira. Em uma wiki maior, se este usuário faz uma busca vaga com expressões regulares, ela provavelmente falhará, resultando no esgotamento de tempo de HTML antes de completar a pesquisa.

Uma busca com expressões regulares na verdade esquadrinha cada página no domínio de busca caracter por caracter. De forma oposta, uma busca indexada na verdade consulta alguns registros de um banco de dados separadamente mantido do banco de dados da wiki, e provê resultados praticamente instantâneos. Então quando usar insource:// (uma expressão regular de qualquer tipo), considere criar termos de busca que limitem o domínio de busca da expressão regular o máximo possível. Há vários termos de busca que usam um índice e então instantaneamente provém um domínio de pesquisa mais refinado para a /expressão regular/. Para mais efetividade, use: Para testar uma consulta simples com expressões regulares você pode criar uma página com padrões de teste, e então usar o parâmetro prefixo com o nome completo da página. A correspondência será destacada. Ele revistará a página (no banco de dados) e suas subpáginas.
 * insource:"" com aspas duplas, duplicando a expressão regular exceto sem barras ou caracteres de escape, é idal.
 * intitle, incategory e linksto são filtros excelentes.
 * hastemplate: é um filtro muito bom.
 * "palavra1 palavra2 palavra3", com ou sem aspas duplas, é bom.
 * namespace: é praticamente inútil, mas pode habilitar uma busca lenta com expressões regulares para se completar.

Termos de busca que não aumentam a eficiência de uma busca com expressões regulares são os operadores de pontuação de página: morelike, boost-template e prefer-recent.

Metacaracteres
Esta seção cobre como escapar metacaracteres usados em buscas com expressões regulares. Para saber mais sobre o significado real de metacaracteres, leia a explicação da sintaxe.

Por exemplo:


 * buscar um espaço de nomes, meça o número de páginas com um único termo que é um espaço de nomes. Isto irá listar o número de páginas naquele espaço de nomes.
 * tentar encontrar novamente o que você já viu, como "wiki-link" ou "(trans[in]clusion)", começando com um filtro de espaço de nomes e insource.

Refinando com um conjunto exato

 * refinining an ongoing search process with what you want to see, like "2 + 2 = 4", or "site.org" This is ideally the best use of regex, because it adds it as a single regexp term while refining a search, the limited number of pages the regexp must crawl is can be seen.

You can start out intending an exact string search, but keep in mind:


 * regex only search the wikitext not the rendered text, so there are some differences around the markup, and even the number of space characters must match precisely.
 * You are obligated to supply an accompanying filter.
 * You must learn how to escape regex metacharacters.

There are two ways to escape metacharacters. They are both useful at times, and sometimes concatenated side-by-side in the escaping of a string.


 * Backslash-escape one of them \char. The insource:/regexp/ uses slashes to delimit the regexp. Giving /reg/exp/ is ambiguous, so you must write /reg\/exp/.
 * Put a string of them in double quotes "string". Because escaping a character can't hurt, you can escape any character along with any possible metacharacters in there. Escaping with quotes is cleaner.
 * You can't mix methods, but you can concatenate them.

Double-quotes escaping using insource:/"regexp"/ is an easy way to search for many kinds of strings, but you can't backslash-escape anything inside a double-quoted escape.


 * instead of
 * is as good as
 * But  always.
 * And .  It finds the   literally, which is not the   you probably wanted.

Backslash-escape using insource:/regexp/ allows escaping the " and / delimiters, but requires taking into account metacharacters, and escaping any:


 * To match a  delimiter character use.
 * To match a  delimiter character use.
 * The escaped metacharacters would be.
 * The equivalent expression escaped with double-quotes is.

The simplest algorithm to create the basic string-finding expression using insource:/"regexp"/, need not take metacharacters into account except for the " and / characters:


 * 1) Write   out. (The /" delimiters "/ are not shown.)
 * 2) Replace   with   (previous double-quote: stop, concatenate, quote restart).
 * 3) Replace   with   (stop, concatenate, start).
 * 4) You get , showing concatenation of the two methods.

The square-bracket notation for creating your own character-class also escapes its metacharacters. To target a literal right square bracket in your character-class pattern, it must be backslash escaped, otherwise it can be interpreted as the closing delimiter of the character-class pattern definition. The first position of a character class will also escape the right square bracket. Inside the delimiting square brackets of a character class, the dash character also has special meaning (range) but it too can be included literally in the class the same way as the right square bracket can. For example both of these patterns target a character that is either a dash or a right square bracket or a dot:  or.

For general examples using metacharacters: There are some notable differences from standard regex metacharacters:
 * insource:"2+2=4" insource:/"2+2=4"/ matches "2 + 2 = 4", with zero spaces between the characters.
 * insource:"2 + 2 = 4" insource:/2 ?\+ ?2 ?= ?4\./ match with zero or one space in between. The equals = sign is not a metacharacter, but the plus + sign is.
 * insource:"[ [link|2\3?]]\" insource:/"[ [link|2\3?]]< "\/" tag>"/.


 * The  or   are not reserved for matching a newline.
 * The dot . metacharacter stands for any character including a newline, so .* matches across lines.
 * The number # sign means something, and must be escaped.
 * The ^ and $ are not needed. Like "grep" (global per line, regular expression, print each line), each insource:// is a "global per document, regular expression, search-results-list each document" per document.
 * support a multi-digit numeric range like [0-9] does, but without regard to the number of character positions, or the range in each position, so <9-10> works, and even <1-111> works.

Advanced example
For example, using metacharacters to find the usage of a template called Val having, inside the template call, an unnamed parameter containing a possibly signed, three to four digit number, possibly surrounded by space characters, AND on the same page, inside a template Val call, a named argument having any allowable spaces around it, (it could be the same template call, or a separate one):



Note that the = sign in "fmt commas" is not needed but that adding it would not change the search results. It is fast because it uses two filters so that every page the regexp crawls has the highest possible potential.

bounded
You can limit search to pages identified as being near some specified geographic coordinates. The coordinates can either be specified as a, pair, or by providing a page title from which to source the coordinates. A distance to limit the search to can be prepended if desired. Examples:


 * neartitle:"San Francisco"
 * neartitle:"100km,San Francisco"
 * nearcoord:37.77666667,-122.39
 * nearcoord:42km,37.77666667,-122.39

boosted
You can alternatively increase the score of pages within a specified geographic area. The syntax is the same as bounded search, but with boost- prepended to the keyword. This effectively doubles the score for pages within the search range, giving a better chance for nearby search results to be near the top.


 * boost-neartitle:"San Francisco"
 * boost-neartitle:"100km,San Francisco"
 * boost-nearcoord:37.77666667,-122.39
 * boost-nearcoord:42km,37.77666667,-122.39

File properties search
Since MediaWiki 1.28, CirrusSearch supports indexing and searching of properties of files in the  namespace. This includes:
 * file media type
 * MIME type
 * size
 * width & height
 * resolution
 * bit depth for files that support these

filetype
Searching for file type allows to retrieve files according to their classification, such as office documents, videos, raster images, vector images, etc. The following types currently exist:



This list may be extended in the future. See also  constants in.

The syntax of the search is: filetype:{type}. Example:

filetype:video - looks for all videos

The filetype search is not case-sensitive.

filemime
Matches file MIME type. The syntax is:

filemime:{MIMEtype} - look for files of this MIME type

The argument can be quoted to specify exact match. Without quotes, partial matches to components of MIME type will be accepted too.

Examples:

filemime:"image/png" - look for files with MIME type exactly

filemime:pdf - look for all PDF documents

The MIME type search is not case sensitive.

filesize
Search for file of given size, in kilobytes (kilobyte means 1024 bytes). The syntax is:

filesize:{number} or filesize:>{number} - file with size at least given number

filesize:<{number} - file with size no more than given number

filesize:{number},{number} - file with size between given numbers

Examples:

filesize:>20 or filesize:20 - files 20KB and bigger

filesize:<1024 - files smaller than 1MB

filesize:100,500 - files with sizes between 100KB and 500KB

File measures
It is possible to search for specific file measures: width, height, resolution (which is defined as square root of height × width), and bit depth. Not all files may have these properties. The syntax is:

{measure}:{number} - file with measure that equals to given number

{measure}:>{number} - file with measure that is at least given number

{measure}:<{number} - file with measure that is no more than given number

{measure}:{number},{number} - file with measure that is between given numbers

Where  can be:

filew or filewidth - file width

fileh or fileheight - file height

fileres - file resolution (see above)

filebits - file bit depth

Exemplos:

filew:>800 fileh:>600 - arquivos que têm pelo menos 800x600 pixels em tamanho

filebits:16 - arquivos com profundidade de cor em 16-bit

fileheight:100,500 - arquivo entre 100 e 500 pixels de altura

Resultados de busca entre wikis
A busca em projetos da Wikimedia inclui resultados de busca entre wikis melhorados (também conhecidos como resultados de busca interwiki, resultados de busca de projetos irmãos).

Ver também

 * Completion Suggester - a funcionalidade de busca incremental do CirrusSearch
 * Veja Search/Old para saber mais sobre o desenvolvimento e lançamento do CirrusSearch.
 * Veja Help:Searching para MWSearch, usado por várias wikis que não têm uma extensão de busca.
 * Veja Help:Searching para MWSearch, usado por várias wikis que não têm uma extensão de busca.

Links externos

 * From Lucene, documentação extremamente relevante.