ORES

From MediaWiki.org
Jump to navigation Jump to search
This page is a translated version of the page ORES and the translation is 97% complete.

Other languages:
English • ‎español • ‎français • ‎italiano • ‎日本語 • ‎한국어 • ‎polski • ‎português do Brasil • ‎русский • ‎中文

O ORES (/ɔɹz/, Serviço Objetivo de Avaliação de Revisões) é um serviço web e API que fornece o aprendizado de máquina as a service para os projetos da Wikimedia mantido pela equipe de Plataforma de Pontuações. O sistema foi designado para ajudar a automatizar trabalhos nas wikis, como detecção e remoção de vandalismo. Atualmente, os dois tipos gerais de pontuações que o ORES gera são no contexto de “qualidade da edição” e “qualidade do artigo”.

O ORES é um serviço de back-end, e não possui uma maneira direta de usar as pontuações. Se você gostaria de usá-las, confira a nossa lista de ferramentas que usam pontuações do ORES. No caso do ORES ainda não estar disponível na sua wiki, veja as nossas instruções para solicitar suporte.

Tem dúvidas sobre o ORES? Confira as perguntas frequentes.

Qualidade da edição

Fluxo de qualidade de edições com o ORES. Diagrama descritivo de edições partindo da internet à Wikipédia retrata a qualidade “desconhecida” de edições antes do ORES e as qualidades “boa”, “precisa de revisão” e “prejudicial” possíveis após sua disponibilização.

Uma das questões mais críticas sobre os projetos abertos da Wikimedia é a revisão de contribuições (“edições”) potencialmente prejudiciais. Há também a necessidade de identificar contribuidores de boa-fé (os quais podem estar causando danos sem saberem) e oferecê-los ajuda. Estes modelos pretendem facilitar o trabalho no feed das mudanças recentes. Oferecemos dois níveis de ajuda pra os modelos de previsão: básico e avançado.

Suporte básico

Assumindo que as edições mais prejudiciais serão revertidas e que as menos prejudiciais não serão revertidas, podemos usar o histórico de edições (e reversões) de uma wiki. Esse modelo é fácil de ser configurado, porém sofre do problema de várias edições serem revertidas por razões além de vandalismo. Para consertar isso, criamos um modelo baseado em palavras evitáveisORES/BWDS review.

  • reverted – prevê se uma edição será eventualmente revertida

Suporte avançado

Em vez de assumir, podemos pedir que os editores treinem o ORES sobre quais edições são, de fato, prejudiciais, e quais parecem ter sido feitas em boa-fé. Isso requer trabalho adicional da parte dos voluntários, mas resulta numa previsão mais precisa e matizada em assunto de qualidade. Várias ferramentas somente funcionarão se o suporte avançado estiver disponível para a wiki alvo.

  • damaging – prevê se uma edição causa danos
  • goodfaith – prevê se uma edição foi salva em boa-fé


Qualidade do artigo

Tabela de avaliação da Wikipédia inglesa. Captura de tela da tabela de avaliação da Wikipédia inglesa gerada pelo robô WP 1.0.

A qualidade dos artigos da enciclopédia é uma questão principal para os usuários. Novas páginas devem ser revisadas para garantir que spam, vandalismo e ataques não estejam presentes na wiki. Para artigos “sobreviventes” da primeira revisão, alguns wikipedistas avaliam periodicamente a qualidade dos artigos; porém, isso constitui um trabalho muito intenso, e na maioria das vezes as avaliações estão desatualizadas.

Suporte à revisão

Quanto mais rápido esboços problemáticos forem removidos, melhor. Revisar novas páginas pode ser um trabalho árduo. Assim como no problema de lutar contra vandalismo nas edições, as previsões por máquina podem ajudar revisores a enfocar nas páginas mais problemáticas primeiro. Com base em comentários de administradores sobre a remoção de páginas (veja a tabela de registro), podemos treinar um modelo para prever quais páginas precisarão de remoção rápida. Veja WP:ER para uma lista de motivos para eliminação rápida na Wikipédia lusófona. Já no modelo inglês, foram usados os critérios G3, G10 e G11 (vandalismo, ataque e spam, respectivamente).

  • draftquality – prevê se o artigo deverá sofrer eliminação rápida (spam, vandalismo, ataque…)

Suporte à escala de avaliação

Para artigos “sobreviventes” da primeira revisão, algumas das maiores wikis avaliam periodicamente a qualidade dos artigos, usando uma escala que mais ou menos corresponde à escala de avaliação da Wikipédia 1.0 (wp10). Ter ambas as avaliações será útil, pelo fato de elas nos ajudar a calibrar nosso progresso e identificar oportunidades perdidas (como artigos populares que estejam em baixa qualidade). No entanto, manter essas avaliações atualizadas é desafiador. É aí que o modelo de aprendizado de máquina da wp10 entra. Treinando um modelo para replicar as avaliações à qualidade dos artigos que humanos realizam, conseguimos avaliar automaticamente todos os artigos e todas as revisões com um computador.

The wp10 model bases its predictions on structural characteristics of the article. E.g. How many sections are there? Is there an infobox? How many references? And do the references use a {{cite}} template? The wp10 model doesn't evaluate the quality of the writing or whether or not there's a tone problem (e.g. a point of view being pushed). However, many of the structural characteristics of articles seem to correlate strongly with good writing and tone, so the models work very well in practice.

  • wp10 – prevê a classe de avaliação de um artigo ou esboço

Compatibilidade

A seguinte tabela relata o estado de compatibilidade do ORES por wiki e modelo disponível. Caso não veja sua wiki listada ou compatibilidade para o modelo desejado, é possível solicitá-la.

A tabela de compatibilidade do ORES apresenta campanhas em curso (In progress) e concluídas (Done). Se você desejar uma nova campanha, visite a página de suporte.

context edit quality article quality
reverted damaging goodfaith wp10 draftquality
arwiki Arabic Wikipedia Yes check.svg In progress In progress
bnwiki Bengali Wikipedia Yes check.svg
bswiki Bosnian Wikipedia In progress
cawiki Catalan Wikipedia In progress In progress In progress
cswiki Czech Wikipedia Yes check.svg Yes check.svg Yes check.svg
dewiki German Wikipedia Yes check.svg In progress In progress
elwiki Greek Wikipedia Yes check.svg
enwiki English Wikipedia Yes check.svg Yes check.svg Yes check.svg Yes check.svg Yes check.svg
enwiktionary English Wiktionary Yes check.svg
eswiki Spanish Wikipedia Yes check.svg Yes check.svg Yes check.svg
eswikibooks Spanish Wikibooks Yes check.svg Yes check.svg Yes check.svg
etwiki Estonian Wikipedia Yes check.svg Yes check.svg Yes check.svg
fawiki Persian Wikipedia Yes check.svg Yes check.svg Yes check.svg
fiwiki Finnish Wikipedia Yes check.svg Yes check.svg Yes check.svg
frwiki French Wikipedia Yes check.svg Yes check.svg Yes check.svg Yes check.svg
hewiki Hebrew Wikipedia Yes check.svg Yes check.svg Yes check.svg
hrwiki Croatian Wikipedia In-progress
huwiki Hungarian Wikipedia Yes check.svg In progress In progress
idwiki Indonesian Wikipedia Yes check.svg In progress In progress
itwiki Italian Wikipedia Yes check.svg In progress In progress
kowiki Korean Wikipedia Yes check.svg In progress In progress
lvwiki Latvian Wikipedia In progress
nlwiki Dutch Wikipedia Yes check.svg Yes check.svg Yes check.svg
nowiki Norwegian Wikipedia Yes check.svg In progress In progress
plwiki Polish Wikipedia Yes check.svg Yes check.svg Yes check.svg
ptwiki Portuguese Wikipedia Yes check.svg Yes check.svg Yes check.svg
rowiki Romanian Wikipedia Yes check.svg Yes check.svg Yes check.svg
ruwiki Russian Wikipedia Yes check.svg Yes check.svg Yes check.svg Yes check.svg
svwiki Swedish Wikipedia Yes check.svg Yes check.svg Yes check.svg
sqwiki Albanian Wikipedia Yes check.svg Yes check.svg Yes check.svg
tawiki Tamil Wikipedia Yes check.svg
trwiki Turkish Wikipedia Yes check.svg Yes check.svg Yes check.svg Yes check.svg
ukwiki Ukrainian Wikipedia Yes check.svg In progress In progress
urwiki Urdu Wikipedia In progress In progress In progress
viwiki Vietnamese Wikipedia Yes check.svg In progress In progress
wikidatawiki Wikidata Yes check.svg Yes check.svg Yes check.svg Yes check.svg


Uso da API

O ORES oferece um serviço de API REST para recuperar informações de pontuação de revisões dinamicamente. Veja https://ores.wikimedia.org para mais informações sobre como usar a API.

Se estiver consultando pelo serviço um grande número de revisões, é aconselhável fazer batch de 50 revisões para cada solicitação, como descrito abaixo. É aceitável usar até 4 solicitações paralelas. Para números maiores de consultas, execute o ORES localmente.

Consulta de exemplo: http://ores.wmflabs.org/v3/scores/enwiki/?models=draftquality|wp10&revids=34854345|485104318


Consulta de exemplo: https://ores.wikimedia.org/v3/scores/wikidatawiki/421063984/damaging

Local usage

To run ORES locally you can install ORES by

pip install ores # needs to be python3, incompatible with python2

Then you should be able to run it through

echo -e '{"rev_id": 456789}\n{"rev_id": 3242342}' | ores score_revisions https://ores.wikimedia.org enwiki damaging

You should see output of