ORES/id

ORES (/ɔɹz/) adalah layanan web dan API yang menyediakan pembelajaran mesin sebagai layanan untuk proyek-proyek Wikimedia yang dikelola oleh tim Scoring Platform. Sistem ini dirancang untuk membantu mengotomatisasi kerja pada wiki – contohnya, deteksi dan penghapusan vandalisme. Saat ini, dua tipe umum skor yang dikeluarkan oleh ORES adalah dalam "kualitas penyuntingan" dan "kualitas artikel."

ORES merupakan sebuah layanan sisi belakang dan tidak secara langsung menyediakan cara untuk menggunakan skor. Jika Anda ingin menggunakan skor ORES, periksa daftar perkakas yang menggunakan skor ORES. Jika ORES belum mendukung wiki Anda, lihatlah instruksi untuk meminta dukungan.

Sedang mencari jawaban untuk pertanyaan Anda mengenai ORES? Lihatlah FAQ ORES.

Kualitas suntingan
Salah satu masalah kritis tentang proyek terbuka Wikimedia adalah peninjauan kontribusi ("suntingan") yang berpotensi merusak. Juga harus ada cara mengenali kontributor yang berniat baik (yang mungkin tidak sengaja membuat kerusakan) dan memberikan mereka dukungan. Model-model ini dimaksudkan agar pekerjaan menyaring umpan Special:RecentChanges lebih mudah. Kami menawarkan dua tingkat dukungan untuk model prediksi kualitas suntingan: dasar dan lanjutan.

Dukungan dasar
Dengan mengasumsikan bahwa suntingan yang paling merusak akan dibalikkan dan suntingan yang tidak merusak tidak akan di=, kami bisa membangun dengan menggunakan riwayat suntingan (dan suntingan yang dibalikkan) dari suatu wiki. Model ini mudah dibuat, tetapi menghadapi masalah ada banyak suntingan yang dibalikkan untuk alasan selain kerusakan dan vandalisme. Untuk membantu itu, kami membuat model berdasarkan kata-kata buruk.


 * – memprediksi apakah hasil suntingan harus dibalikkan

Dukungan lanjutan
Bukannya berasumsi, kami bisa meminta penyunting untuk melatih ORES mengenali suntingan mana yang memang  dan suntingan mana yang kelihatannya disimpan dengan. Ini memerlukan usaha lebih dari pihak sukarelawan dalam komunitas, tetapi ini menyediakan prediksi yang lebih akurat dan detail mengenai kualitas suatu suntingan. Ada banyak perkakas yang hanya berkerja ketika dukungan lanjutan tersedia di wiki target.


 * – memprediksi apakah suntingan menyebabkan kerusakan
 * – memprediksi apakah suntingan disimpan dengan niat baik

Kualitas artikel
The quality of Wikipedia articles is a core concern for Wikipedians. New pages must be reviewed and curated to ensure that spam, vandalism, and attack articles do not remain in the wiki. For articles that survive the initial curation, some of the Wikipedians periodically evaluate the quality of articles, but this is highly labor intensive and the assessments are often out of date.

Curation support
The faster that seriously problematic types of draft articles are removed, the better. Curating new page creations can be a lot of work. Like the problem of counter-vandalism in edits, machine predictions can help curators focus on the most problematic new pages first. Based on comments left by admins when they delete pages (see the logging table), we can train a model to predict which pages will need quick deletion. See en:WP:CSD for a list of quick deletion reasons for English Wikipedia. For the English model, we used G3 "vandalism", G10 "attack", and G11 "spam".


 * – predicts if the article will need to be speedy deleted (spam, vandalism, attack, or OK)

Assessment scale support
For articles that survive the initial curation, some of the large Wikipedias periodically evaluate the quality of articles using a scale that roughly corresponds to the English Wikipedia 1.0 assessment rating scale ("articlequality"). Having these assessments is very useful because it helps us gauge our progress and identify missed opportunities (e.g., popular articles that are low quality). However, keeping these assessments up to date is challenging, so coverage is inconsistent. This is where the  machine learning model comes in handy. By training a model to replicate the article quality assessments that humans perform, we can automatically assess every article and every revision with a computer. This model has been used to help WikiProjects triage re-assessment work and to explore the editing dynamics that lead to article quality improvements.

The articlequality model bases its predictions on structural characteristics of the article. E.g. How many sections are there? Is there an infobox? How many references? And do the references use a cite template? The articlequality model doesn't evaluate the quality of the writing or whether or not there's a tone problem (e.g. a point of view being pushed). However, many of the structural characteristics of articles seem to correlate strongly with good writing and tone, so the models work very well in practice.


 * – predicts the (Wikipedia 1.0-like) assessment class of an article or draft

Perutean topik


Model topik artikel ORES menerapkan sebuah taksonomi atas-bawah yang intuitif kepada semua artikel di Wikipedia -- draf artikel baru sekali pun. Perutean topik ini berguna untuk mengkurasi artikel baru, membangun daftar pekerjaan, membentuk WikiProjects baru, dan menganalisis kesenjangan cakupan.

Model topik ORES dilatih menggunakan pembenaman kata dari konten yang sebenarnya. Untuk setiap bahasa, sebuah pembenaman bahasa tertentu dipelajari dan diterapkan secara lokal. Karena strategi pemodelan ini bergantung pada topik artikel, prediksi topik bisa berbeda dalam bahasa yang berbeda tergantung topik yang ada di teks artikel.

Dukungan kurasi


Kesulitan terbesar dalam meninjau artikel baru adalah menemukan seseorang yang memahami subjek untuk menilai kelayakan, relevansi, dan akurasinya. Model  kami dirancang untuk merutekan artikel yang baru dibuat berdasarkan topik mereka ke peninjau yang berminat. Model ini dilatih dan diuji dengan revisi pertama artikel dan oleh karena itu cocok digunakan di draf artikel baru.


 * – memprediksi topik dari sebuah draf artikel baru

Pemetaan peminatan topik


Keterkaitan topik artikel merupakan konsep yang penting bagi organisasi karya di Wikipedia. Kelompok kerja bertopik menjadi strategi yang umum untuk mengelola produksi dan patroli konten di Wikipedia. Namun hierarki tingkat tinggi tidak tersedia atau dapat dikuerikan oleh karena beberapa alasan. Akibatnya semua orang yang ingin mengorganisasi di sekitar suatu topik atau membuat daftar kerja harus melakukan pekerjaan manual yang banyak untuk mengenali artikel yang relevan. Dengan model  kami, kueri-kueri ini bisa dilakukan secara otomatis.


 * – memprediksi topik dari sebuah artikel

Tabel dukungan
Tabel dukungan ORES melaporkan status dukungan ORES menurut wiki dan model yang tersedia. Jika Anda tidak melihat wiki Anda di daftar, atau dukungan untuk model yang Anda ingin gunakan, Anda bisa meminta dukungan.

Penggunaan API
ORES menawarkan sebuah layanan API Restful untuk mengambil secara dinamis informasi skor tentang revisi. Lihat https://ores.wikimedia.org untuk informasi lebih lanjut mengenai cara menggunakan API.

Jika Anda mengkueri layanan tentang banyak revisi, disarankan untuk tidak menumpukkan lebih dari 50 revisi dalam satu permintaan sebagaimana yang dijelaskan di bawah. Diperbolehkan menggunakan maksimal 4 permintaan secara paralel. Tolong jangan lebihi batas ini atau ORES bisa menjadi tidak stabil. Untuk kueri yang lebih banyak lagi, Anda bisa menjalankan ORES secara lokal.

Contoh kueri: |wp10&revids=34854345|485104318 http://ores.wmflabs.org/v3/scores/enwiki/?modelsdraftquality|wp10&revids34854345|485104318

Contoh kueri: https://ores.wikimedia.org/v3/scores/wikidatawiki/421063984/damaging

Penggunaan EventStream
Skor ORES juga disediakan sebagai sebuah EventStream di https://stream.wikimedia.org/v2/stream/revision-score

Penggunaan lokal
Untuk menjalankan ORES secara lokal, Anda dapat memasang ORES dengan:

Kemudian Anda dapat menjalankannya dengan:

Anda seharusnya melihat keluaran