Structured Data Across Wikimedia/Section Topics/id

Halaman ini menjelaskan proyek yang sedang berlangsung yaitu topik subjudul oleh tim Data Terstruktur Lintas Wikimedia.

Latar belakang
Proyek ini bertujuan untuk mengenali subjudul yang ada pada artikel dan membuat topik berdasarkan subjudul tersebut. Terdapat beberapa elemen yang mendukung proyek ini:
 * algoritme yang dapat mendeteksi butir Wikidata berdasarkan pranala dalam di bagian subjudul (akan dikerjakan bersama-sama dengan tim Data Terstruktur, Penelitian, Pemelajaran Mesin, dan Platform Data);
 * kemampuan untuk secara otomatis dalam mendeteksi subjudul pada artikel (akan dikerjakan bersama-sama dengan tim Data Terstruktur dan Platform Data).

Untuk poin terakhir akan dirancang di atas proyek saran untuk gambar yang akan dikerjakan bersama oleh tim Pemelajaran Mesin, Platform Data, Penelitian, Pencarian, dan Growth.

Terlepas dari otomatisasi yang akan diterapkan dari proyek ini, kami usahakan untuk tidak mengubah alur maupun memengaruhi kenyamanan pengguna dalam berkontribusi. Semua ini bersifat otomatis dan tidak akan mengganggu kontributor yang sekadar ingin menyunting artikel. Proyek ini masih dalam tahap pemeriksaan dan kami masih membutuhkan masukan dari kontributor.

Examples of potential section topics
The following are some examples of section topics extracted from Wikipedia articles, during a test run on English and Russian Wikipedias. Currently, we are working on a way to determine the most relevant topics for any given section, through a custom TF-IDF weight function.


 * Example 1 (English Wikipedia)
 *  Article:  Campbell Island, New Zealand
 *  Section:  History
 *  Example of section topics:  “World War II”, “Pinniped”, “Brig”, “Great Depression”, “Perseverance Harbour”


 * Example 2 (English Wikipedia)
 *  Article:  Dorothy E. Smith
 *  Section:  Biography
 *  Example of section topics:  “Toronto”, “University of British Columbia”, “London School of Economics”, “Vancouver”, “University of California, Berkeley”


 * Example 3 (English Wikipedia)
 *  Article:  Battle of Surabaya
 *  Section:  Background
 *  Example of section topics:  “Sukarno”, “Mohammad Hatta”, “Jakarta”, “Proclamation of Indonesian Independence”, “East Java”


 * Example 4 (English Wikipedia)
 *  Article:  Tour of Greece
 *  Section:  Past winners (note: the whole section is a table)
 *  Example of section topics : Names of tour’s winners, ordered by relevance score: “Ioannis Tamouridis”, “Valeriy Dmitriyev”, “Henri Manders”, “Thomas Liese”, “Assan Bazayev”, etc.


 * Example 5 (Russian Wikipedia)
 *  Article:  Адлон (отель)
 *  Section:  История
 *  Example of section topics : “Дитрих, Марлен”, “Вторая мировая война”, “Чаплин, Чарльз”, “Вильгельм II (император Германии)”, “Шинкель, Карл Фридрих”, “Первая мировая война”


 * Example 6 (Russian Wikipedia)
 *  Article:  Военная стратегия
 *  Section:  История
 *  Example of section topics:  “Сунь-цзы”, “Наполеон I”, “Первая мировая война”, “Искусство войны”, “Блицкриг”, “Александр Македонский”, “Вторая мировая война”

Further planned development
Based on the viability of those options, the project also aims at using section topics to improve our SEO reach with outside search engines, as a follow up to the experiment conducted in.