Structured Data Across Wikimedia/Section Topics/pt

Esta página descreve o trabalho em andamento para projetar e construir recursos para identificar 'tópicos de seção em um artigo da Wikipédia, atualmente em desenvolvimento pela equipe Dados Estruturados na Wikimedia.

Contexto
O projeto Tópicos de Seção identificará seções em um artigo e criará tópicos de acordo com essas seções, baseando-se em vários elementos, como por exemplo:
 * um algoritmo que detecta itens do Wikidata com base nos links azuis da seção (que será desenvolvido em parceria com as equipes de Dados Estruturados, Pesquisa e Plataforma de Dados);
 * a capacidade de identificar automaticamente seções em um artigo (que será desenvolvido em parceria com as equipes de Dados Estruturados e Plataforma de Dados).

Um dos primeiros casos de uso que previmos para os tópicos de seção será a sugestão de imagens em nível de seção, que utilizará o algoritmo dos links azuis e a infraestrutura de identificação de seção acima, e será entregue tanto através da experiência de recém-chegados quanto através de notificações para colaboradores experientes. Isto se baseará no trabalho feito com sugestões de imagens e será desenvolvido em parceria com as equipes de Dados Estruturados, Plataforma de Dados, Pesquisa, Busca, Android, e Crescimento.

Esses elementos não serão alterados nem afetarão a experiência de edição atual dos usuários. Todas essas atividades serão automáticas e não dependerão de nenhuma ação dos editores. Atualmente, este projeto ainda está em fase de investigação, e ainda existem aspectos que podem exigir mais investigação e/ou feedback dos usuários.

Exemplo de potenciais tópicos de seção
The following are some examples of section topics extracted from Wikipedia articles, during a test run on English and Russian Wikipedias. Currently, we are working on a way to determine the most relevant topics for any given section, through a custom TF-IDF weight function.


 * Example 1 (English Wikipedia)
 *  Article:  Campbell Island, New Zealand
 *  Section:  History
 *  Example of section topics:  “World War II”, “Pinniped”, “Brig”, “Great Depression”, “Perseverance Harbour”


 * Example 2 (English Wikipedia)
 *  Article:  Dorothy E. Smith
 *  Section:  Biography
 *  Example of section topics:  “Toronto”, “University of British Columbia”, “London School of Economics”, “Vancouver”, “University of California, Berkeley”


 * Example 3 (English Wikipedia)
 *  Article:  Battle of Surabaya
 *  Section:  Background
 *  Example of section topics:  “Sukarno”, “Mohammad Hatta”, “Jakarta”, “Proclamation of Indonesian Independence”, “East Java”


 * Example 4 (English Wikipedia)
 *  Article:  Tour of Greece
 *  Section:  Past winners (note: the whole section is a table)
 *  Example of section topics : Names of tour’s winners, ordered by relevance score: “Ioannis Tamouridis”, “Valeriy Dmitriyev”, “Henri Manders”, “Thomas Liese”, “Assan Bazayev”, etc.


 * Example 5 (Russian Wikipedia)
 *  Article:  Адлон (отель)
 *  Section:  История
 *  Example of section topics : “Дитрих, Марлен”, “Вторая мировая война”, “Чаплин, Чарльз”, “Вильгельм II (император Германии)”, “Шинкель, Карл Фридрих”, “Первая мировая война”


 * Example 6 (Russian Wikipedia)
 *  Article:  Военная стратегия
 *  Section:  История
 *  Example of section topics:  “Сунь-цзы”, “Наполеон I”, “Первая мировая война”, “Искусство войны”, “Блицкриг”, “Александр Македонский”, “Вторая мировая война”

Further planned development
Based on the viability of those options, the project also aims at using section topics to improve our SEO reach with outside search engines, as a follow up to the experiment conducted in.