Structured Data Across Wikimedia/pt

Dados Estruturados na Wikimedia (DEW) é um projeto que nos ajudará a estruturar conteúdo em páginas de wikitexto de uma maneira que ele seja reconhecível e relacionável por máquina, de maneira a tornar a leitura, edição e pesquisa mais fáceis e acessíveis entre projetos e na internet.

Eles vão ajudar os usuários a associarem o conteúdo entre os projetos da Wikimedia, os leitores a mergulharem mais fundo no ecossistema de conhecimento da Wikimedia; e a quem contribui a disseminar informações entre projetos e além deles de maneira semelhante à Wikidata. O DEW também fornecerá um local para experimentação com ferramentas de edição assistida por computador, para tornar a edição mais fácil e acessível a mais wikimedistas em todo o mundo.

Antecedentes
Esse projeto é a continuidade de um desenvolvimento semelhante que foi concluído no Commons, como parte da concessão anterior de Dados Estruturados no Commons (DEC); e será parcialmente financiado por uma bolsa de três anos da Sloan Foundation. O trabalho no DEC nos conscientizou da necessidade de metadados mais avançados para todo o conteúdo e APIs (Interfaces de Programação de Aplicações) para fornecer melhores resultados de pesquisa, o que tornaria o conteúdo mais acessível, detectável, traduzível e utilizável para outros fins.

O projeto tem três objetivos fundamentais:
 * 1) Permitir que as máquinas reconheçam o conteúdo da Wikimedia e façam sugestões relacionadas com outros conteúdos da plataforma. Estamos explorando isso primeiro através do projeto de recomendação de imagens.
 * 2) Desenvolver uma maneira de estruturar artigos e páginas para permitir novos formatos de conteúdo – como conteúdo apresentado em doses menores e de fácil digestão, mais acessível para leitores usarem e compartilharem.
 * 3)  Oferecer aos usuários da Wikimedia uma maneira mais convidativa e eficiente de pesquisar e encontrar conteúdo , aproveitando o MediaSearch e explorando novas maneiras de melhorar a pesquisa nas Wikipédias, usando dados estruturados.

O que está mudando
O objetivo do projeto é planejar e prototipar um novo sistema que visa ser flexível o suficiente para atender a todos os tipos de metadados que possamos precisar suportar em um futuro próximo.

We identified three main projects that we will develop, as part of our work:
 * 1) Image suggestion, a feature for experienced users to help illustrate Wikipedia articles;
 * 2) Sectional metadata, also known as Section topics, in order to describe what a section of a Wikipedia article is about;
 * 3) Search experimentations, that will use structured content to give users a more inviting and efficient way to search and find content on the Wikipedias.

Image suggestion
The Image Suggestion UI aims at developing systems for structured data across all Wikimedia projects.

This work will build on the work already begun as part of the “Add an image” structured task project. However, its focus will be shifted towards improving the processes for experienced contributors. In particular, we will target users who have edited or watched a particular article or set of articles, since they are likely to be experts in the topic and to have interest in seeing that article(s) improve.

Section topics
The Section Topics project will identify sections in an article and create topics accordingly for those sections, drawing on several elements:
 * an algorithm that detects Wikidata items based on the section’s blue links (which will be developed in partnership with the Structured Data, Research, Machine Learning, and Data Platform teams);
 * the ability to automatically identify sections in an article (which will be developed in partnership with the Structured Data and Data Platform teams);
 * section-level image suggestions, which will use the blue-links algorithm and section identification infrastructure above, and be delivered both via the newcomer experience and via notifications for experienced contributors.

This last point will build upon the prior image suggestions work and will be developed in partnership with the Structured Data, Machine Learning, Data Platform, Research, Search, and Growth teams.

These elements will not change, nor impact the current editing experience for users. All these activities will be automatic and will not depend on any action from users who edit an article. Currently, this project is still in the investigating phase, and there are still aspects that may require further investigation and/or feedback from users.

Based on the viability of those options, the project also aims at:
 * using section topics to improve our SEO reach with outside search engines (in partnership with the Web team)
 * establishing partnerships with the larger Wikimedia community to show the impact of our new tools (in partnership with the Structured Data, Growth, and Community Programs (GLAM/Campaigns) teams).

Search experimentation
The Search Experimentation project will use structured content to give users a more inviting and more efficient way to search and find content on the Wikipedias.

We aim to identify and define incremental “special search” improvements that use structured content, to assist users in finding the content they are looking for, especially in those language wikis that have fewer articles.

Also this project is currently still in the investigating phase, and there are still aspects that may require further investigation and/or feedback from users.

O que nós não queremos fazer?

 * 1) Deixar os usuários de fora do processo
 * 2) Sobrecarregar os usuários com muito conteúdo novo para moderar
 * 3) Adicionar qualquer viés/preconceito adicional aos projetos da Wikimedia
 * 4) Acrescentar vetores adicionais para vandalismo
 * 5) Introduzir muita complexidade em nossos sistemas

2022

 * Project pages updated to reflect the new current status of the initiative and the three main projects to be developed.

2022

 * Establishing contact with Portuguese and Russian Wikipedia community as first tester communities for Image Suggestions.

2021

 * O projeto está passando para um primeiro estágio de teste, que experimenta o uso de notificações para alertar os usuários sobre possíveis imagens úteis para artigos da Wikipédia.

Maio-Agosto 2021

 * Em busca de feedback sobre o Projeto de Recomendação de Imagem, por meio de convites individuais e um RfC de um mês especificamente direcionado a 4 Wikipédias + Commons

2021

 * Procurando feedback sobre essas ideias.
 * Trabalhando em wireframes e maquetes para ajudar a explorar essas ideias.
 * Explorando a infraestrutura para apoiar este trabalho por meio do processo do Fórum de Tomada de Decisões Técnicas. Consulte a tarefa.

Segundo semestre de 2020

 * Construindo o MediaSearch no Commons.
 * Teste A/B MediaSearch - realizado entre 10 e 17 de setembro de 2020.

Comentários
Os feedbacks, comentários e opiniões sobre o projeto são e sempre serão bem-vindos. Estamos especialmente interessados ​​em suas ideias sobre até que ponto você deseja manter o “humano-no-circuito” durante todo o processo de criação de metadados tópicos. Estamos ansiosos para ouvir de você sobre as seguintes perguntas em aberto:
 * 1) Suas expectativas sobre o projeto
 * 2) O que os usuários esperam deste projeto? Quais são as ações necessárias a serem abordadas?
 * 3) Como você imagina que esses metadados sejam usados? Você pode pensar em maneiras de ajudar em seus fluxos de trabalho?
 * 4) Moderação de metadados
 * 5) A moderação é necessária para evitar vandalismo e/ou viés/preconceito?
 * 6) Se a moderação for necessária, como ela pode ser gerenciada de forma eficaz?
 * 7) Adicionando e confirmando metadados
 * 8) Os usuários desejam aprovar ou rejeitar metadados sugeridos pelo sistema automatizado?
 * 9) Os usuários desejam adicionar metadados adicionais além do sugerido pelo sistema automatizado?
 * 10) Você acha que pode ser suficiente para os usuários terem a oportunidade de enviar feedback com sugestões sobre como melhorar os metadados gerados por máquina, quando necessário?
 * 11) Privilégios para visualização e edição
 * 12) Queremos que os metadados sejam visíveis para todos os usuários ou apenas para determinadas classes de usuários?
 * 13) Queremos que os metadados sejam editáveis ​​para todos os usuários ou apenas para determinadas classes de usuários?

Além disso, comentários mais específicos sobre projetos relacionados geralmente podem ser deixados nas páginas de discussão dos projetos:
 * MediaSearch no Commons
 * Recomendações de Imagem

Financiamento
O financiamento parcial para este trabalho é fornecido por uma da Alfred P. Sloan Foundation, afim de promover o trabalho realizado pela primeira rodada de financiamento para desenvolver Dados Estruturados em Commons.