Structured Data Across Wikimedia/pt

Dados Estruturados na Wikimedia (DEW) é um projeto que nos ajudará a estruturar conteúdo em páginas de wikitexto de uma maneira que ele seja reconhecível e relacionável por máquina, de maneira a tornar a leitura, edição e pesquisa mais fáceis e acessíveis entre projetos e na internet.

Eles vão ajudar os usuários a associarem o conteúdo entre os projetos da Wikimedia, os leitores a mergulharem mais fundo no ecossistema de conhecimento da Wikimedia; e a quem contribui a disseminar informações entre projetos e além deles de maneira semelhante à Wikidata. O DEW também fornecerá um local para experimentação com ferramentas de edição assistida por computador, para tornar a edição mais fácil e acessível a mais wikimedistas em todo o mundo.

Antecedentes
Esse projeto é a continuidade de um desenvolvimento semelhante que foi concluído no Commons, como parte da concessão anterior de Dados Estruturados no Commons (DEC); e será parcialmente financiado por uma bolsa de três anos da Sloan Foundation. O trabalho no DEC nos conscientizou da necessidade de metadados mais avançados para todo o conteúdo e APIs (Interfaces de Programação de Aplicações) para fornecer melhores resultados de pesquisa, o que tornaria o conteúdo mais acessível, detectável, traduzível e utilizável para outros fins. Work on SDC made us aware of the need for more advanced metadata for all content and APIs to provide better search results, which would make in turn content more accessible, discoverable, translatable and usable for other needs.

O projeto tem três objetivos fundamentais:


 * 1) Permitir que as máquinas reconheçam o conteúdo da Wikimedia e façam sugestões relacionadas com outros conteúdos da plataforma. Estamos explorando isso primeiro através do projeto sugestão de imagem.
 * 2) Desenvolver uma maneira de estruturar artigos e páginas para permitir novos formatos de conteúdo – como conteúdo apresentado em doses menores e de fácil digestão, mais acessível para leitores usarem e compartilharem.
 * 3)  Oferecer aos usuários da Wikimedia uma maneira mais convidativa e eficiente de pesquisar e encontrar conteúdo , aproveitando o MediaSearch e explorando novas maneiras de melhorar a pesquisa nas Wikipédias, usando dados estruturados.

O que está mudando
O objetivo do projeto é planejar e prototipar um novo sistema que visa ser flexível o suficiente para atender a todos os tipos de metadados que possamos precisar suportar em um futuro próximo.

Identificamos três projetos principais que vamos desenvolver, como parte do nosso trabalho:
 * 1) Sugestão de Imagem, um recurso para usuários experientes para ajudar a ilustrar artigos da Wikipédia;
 * 2) Metadados de Seção, também conhecidos como Tópicos de Seção, para descrever do que se trata uma seção de um artigo da Wikipédia;
 * 3) O projeto Aprimoramento de Pesquisa, que usarão conteúdo estruturado para dar aos usuários uma maneira mais convidativa e eficiente de pesquisar e encontrar conteúdo nas Wikipédias.

Sugestão de Imagem
A UI Sugestão de Imagem visa desenvolver sistemas para dados estruturados ao longo de todos os projetos da Wikimedia.

Este trabalho se baseará no trabalho já iniciado como parte do projeto de tarefa estruturada “Adicionar uma Imagem”. No entanto, seu foco será deslocado para melhorar os processos para colaboradores experientes. Em particular, segmentaremos usuários que editaram ou assistiram a um determinado artigo ou conjunto de artigos, pois provavelmente serão especialistas no tópico e terão interesse em ver o(s) artigo(s) melhorar. However, its focus will be shifted towards improving the processes for experienced contributors. In particular, we will target users who have edited or watched a particular article or set of articles, since they are likely to be experts in the topic and to have interest in seeing that article(s) improve.

Metadados de Seção
O projeto Tópicos de Seção identificará seções em um artigo e criará tópicos de acordo com essas seções, baseando-se em vários elementos, como por exemplo:


 * um algoritmo que detecta itens do Wikidata com base nos links azuis da seção (que será desenvolvido em parceria com as equipes de Dados Estruturados, Pesquisa e Plataforma de Dados);
 * a capacidade de identificar automaticamente seções em um artigo (que será desenvolvido em parceria com as equipes de Dados Estruturados e Plataforma de Dados).

Um dos primeiros casos de uso que previmos para os tópicos de seção será a sugestão de imagens em nível de seção, que utilizará o algoritmo dos links azuis e a infraestrutura de identificação de seção acima, e será entregue tanto através da experiência de recém-chegados quanto através de notificações para colaboradores experientes. Isto se baseará no trabalho feito com sugestões de imagens e será desenvolvido em parceria com as equipes de Dados Estruturados, Plataforma de Dados, Pesquisa, Busca, Android, e Crescimento. This will build upon the work done on image suggestions and will be developed in partnership with the Structured Data, Data Platform, Research, Search, Android, and Growth teams.

Esses elementos não serão alterados nem afetarão a experiência de edição atual dos usuários. Todas essas atividades serão automáticas e não dependerão de nenhuma ação dos editores. Atualmente, este projeto ainda está em fase de investigação, e ainda existem aspectos que podem exigir mais investigação e/ou feedback dos usuários. All these activities will be automatic and will not depend on any action from editors. Currently, this project is in its development phase, and there are still aspects that may require further investigation and/or feedback from users.

Aprimoramento de pesquisa
O projeto "Aprimoramento de Pesquisa" usará conteúdo estruturado para oferecer aos usuários uma maneira mais convidativa e eficiente de pesquisar e encontrar conteúdo nas Wikipédias. By improving Special:Search, we want to enable users to find the information they are looking for, or that they may not have noticed, or previously come across through existing search.

Nosso objetivo é identificar e definir melhorias incrementais de “pesquisa especial” que usam conteúdo estruturado, para ajudar os usuários a encontrar o conteúdo que procuram, especialmente nas wikis de idiomas que possuem menos artigos.

O que não queremos fazer?

 * 1) Deixar os usuários de fora do processo
 * 2) Sobrecarregar os usuários com muito conteúdo novo para moderar
 * 3) Adicionar qualquer viés/preconceito adicional aos projetos da Wikimedia
 * 4) Acrescentar vetores adicionais para vandalismo
 * 5) Introduzir muita complexidade em nossos sistemas

2022

 * A primeira rodada dos testes do Sugestão de Imagens na Wikipédia em português, russo e indonésio foi concluída com sucesso.
 * Páginas do projeto atualizadas para refletir o novo status atual da iniciativa.

2022

 * O relatório de segundo relatório anual para Dados Estruturados em toda a Wikimedia foi publicado.
 * O DPLA recebeu financiamento dos Dados Estruturados na Wikimedia para impulsionar a reutilização das imagens descritas e atribuídas. Você pode ler mais sobre isso no anúncio do projeto DPLA 2022 DEW.
 * É lançada uma consulta geral sobre Aprimoramento de pesquisa.

2022

 * Páginas do projeto atualizadas para refletir o novo status atual da iniciativa e os três principais projetos a serem desenvolvidos.
 * A Wikipédia indonésia entra como a terceira comunidade de testadores.

2022

 * Estabelecendo contato com a comunidade da Wikipédia em português e russo como as primeiras comunidades de testadores para Sugestão de Imagem.

2021

 * O projeto está passando para um primeiro estágio de teste, que experimenta o uso de notificações para alertar os usuários sobre imagens úteis em potencial para artigos da Wikipédia.

Maio-Agosto 2021

 * Procurando feedback sobre o projeto de Sugestão de Imagem, através de convites individuais e um mês de RfC especificamente direcionado a 4 Wikipedias + Commons

2021

 * Procurando feedback sobre essas ideias.
 * Trabalhando em wireframes e maquetes para ajudar a explorar essas ideias.
 * Explorando a infraestrutura para apoiar este trabalho por meio do processo do Fórum de Tomada de Decisões Técnicas. Consulte a tarefa.

Segundo semestre de 2020

 * Construindo o MediaSearch no Commons.
 * Teste A/B MediaSearch - realizado entre 10 e 17 de setembro de 2020.

Comentários
Os feedbacks, comentários e opiniões sobre o projeto são e sempre serão bem-vindos. Estamos especialmente interessados ​​em suas ideias sobre até que ponto você deseja manter o “humano-no-circuito” durante todo o processo de criação de metadados tópicos. Estamos ansiosos para ouvir de você sobre as seguintes perguntas em aberto: We are especially interested in your ideas about the extent to which you want to keep the “human-in-the-loop” throughout the topical metadata creation process. We are looking forward to hearing from you about the following open questions:


 * 1) Suas expectativas sobre o projeto
 * 2) O que os usuários esperam deste projeto? Quais são as ações necessárias a serem abordadas?
 * 3) Como você imagina que esses metadados sejam usados? Você pode pensar em maneiras de ajudar em seus fluxos de trabalho?
 * 4) Moderação de metadados
 * 5) A moderação é necessária para evitar vandalismo e/ou viés/preconceito?
 * 6) Se a moderação for necessária, como ela pode ser gerenciada de forma eficaz?
 * 7) Adicionando e confirmando metadados
 * 8) Os usuários desejam aprovar ou rejeitar metadados sugeridos pelo sistema automatizado?
 * 9) Os usuários desejam adicionar metadados adicionais, além do sugerido pelo sistema automatizado?
 * 10) Você acha que pode ser suficiente para os usuários terem a oportunidade de enviar feedback com sugestões sobre como melhorar os metadados gerados por máquina, quando necessário?
 * 11) Privilégios para visualização e edição
 * 12) Queremos que os metadados sejam visíveis para todos os usuários ou apenas para determinadas classes de usuários?
 * 13) Queremos que os metadados sejam editáveis ​​para todos os usuários ou apenas para determinadas classes de usuários?

Além disso, comentários mais específicos sobre projetos relacionados geralmente podem ser deixados nas páginas de discussão dos projetos:
 * MediaSearch no Commons
 * Sugestão de Imagem

Financiamento
O financiamento parcial para este trabalho é fornecido por uma da Alfred P. Sloan Foundation, afim de promover o trabalho realizado pela primeira rodada de financiamento para desenvolver Dados Estruturados em Commons.