Structured Data Across Wikimedia/pt

Dados Estruturados na Wikimedia (DEW) é um projeto que nos ajudará a estruturar conteúdo em páginas de wikitexto de uma maneira que ele seja reconhecível e relacionável por máquina, de maneira a tornar a leitura, edição e pesquisa mais fáceis e acessíveis entre projetos e na internet.

Eles vão ajudar os usuários a associarem o conteúdo entre os projetos da Wikimedia, os leitores a mergulharem mais fundo no ecossistema de conhecimento da Wikimedia; e a quem contribui a disseminar informações entre projetos e além deles de maneira semelhante à Wikidata. O DEW também fornecerá um local para experimentação com ferramentas de edição assistida por computador, para tornar a edição mais fácil e acessível a mais wikimedistas em todo o mundo.

Antecedentes
Esse projeto é a continuidade de um desenvolvimento semelhante que foi concluído no Commons, como parte da concessão anterior de Dados Estruturados no Commons (DEC), e será parcialmente financiado por uma bolsa de três anos da Sloan Foundation. O trabalho no DEC nos conscientizou da necessidade de metadados mais avançados para todo o conteúdo e APIs (Interfaces de Programação de Aplicações) para fornecer melhores resultados de pesquisa, o que tornaria o conteúdo mais acessível, detectável, traduzível e utilizável para outros fins.

O projeto tem três objetivos fundamentais:
 * 1) Permitir que as máquinas reconheçam o conteúdo da Wikimedia e façam sugestões relacionadas com outros conteúdos da plataforma. Estamos explorando isso primeiro através do projeto de recomendação de imagens.
 * 2) Desenvolver uma maneira de estruturar artigos e páginas para permitir novos formatos de conteúdo – como conteúdo apresentado em doses menores e de fácil digestão, mais acessíveis para leitores usarem e compartilharem.
 * 3)  Oferecer aos usuários da Wikimedia uma maneira mais convidativa e eficiente de pesquisar e encontrar conteúdo , aproveitando o MediaSearch e explorando novas maneiras de melhorar a pesquisa nas Wikipédias, usando dados estruturados.

O que está mudando
O objetivo do projeto é planejar e prototipar um novo sistema que visa ser flexível o suficiente para atender a todos os tipos de metadados que possamos precisar suportar em um futuro próximo.

A primeira área de ação que foi identificada são os metadados tópicos para descrever do que se trata uma seção de um artigo da Wikipédia. Isso será suportado pela infraestrutura de armazenamento de dados que pode estruturar dados de seção no wikitexto como sendo sua própria entidade e associar metadados tópicos a cada entidade de seção. Isso contribuirá das seguintes maneiras:


 * 1) Marcando secções com estrutura relevante, conceitos de Wikidata estruturados e independentes de linguagem ajudarão os usuários a descobrir, traduzir e localizar conteúdo. Também será possível combinar conteúdo entre projetos (ou seja, entre a Wikipedia e o Wikimedia Commons), ajudando na ilustração de artigos e contribuições crescentes.
 * 2) Estruturando o conteúdo wikitexto em seções discretas será mais fácil programar máquinas para responderem perguntas discretas e fornecerem fatos rápidamente. Isso daria suporte a plataformas ou ferramentas externas que podem gerar respostas concisas e facilitar a tradução e a paridade de conhecimento.
 * 3) Investir em um sistema de metadados flexível e escalável é uma parte importante de nossa Arquitetura Evolutiva. Isso será útil para potenciais projetos futuros, como Citações Compartilhadas e Wikifunctions/Abstract Wikipedia, bem como extensões já existentes, como ArticlePlaceholder da Wikibase.

O projeto está atualmente investigando sistemas de análise de links e relacionamentos de conceito como formas de determinar os metadados tópicos das seções de um artigo da Wikipédia, por meio dos links interwiki azuis nos artigos da Wikipédia. O relacionamento entre itens na ontologia Wikidata também esta sendo considerado para inferir, e potencialmente identificar, conceitos relevantes que não são explicitamente mencionados no texto.

Como planejamos usar esses metadados tópicos
Embora vejamos muitos casos de uso em potencial que podem tirar proveito desses metadados, começaremos usando-os para projetar novas maneiras de melhorar a pesquisa nas Wikipédias, da mesma maneira em que usamos Dados Estruturados no Commons para criar o MediaSearch.

Outra possibilidade que estamos pesquisando no momento é usar dados estruturados para melhorar nossas ferramentas de recomendação de imagens, permitindo que os usuários encontrem imagens que correspondam a um determinado trecho, ao invés de apenas um artigo inteiro.

O que nós não queremos fazer?

 * 1) Deixar os usuários de fora do processo
 * 2) Sobrecarregar os usuários com muito conteúdo novo para moderar
 * 3) Adicionar qualquer viés/preconceito adicional aos projetos da Wikimedia
 * 4) Acrescentar vetores adicionais para vandalismo
 * 5) Introduzir muita complexidade em nossos sistemas

Design
O exemplo aproximado mostrado aqui ilustra como pode ser uma interface de usuário para adicionar e atualizar os metadados de tópicos (mostrados aqui como "conceitos") representados em uma seção selecionada, se soubermos das discussões que os editores desejam participação total em toda a criação de metadados de tópicos processo. Você pode ver conceitos detectados por máquina não confirmados e conceitos confirmados, além de uma opção para adicionar um conceito personalizado pesquisando no Wikidata. Cada conceito inclui o Q-ID, um link para sua página Wikidata e uma descrição para ajudar o usuário a decidir se o conceito é adequado para esta seção.

Os modelos a seguir são uma representação aproximada de como os editores podem interagir com uma ferramenta que permite anexar conceitos ou tópicos a seções de um artigo. Há muitos aspectos dessa representação inicial que estão em fluxo e ainda precisam ser discutidos.

Estamos à procura de feedback sobre essas ideias para que possamos continuar a evoluir e construir este protótipo inicial. Podemos, por exemplo, aprender que esse nível de interação completa "humano-no-circuito" com os conceitos detectados pela máquina não é necessário e, ao invés disso, explorarmos algo mais leve.

2021

 * O projeto está passando para um primeiro estágio de teste, que experimenta o uso de notificações para alertar os usuários sobre possíveis imagens úteis para artigos da Wikipédia.

Maio-Agosto 2021

 * Em busca de feedback sobre o Projeto de Recomendação de Imagem, por meio de convites individuais e um RfC de um mês especificamente direcionado a 4 Wikipédias + Commons

2021

 * Procurando feedback sobre essas ideias.
 * Trabalhando em wireframes e maquetes para ajudar a explorar essas ideias.
 * Explorando a infraestrutura para apoiar este trabalho por meio do processo do Fórum de Tomada de Decisões Técnicas. Consulte a tarefa.

Segundo semestre de 2020

 * Construindo o MediaSearch no Commons.
 * Teste A/B MediaSearch - realizado entre 10 e 17 de setembro de 2020.

Comentários
Os feedbacks, comentários e opiniões sobre o projeto são e sempre serão bem-vindos. Estamos especialmente interessados ​​em suas ideias sobre até que ponto você deseja manter o “humano-no-circuito” durante todo o processo de criação de metadados tópicos. Estamos ansiosos para ouvir de você sobre as seguintes perguntas em aberto:
 * 1) Suas expectativas sobre o projeto
 * 2) O que os usuários esperam deste projeto? Quais são as ações necessárias a serem abordadas?
 * 3) Como você imagina que esses metadados sejam usados? Você pode pensar em maneiras de ajudar em seus fluxos de trabalho?
 * 4) Moderação de metadados
 * 5) A moderação é necessária para evitar vandalismo e/ou viés/preconceito?
 * 6) Se a moderação for necessária, como ela pode ser gerenciada de forma eficaz?
 * 7) Adicionando e confirmando metadados
 * 8) Os usuários desejam aprovar ou rejeitar metadados sugeridos pelo sistema automatizado?
 * 9) Os usuários desejam adicionar metadados adicionais além do sugerido pelo sistema automatizado?
 * 10) Você acha que pode ser suficiente para os usuários terem a oportunidade de enviar feedback com sugestões sobre como melhorar os metadados gerados por máquina, quando necessário?
 * 11) Privilégios para visualização e edição
 * 12) Queremos que os metadados sejam visíveis para todos os usuários ou apenas para determinadas classes de usuários?
 * 13) Queremos que os metadados sejam editáveis ​​para todos os usuários ou apenas para determinadas classes de usuários?

Além disso, comentários mais específicos sobre projetos relacionados geralmente podem ser deixados nas páginas de discussão dos projetos:
 * MediaSearch no Commons
 * Recomendações de Imagem

Financiamento
O financiamento parcial para este trabalho é fornecido por uma da Alfred P. Sloan Foundation, afim de promover o trabalho realizado pela primeira rodada de financiamento para desenvolver Dados Estruturados em Commons.