Structured Data Across Wikimedia/pt

Dados Estruturados na Wikimedia (DEW) é um projeto que nos ajudará a estruturar conteúdo em páginas de wikitexto de uma maneira que ele seja reconhecível e relacionável por máquina, de maneira a tornar a leitura, edição e pesquisa mais fáceis e acessíveis entre projetos e na internet.

Eles vão ajudar os usuários a associarem o conteúdo entre os projetos da Wikimedia, os leitores a mergulharem mais fundo no ecossistema de conhecimento da Wikimedia; e a quem contribui a disseminar informações entre projetos e além deles de maneira semelhante à Wikidata. O DEW também fornecerá um local para experimentação com ferramentas de edição assistida por computador, para tornar a edição mais fácil e acessível a mais wikimedistas em todo o mundo.

Antecedentes
Esse projeto é a continuidade de um desenvolvimento semelhante que foi concluído no Commons, como parte da concessão anterior de Dados Estruturados no Commons (DEC); e será parcialmente financiado por uma bolsa de três anos da Sloan Foundation. O trabalho no DEC nos conscientizou da necessidade de metadados mais avançados para todo o conteúdo e APIs (Interfaces de Programação de Aplicações) para fornecer melhores resultados de pesquisa, o que tornaria o conteúdo mais acessível, detectável, traduzível e utilizável para outros fins. O trabalho na DEC nos conscientizou da necessidade de metadados mais avançados para todo o conteúdo e APIs para fornecer melhores resultados de pesquisa, o que, por sua vez, tornaria o conteúdo mais acessível, descoberto, traduzível e utilizável para outras necessidades.

O projeto tem três objetivos fundamentais:


 * 1) Permitir que as máquinas reconheçam o conteúdo da Wikimedia e sugiram relações com outros conteúdos da Wikimedia. Estamos explorando isto primeiro através do projeto imgsugg|projeto de sugestão de imagens.
 * 2) Desenvolver uma maneira de estruturar artigos e páginas para permitir novos formatos de conteúdo – como conteúdo apresentado em doses menores e de fácil digestão, mais acessível para leitores usarem e compartilharem.
 * 3)  Oferecer aos usuários da Wikimedia uma maneira mais convidativa e eficiente de pesquisar e encontrar conteúdo , aproveitando o MediaSearch e explorando novas maneiras de melhorar a pesquisa nas Wikipédias, usando dados estruturados.

O que está mudando
O objetivo do projeto é planejar e prototipar um novo sistema que visa ser flexível o suficiente para atender a todos os tipos de metadados que possamos precisar suportar em um futuro próximo.

Identificamos três projetos principais que vamos desenvolver, como parte do nosso trabalho:


 * 1) Sugestão de Imagem, um recurso para usuários experientes para ajudar a ilustrar artigos da Wikipédia;
 * 2) Metadados de Seção, também conhecidos como Tópicos de Seção, para descrever do que se trata uma seção de um artigo da Wikipédia;
 * 3) O projeto Aprimoramento de Pesquisa, que usarão conteúdo estruturado para dar aos usuários uma maneira mais convidativa e eficiente de pesquisar e encontrar conteúdo nas Wikipédias.

Sugestão de Imagem
A UI Sugestão de Imagem visa desenvolver sistemas para dados estruturados ao longo de todos os projetos da Wikimedia.

Este trabalho se baseará no trabalho já iniciado como parte do projeto de tarefa estruturada "Adicionar imagem". Entretanto, seu foco será deslocado para a melhoria dos processos para colaboradores experientes. Em particular, visaremos usuários que editaram ou assistiram a um determinado artigo ou conjunto de artigos, uma vez que eles provavelmente serão especialistas no assunto e terão interesse em ver esse(s) artigo(s) melhorar.

Metadados de Seção
O projeto Tópicos de Seção identificará seções em um artigo e criará tópicos de acordo com essas seções, baseando-se em vários elementos, como por exemplo:


 * um algoritmo que detecta itens do Wikidata com base nos links azuis da seção (que será desenvolvido em parceria com as equipes de Dados Estruturados, Pesquisa e Plataforma de Dados);
 * a capacidade de identificar automaticamente seções em um artigo (que será desenvolvido em parceria com as equipes de Dados Estruturados e Plataforma de Dados).

Um dos primeiros casos de uso que prevemos para tópicos de seção será a sugestão de imagens em nível de seção, que utilizará o algoritmo blue-links (links azuis) e a infra estrutura de identificação de seção acima, e será entregue tanto através da experiência do recém-chegado quanto através de notificações para colaboradores experientes. Isto se baseará no trabalho trabalho feito com sugestões de imagem e será desenvolvido em parceria com as equipes de Dados Estruturados, Plataforma de Dados, Pesquisa, Pesquisa, Android e Crescimento.

Esses elementos não serão alterados nem afetarão a experiência de edição atual dos usuários. Todas estas atividades serão automáticas e não dependerão de nenhuma ação dos editores. Atualmente, este projeto está em fase de desenvolvimento, e ainda há aspectos que podem exigir mais investigação e/ou feedback dos usuários.

Aprimoramento de pesquisa
O projeto Aprimoramento de Pesquisas utilizará conteúdo estruturado para dar aos usuários uma forma mais convidativa e mais eficiente de pesquisar e encontrar conteúdo no Wikipedias. Ao melhorar Especial:Busca, queremos permitir que os usuários encontrem as informações que estão procurando, ou que eles podem não ter notado, ou que tenham se deparado anteriormente através da busca existente.

Nosso objetivo é identificar e definir melhorias incrementais de “pesquisa especial” que usam conteúdo estruturado, para ajudar os usuários a encontrar o conteúdo que procuram, especialmente nas wikis de idiomas que possuem menos artigos.

O que não queremos fazer?

 * 1) Deixar os usuários de fora do processo
 * 2) Sobrecarregar os usuários com muito conteúdo novo para moderar
 * 3) Adicionar qualquer viés/preconceito adicional aos projetos da Wikimedia
 * 4) Acrescentar vetores adicionais para vandalismo
 * 5) Introduzir muita complexidade em nossos sistemas

2023

 * The final report of DPLA project funded by SDAW to drive the reuse of described and attributed images was published.

2023

 * Survey about Image Suggestions notifications run on Portuguese, Russian and Indonesian Wikipedia.

2023

 * New feature Search Preview deployed on Portuguese, Russian and Indonesian Wikipedia.
 * Started work on Section-level Image Suggestions, based on work done for Section Topics.

2022

 * Sigestão de Imagens A fase de testes na Wikipédia catalã, finlandesa, húngara e norueguesa foi iniciada.

2022

 * A primeira rodada dos testes do Sugestão de Imagens na Wikipédia em português, russo e indonésio foi concluída com sucesso.
 * Páginas do projeto atualizadas para refletir o novo status atual da iniciativa.

2022

 * O relatório de segundo relatório anual para Dados Estruturados em toda a Wikimedia foi publicado.
 * O DPLA recebeu financiamento dos Dados Estruturados na Wikimedia para impulsionar a reutilização das imagens descritas e atribuídas. Você pode ler mais sobre isso no anúncio do projeto DPLA 2022 DEW. You can read more about it at DPLA's 2022 SDAW project announcement.
 * É lançada uma consulta geral sobre Aprimoramento de pesquisa.

2022

 * Páginas do projeto atualizadas para refletir o novo status atual da iniciativa e os três principais projetos a serem desenvolvidos.
 * A Wikipédia indonésia entra como a terceira comunidade de testadores.

2022

 * Estabelecendo contato com a comunidade da Wikipédia em português e russo como as primeiras comunidades de testadores para Sugestão de Imagem.

2021

 * O projeto está passando para um primeiro estágio de teste, que experimenta o uso de notificações para alertar os usuários sobre imagens úteis em potencial para artigos da Wikipédia.

Maio-Agosto 2021

 * Procurando feedback sobre o projeto de Sugestão de Imagem, através de convites individuais e um mês de RfC especificamente direcionado a 4 Wikipedias + Commons

2021

 * Procurando feedback sobre essas ideias.
 * Trabalhando em wireframes e maquetes para ajudar a explorar essas ideias.
 * Explorando a infraestrutura para apoiar este trabalho por meio do processo do Fórum de Tomada de Decisões Técnicas. Consulte a tarefa.

Segundo semestre de 2020

 * Construindo o MediaSearch no Commons.
 * Teste A/B MediaSearch - realizado entre 10 e 17 de setembro de 2020.

Comentários
Os feedbacks, comentários e opiniões sobre o projeto são e sempre serão bem-vindos. Estamos especialmente interessados ​​em suas ideias sobre até que ponto você deseja manter o “humano-no-circuito” durante todo o processo de criação de metadados tópicos. Estamos ansiosos para ouvir de você sobre as seguintes perguntas em aberto:


 * 1) Suas expectativas sobre o projeto
 * 2) O que os usuários esperam deste projeto? Quais são as ações necessárias a serem abordadas?
 * 3) Como você imagina que esses metadados sejam usados? Você pode pensar em maneiras de ajudar em seus fluxos de trabalho?
 * 4) Moderação de metadados
 * 5) A moderação é necessária para evitar vandalismo e/ou viés/preconceito?
 * 6) Se a moderação for necessária, como ela pode ser gerenciada de forma eficaz?
 * 7) Adicionando e confirmando metadados
 * 8) Os usuários desejam aprovar ou rejeitar metadados sugeridos pelo sistema automatizado?
 * 9) Os usuários desejam adicionar metadados adicionais, além do sugerido pelo sistema automatizado?
 * 10) Você acha que pode ser suficiente para os usuários terem a oportunidade de enviar feedback com sugestões sobre como melhorar os metadados gerados por máquina, quando necessário?
 * 11) Privilégios para visualização e edição
 * 12) Queremos que os metadados sejam visíveis para todos os usuários ou apenas para determinadas classes de usuários?
 * 13) Queremos que os metadados sejam editáveis ​​para todos os usuários ou apenas para determinadas classes de usuários?

Além disso, comentários mais específicos sobre projetos relacionados geralmente podem ser deixados nas páginas de discussão dos projetos:
 * MediaSearch no Commons
 * Sugestão de Imagem

Financiamento
O financiamento parcial para este trabalho é fornecido por uma da Alfred P. Sloan Foundation, afim de promover o trabalho realizado pela primeira rodada de financiamento para desenvolver Dados Estruturados em Commons.