Structured Data Across Wikimedia/it

Structured Data Across Wikimedia (SDAW) è un progetto che ci aiuterà a strutturare il contenuto dele pagine wiki, in modo che esso sia leggibile e riconoscibile anche da una macchina, per rendere la lettura, la modifica e la ricerca di contenuti più facile e più accessibile fra progetti e più in generale sulla rete.

Questo progetto aiuterà gli utenti ad associare i contenuti tra i progetti Wikimedia, aiuterà i lettori a immergersi più a fondo nell'ecosistema della conoscenza di Wikimedia e aiuterà i collaboratori a diffondere le informazioni tra i progetti e oltre essi in un modo simile a quanto oggi avviene con Wikidata. Il progetto sarà anche un luogo per la sperimentazione di strumenti di modifica da computer assistita, per rendere il processo di modifica più facile e più accessibile a un maggior numero di utenti in tutto il mondo.

Contesto
Questo progetto è il seguito di quanto già completato su Wikimedia Commons, nell'ambito del progetto Structured Data on Commons (SDC), e sarà parzialmente finanziato da un grant triennale della Sloan Foundation. Il lavoro su SDC ci ha reso consapevoli della necessità di avere metadati migliori per tutti i contenuti e per permettere alle API di fornire migliori risultati di ricerca, per rendere a loro volta i contenuti più accessibili, ricercabili, traducibili e utilizzabili per altre esigenze.

Questo progetto ha tre obbiettivi fondamentali:
 * 1) permettere alle macchine di riconoscere i contenuti di Wikimedia e suggerire relazioni con altri contenuti di Wikimedia. Stiamo esplorando questo punto attraverso il progetto di suggerimento delle immagini.
 * 2) immaginare nuove modalità di strutturazione delle voci e delle pagine per abilitare nuovi formati di contenuto - come contenuti forniti in formati più piccoli, più accessibili e più facilmente condivisibili per i lettori.
 * 3) fornire agli utenti di Wikimedia un modo più invitante e più efficiente per cercare e trovare contenuti, partendo dal nuovo MediaSearch ed esplorando nuovi modi per migliorare la ricerca tra le versioni di Wikipedia, usando i dati strutturati.

Cosa sta cambiando
L'obiettivo del progetto è quello di progettare un prototipo di nuovo sistema sufficientemente flessibile, in modo da servire tutti i tipi di metadati che potremmo aver bisogno di supportare nel prossimo futuro.

La prima area di azione che è stata identificata è quella dei metadati sugli argomenti, per poter meglio descrivere di cosa tratta una sezione di una voce di Wikipedia. Questo sarà supportato da un'infrastruttura di archiviazione dei dati che può strutturare i dati delle sezioni in wikitesto come entità a sé stanti e associare metadati a ogni entità della sezione. Questo porterà i seguenti vantaggi:


 * 1) Taggare le sezioni con concetti tratti da Wikidata aiuterà gli utenti a scoprire, tradurre e localizzare i contenuti. Ci aiuterà anche a far combaciare i contenuti tra i progetti (per esempio, tra Wikipedia e Wikimedia Commons), aiutandoci a illustrare le voci e a far crescere i contributi.
 * 2) Strutturare i contenuti in wikitesto in sezioni definite renderà più facile programmare le macchine per rispondere a domande precise e fornire rapidamente risposte. Questo supporterebbe piattaforme o strumenti esterni che possono generare risposte concise e facilitare la traduzione e la parità di conoscenza.
 * 3) Investire in un sistema di metadati flessibile e scalabile è una parte importante della nostra Evolutionary Architecture. Sarà utile anche per potenziali progetti futuri come Shared Citations e Wikifunctions/Abstract Wikipedia, così come per estensioni già esistenti come ArticlePlaceholder.

Il progetto sta attualmente studiando sistemi di analisi dei link e relazioni concettuali come modi per determinare i metadati delle sezioni di una voce di Wikipedia, attraverso i "link blu" delle voci. Vengono inoltre utilizzate anche le relazioni tra elementi di Wikidata, per dedurre e potenzialmente identificare concetti rilevanti che non sono esplicitamente menzionati nel testo.

Come pianifichiamo l'uso dei metadati sugli argomenti
While we see many potential use cases that can take advantage of this metadata, we will start by using it to design new ways to improve search on the Wikipedias, like we used Structured Data on Commons to create MediaSearch.

Another possibility we are researching at the moment is to use structured data to improve our image recommendation tools, by allowing users to find images that match to a particular section, instead of just an entire article.

Cosa non vogliamo fare?

 * 1) Escludere gli utenti dal processo
 * 2) Travolgere gli utenti con troppi nuovi contenuti da valutare
 * 3) Aggiungere ulteriori bias nei progetti Wikimedia
 * 4) Aggiungere potenziali nuovi vettori per vandalismi
 * 5) Introdurre maggiore complessità nel nostro sistema

Design
The rough example shown here illustrates what a user interface for adding and updating the topical metadata (shown here as "concepts") represented in a selected section might look like, if we learn from discussions that editors want full participation through the entire topical metadata creation process. You can see both unconfirmed machine-detected concepts and confirmed concepts, along with an option to add a custom concept by searching Wikidata. Each concept includes the Q-ID, a link to its Wikidata page, and a description to help the user decide if the concept is an appropriate fit for this section.

The following mockups are a rough representation of how editors might interact with a tool that allows them to attach concepts or topics to sections in an article. There are many aspects of this early representation that are in flux and still need to be discussed.

We're looking for feedback on these ideas so that we can continue to evolve and build on this early prototype. We may, for example, learn that this level of full "human-in-the-loop" interaction with the machine-detected concepts isn't necessary, and instead explore something more lightweight.

2021

 * Il progetto sta passando a una prima fase di test, che prevede la sperimentazione di notifiche per avvisare gli utenti di potenziali immagini utili per le voci di Wikipedia.

maggio-agosto 2021

 * Looking for feedback about the Image Recommendations project, through individual invitations and a month-long RfC specifically targeted to 4 Wikipedias + Commons

2021

 * Looking for feedback about these ideas.
 * Working on rough wireframes and mockups to help explore these ideas.
 * Exploring infrastructure to support this work via the Technical Decision Making Forum process. See.

seconda metà del 2020

 * Building MediaSearch on Commons.
 * MediaSearch A/B test - conducted between 10 and 17 September 2020.

Feedback
Project feedback is and will always be welcome. We are especially interested in your ideas about the extent to which you want to keep the “human-in-the-loop” throughout the topical metadata creation process. We are looking forward to hearing from you about the following open questions:
 * 1) Le vostre aspettative sul progetto
 * 2) What do users expect from this project? What are the necessary actions to be addressed?
 * 3) How do you envision this metadata being used? Can you think of ways it would aid in your workflows?
 * 4) Validazione dei metadati
 * 5) Is moderation necessary to avoid vandalism and/or bias?
 * 6) If moderation is necessary, how can it be effectively managed?
 * 7) Aggiungere e confermare i metadati
 * 8) Do users want to be able to approve or reject metadata suggested by the automated system?
 * 9) Do users want to be able to add additional metadata beyond what is suggested by the automated system?
 * 10) Do you think it may just be sufficient for users to have the opportunity to send feedback with suggestions on how to improve the machine generated metadata, when necessary?
 * 11) Privilegi per visualizzare e modificare i metadati
 * 12) Do we want metadata to be visible for all users or only for certain classes of users?
 * 13) Do we want metadata to be editable for all users or only for certain classes of users?

Also, more specific feedback about related projects can generally be left on the projects' talk pages:
 * MediaSearch on Commons
 * Immagini raccomandate

Finanziamento
Partial funding for this work is provided by a from the Alfred P. Sloan Foundation, to further the work done by the first round of funding to develop Structured Data on Commons.