Structured Data Across Wikimedia/it

Structured Data Across Wikimedia (SDAW) è un progetto che ci aiuterà a strutturare il contenuto dele pagine wiki, in modo che esso sia leggibile e riconoscibile anche da una macchina, per rendere la lettura, la modifica e la ricerca di contenuti più facile e più accessibile fra progetti e più in generale sulla rete.

Questo progetto aiuterà gli utenti ad associare i contenuti tra i progetti Wikimedia, aiuterà i lettori a immergersi più a fondo nell'ecosistema della conoscenza di Wikimedia e aiuterà i collaboratori a diffondere le informazioni tra i progetti e oltre essi in un modo simile a quanto oggi avviene con Wikidata. Il progetto sarà anche un luogo per la sperimentazione di strumenti di modifica da computer assistita, per rendere il processo di modifica più facile e più accessibile a un maggior numero di utenti in tutto il mondo.

Contesto
Questo progetto è il seguito di quanto già completato su Wikimedia Commons, nell'ambito del progetto Structured Data on Commons (SDC), e sarà parzialmente finanziato da un grant triennale della Sloan Foundation. Il lavoro su SDC ci ha reso consapevoli della necessità di avere metadati migliori per tutti i contenuti e per permettere alle API di fornire migliori risultati di ricerca, per rendere a loro volta i contenuti più accessibili, ricercabili, traducibili e utilizzabili per altre esigenze.

Questo progetto ha tre obbiettivi fondamentali:
 * 1) permettere alle macchine di riconoscere i contenuti di Wikimedia e suggerire relazioni con altri contenuti di Wikimedia. Stiamo esplorando questo punto attraverso il progetto di suggerimento delle immagini.
 * 2) immaginare nuove modalità di strutturazione delle voci e delle pagine per abilitare nuovi formati di contenuto - come contenuti forniti in formati più piccoli, più accessibili e più facilmente condivisibili per i lettori.
 * 3) fornire agli utenti di Wikimedia un modo più invitante e più efficiente per cercare e trovare contenuti, partendo dal nuovo MediaSearch ed esplorando nuovi modi per migliorare la ricerca tra le versioni di Wikipedia, usando i dati strutturati.

Cosa sta cambiando
L'obiettivo del progetto è quello di progettare un prototipo di nuovo sistema sufficientemente flessibile, in modo da servire tutti i tipi di metadati che potremmo aver bisogno di supportare nel prossimo futuro.

La prima area di azione che è stata identificata è quella dei metadati sugli argomenti, per poter meglio descrivere di cosa tratta una sezione di una voce di Wikipedia. Questo sarà supportato da un'infrastruttura di archiviazione dei dati che può strutturare i dati delle sezioni in wikitesto come entità a sé stanti e associare metadati a ogni entità della sezione. Questo porterà i seguenti vantaggi:


 * 1) Taggare le sezioni con concetti tratti da Wikidata aiuterà gli utenti a scoprire, tradurre e localizzare i contenuti. Ci aiuterà anche a far combaciare i contenuti tra i progetti (per esempio, tra Wikipedia e Wikimedia Commons), aiutandoci a illustrare le voci e a far crescere i contributi.
 * 2) Strutturare i contenuti in wikitesto in sezioni definite renderà più facile programmare le macchine per rispondere a domande precise e fornire rapidamente risposte. Questo supporterebbe piattaforme o strumenti esterni che possono generare risposte concise e facilitare la traduzione e la parità di conoscenza.
 * 3) Investire in un sistema di metadati flessibile e scalabile è una parte importante della nostra Evolutionary Architecture. Sarà utile anche per potenziali progetti futuri come Shared Citations e Wikifunctions/Abstract Wikipedia, così come per estensioni già esistenti come ArticlePlaceholder.

Il progetto sta attualmente studiando sistemi di analisi dei link e relazioni concettuali come modi per determinare i metadati delle sezioni di una voce di Wikipedia, attraverso i "link blu" delle voci. Vengono inoltre utilizzate anche le relazioni tra elementi di Wikidata, per dedurre e potenzialmente identificare concetti rilevanti che non sono esplicitamente menzionati nel testo.

Come pianifichiamo di usare i metadati sugli argomenti
Mentre vediamo molti potenziali casi d'uso che possono trarre vantaggio da questi metadati, inizieremo a usarli per progettare nuovi modi per migliorare la ricerca sulle varie versioni di Wikipedia, così come abbiamo usato Structured Data su Commons per creare MediaSearch.

Un altro ambito di ricerca al momento è l'utilizzo dei dati strutturati per migliorare i nostri strumenti di raccomandazione delle immagini, permettendo agli utenti di trovare immagini che corrispondono a una particolare sezione, invece di un'intera voce.

Cosa non vogliamo fare?

 * 1) Escludere gli utenti dal processo
 * 2) Travolgere gli utenti con troppi nuovi contenuti da valutare
 * 3) Aggiungere ulteriori bias nei progetti Wikimedia
 * 4) Aggiungere potenziali nuovi vettori per vandalismi
 * 5) Introdurre maggiore complessità nel nostro sistema

Design
L'esempio approssimativo mostrato qui sotto illustra come potrebbe risultare una potenziale interfaccia utente per aggiungere e aggiornare i metadati (mostrati qui come "concetti") di una particolare sezione. L'esempio rispecchia l'ipotesi per cui gli utenti richiedano piena partecipazione all'intero processo di creazione dei metadati. Si possono vedere sia concetti non confermati (rilevati dal tool) che quelli confermati, insieme a un'opzione per aggiungere un concetto personalizzato, cercando su Wikidata. Ogni concetto include l'identificativo di Wikidata, un link al relativo elemento e una descrizione, per aiutare l'utente a decidere se il concetto è adatto a questa sezione.

I seguenti mockup sono una rappresentazione approssimativa di come gli utenti potrebbero interagire con questo tool di aggiunta e cura dei metadati di una sezione di voce. Ci sono molti aspetti di questa prima rappresentazione che sono in evoluzione e hanno ancora bisogno di essere discussi.

Stiamo raccogliendo feedback su queste idee in modo da poter continuare a costruire e fare evolvere questo prototipo iniziale. Potremmo, per esempio, scoprire che non è necessario avere a tutti i costi una forte interazione degli utenti nella determinazione dei metadati ed esplorare, invece, qualche soluzione che ne preveda di meno.

2021

 * Il progetto sta passando a una prima fase di test, che prevede la sperimentazione di notifiche per avvisare gli utenti di potenziali immagini utili per le voci di Wikipedia.

maggio-agosto 2021

 * Abbiamo richiesto feedback sul progetto di raccomandazione delle immagini, attraverso inviti individuali e una richiesta di pareri della durata di un mese, rivolta specificamente a quattro versioni linguistiche di Wikipedia e a Wikimedia Commons

2021

 * Abbiamo richiesto feedback riguardo queste domande.
 * Abbiamo lavorato su wireframes e mockups per aiutare a esplorare queste idee
 * Esplorata l'infrastruttura per sostenere questo lavoro attraverso il processo del Technical Decision Making Forum. Vedi anche.

seconda metà del 2020

 * Costruzione di MediaSearch su Commons.
 * A/B test per MediaSearch condotto fra il 10 e il 17 settembre 2020.

Feedback
I feedback sul progetto sono e saranno sempre il benvenuto. Siamo particolarmente interessati alle vostre idee sul grado di coinvolgimento degli utenti nel processo di creazione dei metadati delle sezioni. Speriamo di sentire le vostre risposte riguardo le seguenti domande:
 * 1) Le vostre aspettative sul progetto
 * 2) Che cosa si aspettano gli utenti da questo progetto? Quali sono le azioni necessarie da affrontare?
 * 3) Come immaginate di utilizzare questi metadati? Riuscite a pensare a come potrebbe aiutare i vostri flussi di lavoro?
 * 4) Validazione dei metadati
 * 5) È necessaria una forma di moderazione per evitare vandalismi e/o bias?
 * 6) Qualora fosse necessaria la moderazione, come può essere gestita efficacemente?
 * 7) Aggiungere e confermare i metadati
 * 8) Volete essere in grado di approvare o respingere i metadati suggeriti dal sistema automatico?
 * 9) Volete essere in grado di aggiungere ulteriori metadati rispetto a quelli suggeriti dal sistema automatico?
 * 10) Pensi che possa essere sufficiente che gli utenti abbiano la possibilità di inviare un feedback con suggerimenti su come migliorare i metadati suggeriti automaticamente, quando necessario?
 * 11) Privilegi per visualizzare e modificare i metadati
 * 12) Vogliamo che i metadati siano visibili a tutti gli utenti o solo per certe classi di utenti?
 * 13) Vogliamo che i metadati siano modificabili da tutti gli utenti o solo da certe classi di utenti?

Infine, feedback più specifici sui progetti correlati possono generalmente essere lasciati sulle pagine di discussione dei progetti:
 * MediaSearch on Commons
 * Immagini raccomandate

Finanziamento
Un parziale finanziamento per questo lavoro è fornito da un della Alfred P. Sloan Foundation, per portare avanti il lavoro fatto nel primo round di finanziamento per sviluppare Structured Data on Commons.