Structured Data Across Wikimedia/Image Suggestions/it

Questa pagina descrive il lavoro in corso per progettare e costruire funzioni di suggerimento di immagini per utenti esperti, che il team di Structured Data Across Wikimedia sta attualmente sviluppando.

Questo lavoro si baserà sul lavoro già svolto per il task "aggiungi un'immagine". Tuttavia, la sua attenzione sarà maggiormente volta al miglioramento dei processi per gli utenti esperti. In particolare, ci rivolgeremo agli utenti che hanno curato o messo nei propri osservati speciali una particolare voce o un gruppo di voci, poiché è probabile che siano esperti nell'argomento e che abbiano interesse a vedere quella voce o quelle voci migliorare.

Dopo aver raccolto un feedback iniziale da varie comunità, il progetto è adesso in una prima fase di test, che prevedrà di sperimentare delle notifiche per annunciare agli utenti potenziali immagini utili per le voci di Wikipedia.

Contesto
L'interfaccia di suggerimento delle immagini è una componente fondamentale del progetto SDAW, che intende sviluppare un sistema di dati strutturati attraverso tutti i progetti Wikimedia.

Le immagini sono fondamentali per illustrare i concetti e aiutare le persone a capire gli argomenti. Considerando che Wikimedia Commons contiene oltre 65 milioni di immagini, crediamo che sia possibile rendere le versioni di Wikipedia maggiormente più illustrate con le immagini di Commons. Crediamo che i dati strutturati possano aprire una forma di scambio duratura tra Commons e Wikipedia per arricchire contenuti. Questo ci aiuterà, a sua volta, a far crescere e diversificare gli utenti, migliorare il contenuto per i lettori e ridurre le lacune nei contenuti.

Nonostante ciò, in molte Wikipedia più della metà delle voci non ha immagini. Questo è dovuto primariamente alla complessità dell'attuale processo di aggiunta di immagini e di connessione fra contenuto e immagini. Noi vogliamo rendere questo processo più semplice.

Il nostro punto di partenza
Come abbiamo già detto, questo strumento si baserà sul lavoro già svolto per il task "aggiungi un'immagine". La API di suggerimento delle immagini, costruita dal team di Platform Engineering, combina i risultati dell'algoritmo di suggerimento delle immagini e di MediaSearch, per fornire suggerimenti di potenziali combinazioni di immagini e voci non illustrate, seguendo il seguente approccio:
 * 1) Controlla l'elemento Wikidata di una voce.
 * 2) Se  ha un valore, suggerisce quella immagine.
 * 3) Se  ha un valore, suggerisce un'immagine da quella categoria.
 * 4) Controlla le voci sullo stesso argomento in altre versioni linguistiche di Wikipedia e suggerisce l'immagine nell'incipit in quelle versioni, se esistente.
 * 5) Cerca attraverso MediaSearch su Commons per il titolo della voce, combinando la ricerca tradizionale basata su testo con i dati strutturati di Commons e Wikidata. Se un'immagine ha un rank sufficientemente alto fra i risultati, suggerisce quell'immagine.

Nei test iniziali, gli algoritmi combinati hanno suggerito immagini fino al 40% di tutte le voci non illustrate su un data Wikipedia. Stiamo facendo ulteriori test sull'accuratezza delle combinazioni. In aggiunta, i team Android e Growth stanno effettuando esperimenti con l'API di suggerimento delle immagini, per permettere ai nuovi utenti di aggiungere nuove immagini attraverso l'interfaccia apposita.

Stiamo inoltre effettuando esperimenti con l'aggiunta di risultati dall'algoritmo di suggerimento delle immagini direttamente su MediaSearch. Speriamo che questi esperimenti possano semplificare il processo tecnico e migliorare i risultati di MediaSearch. Vedi su Phabricator per maggiori informazioni.

Cosa vogliamo fare
Il progetto sta attualmente sperimentando un approccio basato sulle notifiche. L'obiettivo è quello di incorporare i suggerimenti nelle attività già esistenti di un utente su Wikipedia attraverso notifiche settimanali, aumentando così la probabilità che gli utenti rivedano tali suggerimenti e aggiungano le immagini selezionate come parte del loro attuale flusso di lavoro di modifica. I contributori possono scegliere di modificare tramite wikitesto o Visual Editor, così come possono valutare l'immagine e le informazioni dell'articolo nella notifica.

Flusso di lavoro provvisorio
Il seguente è il corrente flusso di lavoro provvisorio, che abbiamo definito per questa fase di testing. Laddove appropriato, c'è un link al ticket corrispondente su Phabricator.
 * 1) Le notifiche sono mandate settimanalmente a tutti gli utenti che hanno effettuato almeno 500 modifiche a un determinato momento del giorno (per esempio, ogni lunedì alle 8 del mattino UTC), in tutto il mondo → vedi  su Phabricator
 * 2) Le notifiche includono un collegamento alle proprie preferenze per permettere all'utente di non ricevere queste notifiche → a questo proposito, vedi  su Phabricator
 * 3) * le opzioni di suggerimento delle immagini verranno aggiunte alla fine della lista di possibili notifiche a cui ci si può iscrivere/disiscrivere
 * 4) I suggerimenti sono scelti in modo casuale dalla lista di possibili combinazioni fra immagini e voci non illustrate, utilizzando gli algoritmi indicati sopra
 * 5) Gli utenti sono selezionati casualmente fra un gruppo di utenti che:
 * 6) * hanno effettuato almeno 500 modifiche su un progetto
 * 7) * non si sono disiscritti dalle notifiche
 * 8) * hanno ricevuto fino a due notifiche di suggerimento immagini in una data settimana
 * 9) Lo strumento cercherà nella lista degli osservati speciali di un utente tutte le voci modificate negli ultimi 30 giorni
 * 10) * Se l'utente ha già ricevuto una notifica per una determinata voce, il tool passerà alla voce successiva
 * 11) * Altrimenti, suggerirà una possibile combinazione e invierà la notifica
 * 12) Se la combinazione rimane, allora il tool cercherà un'altra voce nella lista di osservati speciali dell'utente
 * 13) Il processo di notifiche verrà generato settimanalmente, finché non si esauriranno le combinazioni immagini-voci o gli utenti a disposizione
 * 14) * Le notifiche per una particolare combinazione voce-immagine saranno mostrate soltanto una volta a ogni dato utente
 * 15) * La stessa combinazione potrà essere inviata a più utenti perché la valutino (eccetto il caso in cui l'immagine è stata inserita)

Esperienza utente
In base alle informazioni fornite dalla notifica, l'utente può:
 * 1) eseguire il normale flusso di aggiunta di immagini (per esempio scegliere di inserire l'immagine con il wikitesto o attraverso Visual Editor)
 * 2) * in questo caso, verrà fornita all'utente solo l'opportunità di valutare la combinazione - nessuna funzione o aiuto aggiuntivo verrà fornito
 * 3) cliccare su "Analizza l'immagine" nella notifica
 * 4) * questo rimanderà l'utente all'immagine su Wikimedia Commons
 * 5) cliccare su "Analizza la voce" nella notifica"
 * 6) * questo rimanderà l'utente alla voce su Wikipedia

Idee per il futuro
La seguente lista elenca tutte le idee che sono per il momento al di fuori della corrente fase di test, ma che potrebbero essere incluse in futuro:
 * Suggerimenti di combinazioni agli utenti che hanno caricato immagini su Commons
 * Suggerimenti distribuiti anche in modi differenti da una notifica (per esempio, suggerimenti nel sistema di ricerca delle immagini di VisualEditor)
 * Voci con immagini
 * Raccomandazioni di immagini per le sezioni
 * Un tool per aiutare gli utenti ad aggiungere immagini alle voci
 * Una pagina unica che permetta a un utente di valutare più suggerimenti in un'unica volta
 * Limitare le notifiche solo agli utenti che hanno aggiunto immagini a delle voci negli ultimi 30 giorni

Metriche e analisi
Prevediamo di misurare le seguenti metriche per analizzare la performance dell'attuale fase di test e verificare che il nostro tool abbia successo:
 * 1) Number of notifications sent
 * 2) Number of image suggestions notifications opened (measuring engagement with notifications)
 * 3) Number of opt-outs (low number of opt-outs = notifications are useful)
 * 4) Number of images suggested that are added to the matched article within a month of receiving the notification
 * 5) Number of suggested images not reverted from their matched article (low revert rate = good quality of suggested matches)

What we don’t want to do

 * Create a new tool that will go unused due to lack of incentive for use
 * Annoy users with too many notifications
 * Encourage edits that will overwhelmingly be reverted
 * Encourage edits that go against existing policies and/or practises (NPOV, original research...)
 * Encourage edits that introduce additional bias in the article

Feedback
Project feedback is and will always be welcome. We are especially interested in your ideas, and we are looking forward to hearing from you on the talk page about the following open questions:
 * 1) What is your opinion about the approaches outlined above?
 * 2) Should we be helping editors with image placement location?
 * 3) How can we help users make sure they are following the conventions of a particular wiki when choosing and placing an image?
 * 4) How can we help users add appropriate captions?
 * 5) How can we help users add appropriate alt-text?

Consultations

 * August 2021: First round of feedback (original RfC for Wikipedia, original RfC for Wikimedia Commons)

What is the Image suggestion tool about?
The image suggestion tool is a key component of the Structured Data Across Wikimedia project, and it aims to make it easier for users to find potential images and media for currently unillustrated articles.

Does the Image suggestion tool somehow intersect with the “Add an image” tool from the Growth Team?
Technically yes. The two tools share the same algorithm, but they also serve different purposes:
 * the “Add an image” tool is intended for newcomers and less experienced users, who have little to no experience with adding images;
 * the Image suggestion tool is intended for more established users, who already have experience with adding images and other media to articles (i.e. users with more than 500 edits).

What is the relation between the Image suggestion tool and Wikidata/Structured Data on Commons?
This tool will leverage the data coming from Wikidata and Structured Data on Commons to find potential media to add on unillustrated Wikipedia articles.

More specifically, the tool will look at the relative Wikidata item, and will check if it has an image (through Wikidata property P18) or an associated Commons category (through Wikidata property P373). If in both cases no potential images are found, it will look at other Wikipedia articles in other languages to see if there is a lead image to be found. Finally, the tool will search MediaSearch on Commons for the title of the article, and if an image ranks high enough in the results, the tool will choose that image.