Structured Data Across Wikimedia/Image Suggestions/it

Questa pagina descrive il lavoro in corso per progettare e costruire funzioni di suggerimento di immagini per utenti esperti, che il team di Structured Data Across Wikimedia sta attualmente sviluppando.

Questo lavoro si baserà sul lavoro già svolto per il task "aggiungi un'immagine". Tuttavia, la sua attenzione sarà maggiormente volta al miglioramento dei processi per gli utenti esperti. In particolare, ci rivolgeremo agli utenti che hanno curato o messo nei propri osservati speciali una particolare voce o un gruppo di voci, poiché è probabile che siano esperti nell'argomento e che abbiano interesse a vedere quella voce o quelle voci migliorare.

Dopo aver raccolto un feedback iniziale da varie comunità, il progetto è adesso in una prima fase di test, che prevedrà di sperimentare delle notifiche per annunciare agli utenti potenziali immagini utili per le voci di Wikipedia.

Contesto
L'interfaccia di suggerimento delle immagini è una componente fondamentale del progetto SDAW, che intende sviluppare un sistema di dati strutturati attraverso tutti i progetti Wikimedia.

Le immagini sono fondamentali per illustrare i concetti e aiutare le persone a capire gli argomenti. Considerando che Wikimedia Commons contiene oltre 65 milioni di immagini, crediamo che sia possibile rendere le versioni di Wikipedia maggiormente più illustrate con le immagini di Commons. Crediamo che i dati strutturati possano aprire una forma di scambio duratura tra Commons e Wikipedia per arricchire contenuti. Questo ci aiuterà, a sua volta, a far crescere e diversificare gli utenti, migliorare il contenuto per i lettori e ridurre le lacune nei contenuti.

Nonostante ciò, in molte Wikipedia più della metà delle voci non ha immagini. Questo è dovuto primariamente alla complessità dell'attuale processo di aggiunta di immagini e di connessione fra contenuto e immagini. Noi vogliamo rendere questo processo più semplice.

Il nostro punto di partenza
Come abbiamo già detto, questo strumento si baserà sul lavoro già svolto per il task "aggiungi un'immagine". La API di suggerimento delle immagini, costruita dal team di Platform Engineering, combina i risultati dell'algoritmo di suggerimento delle immagini e di MediaSearch, per fornire suggerimenti di potenziali combinazioni di immagini e voci non illustrate, seguendo il seguente approccio:
 * 1) Controlla l'elemento Wikidata di una voce.
 * 2) Se  ha un valore, suggerisce quella immagine.
 * 3) Se  ha un valore, suggerisce un'immagine da quella categoria.
 * 4) Controlla le voci sullo stesso argomento in altre versioni linguistiche di Wikipedia e suggerisce l'immagine nell'incipit in quelle versioni, se esistente.
 * 5) Cerca attraverso MediaSearch su Commons per il titolo della voce, combinando la ricerca tradizionale basata su testo con i dati strutturati di Commons e Wikidata. Se un'immagine ha un rank sufficientemente alto fra i risultati, suggerisce quell'immagine.

Nei test iniziali, gli algoritmi combinati hanno suggerito immagini fino al 40% di tutte le voci non illustrate su un data Wikipedia. Stiamo facendo ulteriori test sull'accuratezza delle combinazioni. In aggiunta, i team Android e Growth stanno effettuando esperimenti con l'API di suggerimento delle immagini, per permettere ai nuovi utenti di aggiungere nuove immagini attraverso l'interfaccia apposita.

Stiamo inoltre effettuando esperimenti con l'aggiunta di risultati dall'algoritmo di suggerimento delle immagini direttamente su MediaSearch. Speriamo che questi esperimenti possano semplificare il processo tecnico e migliorare i risultati di MediaSearch. Vedi su Phabricator per maggiori informazioni.

Cosa vogliamo fare
Il progetto sta attualmente sperimentando un approccio basato sulle notifiche. L'obiettivo è quello di incorporare i suggerimenti nelle attività già esistenti di un utente su Wikipedia attraverso notifiche settimanali, aumentando così la probabilità che gli utenti rivedano tali suggerimenti e aggiungano le immagini selezionate come parte del loro attuale flusso di lavoro di modifica. I contributori possono scegliere di modificare tramite wikitesto o Visual Editor, così come possono valutare l'immagine e le informazioni dell'articolo nella notifica.

Flusso di lavoro provvisorio
Il seguente è il corrente flusso di lavoro provvisorio, che abbiamo definito per questa fase di testing. Laddove appropriato, c'è un link al ticket corrispondente su Phabricator.
 * 1) Le notifiche sono mandate settimanalmente a tutti gli utenti che hanno effettuato almeno 500 modifiche a un determinato momento del giorno (per esempio, ogni lunedì alle 8 del mattino UTC), in tutto il mondo → vedi  su Phabricator
 * 2) Le notifiche includono un collegamento alle proprie preferenze per permettere all'utente di non ricevere queste notifiche → a questo proposito, vedi  su Phabricator
 * 3) * le opzioni di suggerimento delle immagini verranno aggiunte alla fine della lista di possibili notifiche a cui ci si può iscrivere/disiscrivere
 * 4) I suggerimenti sono scelti in modo casuale dalla lista di possibili combinazioni fra immagini e voci non illustrate, utilizzando gli algoritmi indicati sopra
 * 5) Gli utenti sono selezionati casualmente fra un gruppo di utenti che:
 * 6) * hanno effettuato almeno 500 modifiche su un progetto
 * 7) * non si sono disiscritti dalle notifiche
 * 8) * hanno ricevuto fino a due notifiche di suggerimento immagini in una data settimana
 * 9) Lo strumento cercherà nella lista degli osservati speciali di un utente tutte le voci modificate negli ultimi 30 giorni
 * 10) * Se l'utente ha già ricevuto una notifica per una determinata voce, il tool passerà alla voce successiva
 * 11) * Altrimenti, suggerirà una possibile combinazione e invierà la notifica
 * 12) If image matches remain, then the tool checks for other articles on users watchlist
 * 13) The notification process will be generated weekly, until image matches are exhausted or applicable users are exhausted
 * 14) * Notifications for a particular article-image match notification will only be shown once to a particular user
 * 15) * The same match can be sent to multiple users to review (except in the case the image has been inserted)

User experience
Based on the information provided in the notification, the user can:
 * 1) go through their normal image addition workflow (e.g. choose to insert the image with wikitext or Visual Editor insert flow)
 * 2) * in this case, just the opportunity to review the match will be provided to the user - no additional help or feature will be provided
 * 3) click on “Review image” in the notification
 * 4) * this will redirect the user to the image on Commons
 * 5) click on “Review article” in the notification
 * 6) * this will redirect the user to the article on Wikipedia

Ideas for the future
The following bullet list lists all the ideas that are out of scope of the current test stage, but might be worked upon in the future:
 * Suggestions to users who have uploaded images on Commons that match articles
 * Suggestions given in other ways besides via notifications (e.g. suggestions in the image search dialogue in VisualEditor)
 * Illustrated articles
 * Section level image suggestions
 * A tool to help users add images to the article
 * A landing page that lets users review multiple suggestions at once
 * Limiting notifications only to users who have a history of adding images to articles in the last 30 days

Metrics and analytics
We are planning on measuring the following metrics, to analyse the performance of the current testing and determine whether the tool is successful:
 * 1) Number of notifications sent
 * 2) Number of image suggestions notifications opened (measuring engagement with notifications)
 * 3) Number of opt-outs (low number of opt-outs = notifications are useful)
 * 4) Number of images suggested that are added to the matched article within a month of receiving the notification
 * 5) Number of suggested images not reverted from their matched article (low revert rate = good quality of suggested matches)

What we don’t want to do

 * Create a new tool that will go unused due to lack of incentive for use
 * Annoy users with too many notifications
 * Encourage edits that will overwhelmingly be reverted
 * Encourage edits that go against existing policies and/or practises (NPOV, original research...)
 * Encourage edits that introduce additional bias in the article

Feedback
Project feedback is and will always be welcome. We are especially interested in your ideas, and we are looking forward to hearing from you on the talk page about the following open questions:
 * 1) What is your opinion about the approaches outlined above?
 * 2) Should we be helping editors with image placement location?
 * 3) How can we help users make sure they are following the conventions of a particular wiki when choosing and placing an image?
 * 4) How can we help users add appropriate captions?
 * 5) How can we help users add appropriate alt-text?

Consultations

 * August 2021: First round of feedback (original RfC for Wikipedia, original RfC for Wikimedia Commons)

What is the Image suggestion tool about?
The image suggestion tool is a key component of the Structured Data Across Wikimedia project, and it aims to make it easier for users to find potential images and media for currently unillustrated articles.

Does the Image suggestion tool somehow intersect with the “Add an image” tool from the Growth Team?
Technically yes. The two tools share the same algorithm, but they also serve different purposes:
 * the “Add an image” tool is intended for newcomers and less experienced users, who have little to no experience with adding images;
 * the Image suggestion tool is intended for more established users, who already have experience with adding images and other media to articles (i.e. users with more than 500 edits).

What is the relation between the Image suggestion tool and Wikidata/Structured Data on Commons?
This tool will leverage the data coming from Wikidata and Structured Data on Commons to find potential media to add on unillustrated Wikipedia articles.

More specifically, the tool will look at the relative Wikidata item, and will check if it has an image (through Wikidata property P18) or an associated Commons category (through Wikidata property P373). If in both cases no potential images are found, it will look at other Wikipedia articles in other languages to see if there is a lead image to be found. Finally, the tool will search MediaSearch on Commons for the title of the article, and if an image ranks high enough in the results, the tool will choose that image.