Structured Data Across Wikimedia/sv

Strukturerad data på Wikimedia (Structured Data Across Wikimedia, SDAW) är ett projekt för att hjälpa oss strukturera innehåll på wikitextsidor på ett sätt så att maskiner kan läsa och relatera det, göra det lättare att läsa, redigera och söka samt göra det mer tillgängligt på olika projekt och på internet.

Projektet ska hjälpa användare associera innehåll mellan Wikimedias projekt, hjälpa läsare dyka djupare ner i Wikimedias ekosystem av kunskap och hjälpa bidragsgivare förmedla information på projekten och utanför dem på ett Wikidata-liknande sätt. Projektet kommer också erbjuda en plats att experimentera på med datorstödda redigeringsverktyg för att underlätta och tillgängliggöra redigering för flera redigerare runt om i världen.

Bakgrund
Projektet är en uppföljning på liknande utveckling som slutfördes på Commons som en del av tidigare Strukturerad data på Commons (SDC) och kommer delvis finansieras av ett treårsbidrag från Sloan Foundation. Arbetet med SDC gjorde oss medvetna om behovet av mer avancerad metadata för allt innehåll och alla API:er för att erbjuda bättre sökresultat, vilket i sin tur skulle göra innehåll mer tillgängligt, sökbart, översättbart och användbart för andra behov.

Projektet har tre högt satta mål:
 * 1) Att möjliggöra för maskiner att känna igen innehåll på Wikimedia och att föreslå förhållanden med annat innehåll på Wikimedia. Vi utforskar detta först via bildförslagsprojektet.
 * 2) Att utforska ett sätt att strukturera artiklar och sidor för att aktivera nya innehållsformat – som innehåll i mindre bitar som läsare lättare kan använda och dela.
 * 3) Att ge Wikimedia-användare ett mer inbjudande och effektivare sätt att söka efter och hitta innehåll, bygga vidare på MediaSearch och utforska nya sätt att förbättra sökningar på Wikipedia med strukturerad data.

Vad kommer ändras
Projektets målsättning är att utforma och bygga en prototyp över ett nytt system som ska vara flexibelt nog att fungera med alla möjliga sorters metadata vi kan behöva stöd för i framtiden.

Vi har identifierat tre huvudprojekt som vi vill utveckla, som en del av vårt arbete:
 * 1) Bildförslag, en funktion där erfarna användare kan hjälpa till att illustrera artiklar på Wikipedia;
 * 2) Metadata för avsnitt, även känt som Avsnittsämnen, för att beskriva vad ett avsnitt i en Wikipediaartikel handlar om;
 * 3) Sökningsförbättringar, som kommer använda strukturerat innehåll för att ge användare en mer inbjudande och effektivare sätt att söka efter och hitta innehåll på Wikipedia.

Bildförslag
Bildförslagsgränssnittet har som mål att utveckla system för strukturerad data på Wikimedias projekt.

Detta arbete kommer bygga vidare på arbetet som redan inletts som en del av strukturerade uppgifter-projektet "Lägga till en bild". Det kommer däremot att byta fokus till att förbättra processen för erfarna bidragsgivare. Vi kommer särskilt att rikta in oss på användare som har redigerat eller bevakat en viss artikel eller uppsättning artiklar, då det är mer sannolikt att de är experter i ämnet och har intresse av att se till att artikeln förbättras.

Ämnesavsnitt
Projektet Ämnesavsnitt kommer identifiera avsnitt i en artikel och skapa ämnen enligt dessa avsnitt, baserat på flera element:
 * en algoritm som upptäcker Wikidata objekt baserade på avsnittets blålänkar (vilka kommer utvecklas i samarbete med arbetslagen för strukturerad data, efterforskning, maskininlärning och dataplattformarna.
 * förmågan att automatiskt identifiera avsnitt i en artikel (vilket kommer utvecklas i samarbete med arbetslagen för strukturerad data och dataplattformarna);
 * bildförslag på avsnittsnivå, vilket kommer använda blålänksalgoritmen och avsnittsigenkänningsinfrastrukturen ovan och levereras både via nybörjargränssnittet och via aviseringar för erfarna bidragsgivare.

Den sista punkten kommer bygga vidare på det tidigare arbetet med bildförslag och kommer utvecklad i samarbete med arbetslagen för strukturerad data, maskininlärning, dataplattformarna, efterforskning, sökning och tillväxt (Growth).

Dessa element kommer inte ändras, eller påverka den nuvarande redigeringsupplevelsen. Alla dessa aktiviteter kommer vara automatiska och inte begära någonting från användaren som redigerar en artikel. Projektet befinner sig fortfarande i undersökningsstadiet och det finns fortfarande aspekter som kan kräva ytterligare undersökningar och/eller återkoppling från användarna.

Baserat på rimligheten hos dessa förslag har alltså projektet som målsättning att:
 * använda avsnittsämnen för att förbättra vår SEO-poäng utanför sökmotorer (i samarbete med webbarbetslaget)
 * etablera partnerskap med den större Wikimediagemenskapen för att visa vilken påverkan våra verktyg har (i samarbete med arbetslagen strukturerad data, tillväxt och gemenskapsprogram (GLAM/kampanjer)).

Sökningsförbättringar
The Search Improvements project will use structured content to give users a more inviting and more efficient way to search and find content on the Wikipedias. By improving Special:Search, we want to enable users to find the information they are looking for, or that they may not have noticed, or previously come across through existing search.

We aim to identify and define incremental “special search” improvements that use structured content, to assist users in finding the content they are looking for, especially in those language wikis that have fewer articles.

What do we not want to do?

 * 1) Leave users out of the process
 * 2) Overwhelm users with too much new content to moderate
 * 3) Add any additional bias to Wikimedia projects
 * 4) Add additional vectors for vandalism
 * 5) Introduce too much complexity into our systems

2022

 * Project pages updated to reflect the new current status of the initiative and the three main projects to be developed.

2022

 * Establishing contact with Portuguese and Russian Wikipedia community as first tester communities for Image Suggestions.

2021

 * Project is moving to a first test stage, that is experimenting with the use of notifications to alert users of potential useful images for Wikipedia articles.

Maj-augusti 2021

 * Looking for feedback about the Image Suggestions project, through individual invitations and a month-long RfC specifically targeted to 4 Wikipedias + Commons

2021

 * Looking for feedback about these ideas.
 * Working on rough wireframes and mockups to help explore these ideas.
 * Exploring infrastructure to support this work via the Technical Decision Making Forum process. See.

Second half of 2020

 * Building MediaSearch on Commons.
 * MediaSearch A/B test - conducted between 10 and 17 September 2020.

Feedback
Project feedback is and will always be welcome. We are especially interested in your ideas about the extent to which you want to keep the “human-in-the-loop” throughout the topical metadata creation process. We are looking forward to hearing from you about the following open questions:
 * 1)  Your expectations about the project
 * 2) What do users expect from this project? What are the necessary actions to be addressed?
 * 3) How do you envision this metadata being used? Can you think of ways it would aid in your workflows?
 * 4)  Metadata moderation
 * 5) Is moderation necessary to avoid vandalism and/or bias?
 * 6) If moderation is necessary, how can it be effectively managed?
 * 7)  Adding and confirming metadata
 * 8) Do users want to be able to approve or reject metadata suggested by the automated system?
 * 9) Do users want to be able to add additional metadata beyond what is suggested by the automated system?
 * 10) Do you think it may just be sufficient for users to have the opportunity to send feedback with suggestions on how to improve the machine generated metadata, when necessary?
 * 11)  Privileges for visualising and editing
 * 12) Do we want metadata to be visible for all users or only for certain classes of users?
 * 13) Do we want metadata to be editable for all users or only for certain classes of users?

Also, more specific feedback about related projects can generally be left on the projects' talk pages:
 * Mediesökning på Commons
 * Bildförslag

Finansiering
Partial funding for this work is provided by a from the Alfred P. Sloan Foundation, to further the work done by the first round of funding to develop Structured Data on Commons.