Jump to content

Growth/Personalizovaný první den/Strukturované úkoly

From mediawiki.org
This page is a translated version of the page Growth/Personalized first day/Structured tasks and the translation is 100% complete.

Tato stránka popisuje práci týmu Growth na projektu strukturované úkoly. Tento projekt souvisí s dalšími projekty týmu Growth: S úlohami nováčků a s domovskou stránkou nováčka. Tato stránka obsahuje nejdůležitější informace, otevřené otázky a rozhodnutí. Více novinek týkajících se práce týmu Growth najdete na stránce s aktualizacemi rozvojového týmu. Závažné a větší aktuality budou pak vloženy i sem.

Tato stránka je o obecném konceptu "strukturovaného úkolu" s diskusí o konkrétních typech úkolů, které bychom mohli vytvořit. V návaznosti na tuto obecnou diskusi tým zahájil navrhování a konstrukci těchto konkrétních typů úkolů. Tyto typy úkolů mají své vlastní stránky projektu, kde se zveřejňuje většina nových informací:

Současný stav

Shrnutí

V listopadu 2019 tým Growth spustil "Editační tipy", čímž nováčkům ukázal na články, které by mohli editovat, na jejich Domovské stránce. V dubnu 2020 byly tyto články generovány pouze na základě údržbových šablon vložených zkušenými editory, což nováčkům neumožňuje přesně určit, jaké sekce, slova či sekce potřebují jejich pozornost. I přes to ale nadšeně pozorujeme, že nováčci produktivně editují.

Ačkoliv údržbové šablony poskytují nováčkům velké množství různých tipů, kterým by se mohli věnovat, jsou velmi obsáhlé, aby s nimi nováčci snadno uspěli. Na mobilních zařízeních je navíc velmi těžké používat jakýkoli editor - ať už vizuální nebo wikitextový.

Z tohoto důvodu jsme se rozhodli experimentovat s nápadem "strukturované editace". To znamená, že rozebereme každý editory používaný postup na jednotlivé kroky, které jsou pro nováčky snadno uchopitelné. Podle výsledků jazykového týmu a týmu pro Androidovou aplikaci soudíme, že to pomůže nováčkům snadno udělat více editací a to i na mobilu. Tato strukturovaná editace bude dostupná nováčkům jako součást editačních tipů.

Pozadí této aktivity

Editování je komplikované

Podle poznatků z naší předchozí práce soudíme, že první okamžiky nováčka rozhodují o tom, zda na projektu zůstane, či nikoliv. Věříme, že nováčci zůstávají, pokud dokáží rychle něco změnit a mít tak pozitivní zážitek. Bohužel, editování Wikipedie – téměř jakýkoliv typ příspěvku – je obtížné. Což znesnadňuje úspěch. Například, pokud chcete přidat do článku jedinou větu, musíte provést zhruba tucet kroků:

  1. Nalézt správný článek.
  2. Zjistit, zda náhodou tato informace již v článku není.
  3. Vybrat sekci, do které větu přidáte.
  4. Kliknout na tlačítko pro editaci.
  5. Vložit větu na správné místo.
  6. Kliknout na tlačítko pro citaci.
  7. Vrátit se na zdroj informace a zkopírovat si odkaz či získat informace o citaci.
  8. Vyplnit a uložit citační formulář.
  9. Kliknout na tlačítko pro zveřejnění změny.
  10. Vyplnit shrnutí editace.
  11. Zveřejnit.

Nováčci, kteří vidí editor poprvé v životě, neví, jaké jsou tyto kroky, v jakém pořadí by je měli dělat a jaká tlačítka přesně mají stisknout. Jinými slovy, jejich zážitek není strukturován. Nováček se může cítit přetížený a odejde. Nebo využije metody pokus-omyl, což má často za následek negativní zpětnou vazbu od dalších, zkušenějších, wikipedistů. Což nováčka rovněž může odradit. A o tom je tento projekt: Jak pomoci nováčkům dělat správné kroky ve správném pořadí?

Sekce níže se mohou během několika týdnů výrazně změnit, zatím jsou příliš technické anebo nejsou důležité pro porozumění tomuto projektu. Rozhodli jsme se proto je nepřekládat. Jejich překlad je dobrovolný

Stavíme na znalostech ostatních týmů

Hotcat strukturuje proces přidávání kategorií.

Přidávání struktury do editačních postupů je již dlouhou dobu tradiční součástí kultury Wikimedie. Podívejte se na některé příklady:

  • HotCat: umožňuje uživatelům vybrat, které kategorie přidat na pár kliknutí, namísto manuální editace wikitextu.
  • Commons Upload Wizard: rozděluje proces nahrávání médií na Commons na řadu jednoduchých kroků.
  • Citoid: je k dispozici ve Visual Editoru. Rozděluje proces přidání citace na kroky, které zahrnují algoritmy pro automatické vytváření textu citace a šablony.

V poslední době se myšlenka "strukturovaných úkolů" osvědčila v aplikaci Android pro Wikipedii a v nástroji Překlad obsahu. Inspirujeme se jejich prací.

Se svým projektem "navrhovaných úprav" pro Android se změnil proces přidání popisu názvu k článku na Wikipedii do jednoho snadného kroku zápisem do textového pole. Od té doby udělali totéž s překladem popisů titulů napříč všemi jazyky. Aby mohli uživatelé provádět stejné úkoly bez strukturovaného pracovního postupu, museli by přejít na Wikidata a provést několik kroků k provedení stejných úprav. Náš tým zjistil, že tato metoda funguje: Mnoho uživatelů Androidu přináší stovky těchto malých příspěvků.

Jazykový tým vytvořil nástroj pro překlad obsahu, který dělá řadu věcí pro strukturování procesu překladu článku. Nabízí rozhraní vytvořená pro překlady, rozděluje překlad na části a automaticky používá algoritmy strojového překladu. Ačkoli Wikipedisté mohli překládat články i před existencí tohoto nástroje, množství požadovaných manuálních kroků to velmi ztěžovalo. Nástroj je úspěšný a jsou dokončeny stovky tisíc překladů. Zjistili jsme, že když je překlad článku rozdělen na kroky, přičemž o automatické části (např. spuštěný strojový překlad) je postaráno automaticky, bude přeloženo více článků.

Tým Growth přemýšlí o použití stejných zásad i na úpravy obsahu v článcích, jako je přidávání odkazů, přidávání obrázků, přidávání odkazů a přidávání vět.

Návrh, jak by strukturované editace mohly vypadat

Nejlepším způsobem, jak ukázat, co tímto projektem sledujeme, je ukázka rychlého grafického návrhu. První ze strukturovaných editací, o kterých jsme přemýšleli, je "přidat (wiki)odkaz". Tatáž myšlenka se ale dá aplikovat i na "přidání obrázku", "přidání reference" nebo dokonce i na "přidání informace".

V editačních tipech je k dispozici úkol "přidání (wiki)odkazu" – v rámci něj mají uživatelé do článku přidat modrý vnitřní odkaz. To by mělo být jednoduché. Myslíme si, že nováčci nerozumí tomu, v jakém pořadí mají provést jednotlivé kroky vedoucí k přidání odkazu nebo nemusí vědět, jaká slova by měly být odkazem. Představujeme si rozhraní, které nováčky krok za krokem provede přidáním odkazu za pomocí algoritmu, který doporučí slova či fráze, která by měla být odkazem.

V návrhu níže vidíte nováčka, který si otevře článek k editaci a systém mu nabídne slovo, které by mohlo být dobrým (wiki)odkazem. Pokud souhlasí s tím, že by s tímto slovem měl být vytvořen odkaz, systém provede kroky pro vytvoření odkazu. Doufejme, že je to v budoucnu naučí přidávat odkazy samostatně – a možná se jim zalíbí i možnost nadále vyhodnocovat automatické návrhy na vložení odkazů. Pokud jde o algoritmus, tým výzkumníků WMF na toto téma napsal předběžnou práci, díky níž jsme si jisti, že takový algoritmus je možné vytvořit.

Návrh nápadu na strukturovaný pracovní postup pro přidávání odkazů k článku, jehož cílem je naučit nováčky, jak přidávat odkazy samostatně.

Když jsme o tomto nápadu dále přemýšleli, napadlo nás to vzít za jiný konec. Namísto učení nováčků, jak se ve vizuálním editoru přidávají odkazy, můžeme nováčkům předložit snadno použitelný nástroj, pomocí kterého nováčci pouze potvrdí či zamítnou návrhy předložené algoritmem a systém uloží editaci za ně. I když je to nenaučí, jak přidávat odkazy pomocí editoru, může to nováčkovi pomoci při velkém objemu úprav a může to být vhodnější pro uživatele, kteří chtějí pokračovat s jednoduchými úkoly. Může to také být dobré pro uživatele, kteří chtějí udělat pouze pár rychlých editací, podobně, jako má aplikace Androidu velké množství uživatelů, kteří chtějí pouze opravovat popisky článků.

Náčrt nápadu na strukturovaný pracovní postup pro přidávání odkazů na článek, jehož cílem je pomoci nově příchozím při úpravách při vysokém objemu.

Když jsme o strukturovaných editacích dále přemýšleli, uvědomili jsme si, že stojíme před zásadní otázkou: Měl by se náš produkt zaměřit na použití tradičních nástrojů nebo by měl umožnit nováčkům rychle uložit větší množství editací?

Proč je tento nápad upřednostňován

Myslíme si, že možnost rychle uložit produktivní editaci pomáhá nováčkům k úspěchu. Jakmile mají za sebou pár editací, zbytek z wiki-dovedností přichází snáze. Nováčci mohou snadno vidět výsledky jejich editací. Dostanou poděkování. Ptají se informovaně na otázky. Vytvoří si uživatelskou stránku apod. Proto chceme, aby většina nováčků rychle uložila nějakou editaci. Z projektu Editačních tipů je zřejmé, že nováčci hledají jednoduché úkoly, na kterých by mohli pracovat. Zároveň jsme ale pozorovali následující:

  • Pouze 25 % nováčků skutečně edituje článek, který si vybrali
  • Pouze 25 % z těch, kteří editují, přechází i na další článek
  • Je zde i pár nováčků, kteří jsou Editačními tipy nadšeni - a každý den splní několik z nich. To umožňuje nováčkům udělat hodně wiki-práce.
  • Během testování s uživateli jsme si všimli, že nováčky často zajímá, co konkrétního by měli v článku změnit. Jinými slovy, editování celého článku je příliš otevřeným úkolem.

Vezmeme-li v úvahu tyto body a zkušenosti popsané výše v týmech pro Android a Překlad obsahu, myslíme si, že bychom dokázali zvýšit počet nově příchozích, kteří budou chtít upravovat a pokračovat v úpravách, strukturováním některých pracovních toků pro úpravu obsahu ve Wikipedii.

Příležitosti pro strukturované editace

Rozdělením pracovního postupu při úpravách na jednotlivé kroky získáme "trukturované úkoly". Zde jsou některé z možných výhod, které by podle nás mohly vycházet ze strukturovaných úkolů:

  • Nováčkům usnadňují vytvářet smysluplné příspěvky.
  • Vyvíjejí pracovní postupy pro úpravy, které dávají smysl pro mobilní zařízení. Principy mobilního návrhu nám říkají, že uživatelé by měli vidět postupně jeden krok po druhém, nikoli komplikovaný pracovní postup.
  • Umožňují nováčkům postupně zvyšovat své dovednosti, aby mohli úspěšně zvládnout náročnější typy úkolů.
  • Umožňují lidem najít takový zážitek z úprav, který jim vyhovuje. Tím, že nováčkům poskytnete zdroj strukturovaných úkolů, mohou najít typ úkolů, který upřednostňují.
  • Možná by se podobné pracovní postupy mohly v budoucnu otevřít i pro zkušené redaktory.

Obavy a stinné stránky strukturovaných úkolů

Kdykoli přidáme lidem nové způsoby úpravy Wikipedie, může dojít k mnoha chybám:

  • Tím, že bude úprava příliš rychlá a snadná, můžeme přilákat vandaly nebo uživatele, kteří úpravám nevěnují dostatečnou péči.
  • Poskytování jednoduchých pracovních postupů nováčkům může zabránit tomu, aby se naučili používat tradiční nástroje pro úpravy, které jsou zásadní pro práci s wiki a jsou nejrozsáhlejší.
  • Strukturované úkoly nemusí vyhovovat při porovnávání rozdílů mezi jazyky, při vyjímečnostech ve wikitextu a mohou způsobovat různé druhy chyb.
  • Algoritmy, které mapují strukturované úkoly, nemusí být dostatečně přesné a mohou vybízet nováčky k provádění úprav, které by se provádět neměly.

Komunitní diskuse

V květnu 2020 jsme vedli diskuse se členy komunity o výše uvedených nápadech na strukturované úkoly v šesti jazycích (angličtina, francouzština, korejština, arabština, vietnamština, čeština). Anglická diskuse se většinou odehrávala na této diskusní stránce. Další konverzace na anglické Wikipedii a místní jazykové konverzace na dalších pěti Wikipediích. Ozvalo se nám 35 členů komunity. Tato část shrnuje některé z nejpopulárnějších a nejzajímavějších myšlenek. Tyto diskuse silně ovlivnily naše další návrhy.

  • Členové komunity obecně kladně hodnotili potenciál strukturovaných úkolů, které pomáhají nováčkům začít s úpravami. Byl ale také často vyjádřen názor, že je důležité, aby nováčci byli během tohoto procesu vystaveni i konvenčním zdrojovým a vizuálním editacím. Členové komunity se chtějí ujistit, že nováčci nebudou blokováni v samostatném prostředí úprav a že si najdou cestu i k hodnotnějším úpravám.
  • Česká komunita hovořila o nápadech, jak se mohou strukturované úkoly umístit dovnitř vizuálního editoru tak, aby si nováčci začali zvykat na to, že jsou v editoru. Editační nástroje, které nejsou pro strukturovaný úkol nutné, mohou být zašedlé.
  • Členové komunity se ptali, proč volíme "přidat odkaz" (add a link) jako náš první strukturovaný úkol, na rozdíl od typů úprav s vyšší hodnotou. Diskutovali jsme o tom, že je tento úkol pro nás na tvorbu jeden z nejjednodušších, což nám pomůže vyvíjet první vzorky a učit se ze strukturovaných úkolů spolu s vývojem s relativně nízkým rizikem a s menší možností pro nováčky poškodit články.
  • Několik komunit uvedlo, že opravy pravopisu by byly obzvláště cenným úkolem. Hovořili jsme o technických možnostech, jak generovat seznamy potenciálních pravopisných chyb. Další podrobnosti najdete v poznámkách.
  • Mluvili jsme také o tom, zda je návrat vandalismu vhodný pro nováčky. Nezdá se, že by odpověď byla jasná. O tom budeme muset v budoucnu více diskutovat.
  • Myšlenka, která byla zmíněna několikrát, je, jak "přitáhnout nováčky" k postupně náročnějším úkolům. Možná je průběžně odměňovat za úspěšné dokončení jednodušších úkolů.

Typy úkolů

Existuje mnoho různých pracovních postupů pro úpravy, které mají potenciál stát se strukturovanými. Začali jsme vypisovat pracovní postupy, když jsme poprvé navrhli pracovní postup nových úkolů. Od té doby jsme je zúžili na kratší seznam typů úkolů, které se zdají být nejvhodnější pro strukturování. Níže uvedená tabulka obsahuje krátký seznam seřazený podle možného pořadí priorit.

Priorita Typ úkolu Jak by to mohlo fungovat Výhody Obavy
1 Přidání odkazu U článků bez dostatečného počtu wikiodkazů algoritmus (existující) navrhuje slova nebo fráze, které by se měly stát wikiodkazy, a nováček tyto návrhy přijme nebo odmítne. Propojení je rychlý a snadný způsob úprav a má nízký potenciál poškodit články. Pochopení, kdy přidat odkaz, vyžaduje úsudek a my nechceme, aby články byly přeplněné odkazy. Také to není nejcennější typ úpravy.
2 Přidání obrázku U článků bez ilustrace algoritmus (potenciál) navrhne obrázek z Commons. Může se jednat o jednoduchý algoritmus, který se podívá na to, jaké obrázky jsou v daném článku použity v jiných jazycích. Nováček se rozhodne, zda obrázek sem patří a kam v článku ho přidá. Dobré obrázky v článku hodně ovlivňují a nováčci mají o přidávání obrázků zájem. Přidání nesprávného obrázku do článku by mohlo článek velmi viditelně poškodit.
3 Přidání reference Některé věty nebo odstavce zjevně potřebují citace. Algoritmus (ve vývoji) by ukázal, které věty pravděpodobně potřebují návrhy, a nováček by v postupném pracovním postupu hledal zdroje, které by přidal jako citace. Odkazy mají pro jádro encyklopedie jednoznačný význam. Tento úkol nemusí být pro nováčky vzrušující. Také mohou mít potíže s vyhledáváním a používáním zdrojů bez vedení.
4 Copyedit Pomocí slovníků a kódu pro kontrolu pravopisu s otevřeným zdrojovým kódem nebo pomocí Wikislovníku identifikujte slova s ​​pravděpodobnými pravopisnými chybami a upozorněte na ně nováčky, kteří je mohou postupně opravit pomocí vizuálního editoru nebo editoru wikitextu. Zjevně cenné a potřebné v jakékoli wiki, uspokojivé pro nováčky. Pomáhá jim začít s úpravou hlavního textu článků, na rozdíl od okrajových částí článku. Škálování na jakýkoli jazyk může být obtížné v závislosti na dostupnosti dobrých algoritmů pro kontrolu pravopisu.
5 Přidání sekce Algoritmus detekuje, kdy by článek mohl použít další sekce, na základě typů záhlaví sekcí, které mají podobné články (např. všechny biografie vědců mívají sekce "Publikace"). Nováček je proveden procesem tvorby dobře citovaného odstavce. Skutečné doplnění obsahu, které by mohlo pomoci překlenout mezery ve znalostech. Mnohem náročnější úkol než ostatní, vyžadující kombinaci mnoha wiki dovedností. Může produkovat nekvalitní obsah.

Prioritizing "add a link"

Tým Growth chce v současné době (květen 2020) upřednostnit pracovní postup "přidat odkaz" před ostatními uvedenými v tabulce výše. Ačkoli se jiné pracovní postupy, jako například "editace", zdají být hodnotnější, existuje řada důvodů, proč bychom chtěli začít nejprve s "přidáním odkazu":

  • V blízké budoucnosti je nejdůležitější věcí, kterou bychom chtěli udělat jako první, dokázat koncept, že "strukturované úkoly" mohou fungovat. Proto bychom chtěli vytvořit tu nejjednodušší, abychom ji mohli nasadit uživatelům a získat z ní nové zkušenosti, aniž bychom museli do první verze investovat příliš mnoho. Pokud první verze půjde dobře, budeme mít důvěru investovat do typů úkolů, které je obtížnější sestavit.
  • "Přidat odkaz" se nám zdá být nejjednodušší k vytvoření, protože již existuje algoritmus vytvořený výzkumným týmem WMF, který se zdá být v navrhování wikiodkazů dobrý (viz sekce Algoritmy).
  • Přidání wikiodkazu obvykle nevyžaduje, aby nováček psal cokoli vlastního, což podle nás obzvláště usnadní návrh a tvorbu – a nováčkovi i jeho provedení.
  • Přidání wikilinku se zdá být úpravou s nízkým rizikem. Jinými slovy, obsah článku nemůže být tak ohrožen nesprávným přidáním odkazů, jako by mohl být nesprávným přidáním referencí nebo obrázků.

Poznámky ke "copyedit"

V rozhovorech s členy komunity na diskusní stránce tohoto projektu mnoho lidí nadneslo otázku, jak vytvořit strukturovaný úkol týkající se korektur. Oprava pravopisu, gramatiky, interpunkce a tónu se všem jevila jako jednoznačně užitečný úkol, kterému by měla být dána priorita. Tým Growth se zpočátku tomuto pracovnímu postupu vyhýbal kvůli obavám ze škálování: I kdybychom byli schopni najít nebo vyvinout algoritmus, který by spolehlivě našel korektury v jednom jazyce, byli bychom schopni to samé udělat i v desítkách dalších jazyků?

Více jsme se o tom začali dozvídat rozhovorem s User:Beland, který vyvinul skript "moss" pro Typo Team anglické Wikipedie. Chtěli jsme pochopit, jak proces funguje a jak by mohlo vypadat něco podobného v jiných jazycích. Stručně řečeno, zní to jako nejslibnější cesta prostřednictvím stávajících open-source kontrolorů pravopisu a slovníků. Dva příklady jsou knihovny aspell a hunspell. Níže uvádíme naše poznámky z učení se o "moss" s User:Beland.

  • Možnosti udělat něco podobného v jiných jazycích
    • Takový proces by teoreticky měl fungovat i v jiných jazycích, vzhledem k tomu, že i jiné jazyky mají Wikislovníky a open-source kontroly pravopisu.
    • Ale nebylo by možné jej nasadit v novém jazyce bez validace rodilými mluvčími. Pravděpodobně by bylo nutné provést úpravy pro mnoho jazyků.
    • Pravděpodobně více problémů bude spojeno s jazyky bez segmentace_slov (např. japonština).
    • Pravděpodobně více problémů pro aglutinativní jazyky.
    • Různé projekty mají různé stylistické manuály, což může způsobovat problémy.
    • Pokud algoritmus nefunguje správně, mělo by být vždy možné změnit jeho prahové hodnoty tak, aby identifikoval méně potenciálních chyb, ale s vyšší jistotou.
  • Jak funguje moss?
    • Stahuje soubory s výpisem obsahu celé anglické Wikipedie každé dva týdny.
    • Aby se omezili falešně pozitivní výsledky, odstraní šablony a vše uvnitř uvozovek atd. Zaměří se pouze na hlavní text článku: Na věci psané "hlasem Wikipedie".
    • Zkontroluje, zda je každé slovo v anglickém Wikislovníku.
    • Použije Python NLTK (sadu nástrojů pro přirozený jazyk) pro segmentaci slov.
    • Pro klasifikaci pravopisných chyb se dívá na odstup úprav.  Např. "T1" je jedna editační vzdálenost (přesnost 95 %). Také klasifikuje chyby mezer "TS".
    • Zahrnuje také anglickou kontrolu pravopisu s otevřeným zdrojovým kódem pro zúžení vyhledávacího prostoru, aby algoritmus mohl běžet rychleji.
    • Také se začal snažit přidávat gramatická pravidla (např. identifikaci trpného rodu), ale to je experimentálnější a mnohem obtížnější než pravopis.
    • Na konci procesu se zobrazí seznam článků a pravděpodobných překlepů. Uživatel otevře článek a hledá pravděpodobný překlep.

Mnoho žádostí o korekturu textu se týká i editorů, jejichž rodným jazykem není angličtina, kteří žádají o doladění angličtiny. Podívejte se na stránku Cech redaktorů WikiProjektu.