Growth/Analytics updates/Welcome survey initial report/hu

A Növekedés csapat "Személyre szabott első nap" projektjének részeként 2018. november 19-én, nem sokkal 19:00 (UTC) után telepítettük az Üdvözlő felmérést a cseh és a koreai Wikipédiára. A felmérés célja, hogy összegyűjtsünk néhány kezdeti információt az új felhasználókról, hogy személyre szabhassuk az első napjukat a wikin, és segítsük őket céljaik elérésében. A telepítés előtt közzétettünk egy kísérleti tervet, melyben részletezzük, hogy mit és miért fogunk mérni. Ez az oldal a csapatunk első jelentése a felmérés eredményeiről, melyet részletesebb elemzések követnek majd, amik a kísérleti tervben szereplő különböző kérdésekkel foglalkoznak.

Ebben a jelentésben gyors áttekintést adunk a felmérésről és az arra adott válaszokról a 2018. december 17-i telepítés és a nap vége (UTC) között regisztrált fiókok alapján. Nem számoltunk ki sem konfidenciaintervallumokat, sem statisztikai szignifikanciát ezekre az eredményekre vonatkozóan, és nem állítjuk, hogy szignifikáns különbségek lennének (pl. a két Wikipédia vagy a felhasználók csoportjai között). A felmérés kérdéseit sem vetettük még össze egymással, és nem elemeztük őket a EditorJourney-adatokkal együtt. Ehelyett ezeket előzetes eredményekként mutatjuk be, és megvitatunk néhány lehetséges lépést, amit ezek az eredmények sugallhatnak, és a következő negyedévben alaposabb elemzést fogunk végezni.

Fővonalak

 * A legtöbb felhasználó válaszol a felmérésre, így a cseh és a koreai Wikipédiában 67%-os, illetve 62%-os a válaszadási arány.
 * Jelenleg nem aggódunk amiatt, hogy a felmérés hatására új felhasználók hagyják el az oldalt.
 * A koreai Wikipédiában a profil létrehozásának leggyakoribb oka a cikkek olvasása, nem pedig a szerkesztés (29%). Ez eltér a csehországi válaszoktól, ahol 18% adta ezt a választ. A magas számok itt lehetőséget jelenthetnek arra, hogy ezeket a szerkesztőket felvilágosítsák arról, hogy a Wikipédia szerkesztése igenis lehetséges és egyszerű.
 * A válaszadók többsége mindkét nyelven nem szerkesztett még Wikipédiát (51% csehül és 63% koreaiul). Ezek az arányok azonban azt is jelentik, hogy sokan szerkesztettek már korábban (akár névtelenül, akár más fiókkal), és ezért lehet, hogy van némi tudásuk a szerkesztés módjáról.
 * A koreai válaszadók a cseh válaszadóknál sokkal nagyobb valószínűséggel írták be saját, egyéni témáikat, szemben az előre megadott lehetőségek kiválasztásával. A koreai válaszadók 28%-a adott hozzá saját témát, szemben a cseh válaszadók 9%-ával.
 * A válaszadók meglepően nagy számban nyilatkoztak úgy, hogy szívesen veszik fel velük a kapcsolatot, hogy segítséget kapjanak a szerkesztéshez: Csehországban 36%, koreaiul 53%. Ez határozottan megerősíti, hogy létezik az emberenkénti segítség lehetősége és igénye. A válaszadók a felhasználók listája, akiket meg lehet szólítani.
 * Kevés további felhasználó ad hozzá e-mail címet, aki a fiók létrehozása során nem adott hozzá. A számok elég nagyok ahhoz, hogy a lehetőség produktív legyen (6% koreaiul és 7% csehül), de elég kicsik ahhoz, hogy jobb felhívásokat fontolgassunk az e-mail cím hozzáadásának ösztönzésére.

Háttér
A felmérés eredeti motivációja az volt, hogy olyan információkat gyűjtsünk a felhasználókról, melyeket felhasználhatunk a felhasználói élmény személyre szabásához. Itt arról lehet olvasni, hogy mik a gondolataink arról, hogy miként lehet ezeket az adatokat a projekt következő fázisában felhasználni.

A telepítést követő négy hét alatt a felmérést a cél-wikikben új fiókot regisztráló felhasználók véletlenszerűen kiválasztott 50%-ának mutattuk meg (vagyis nem mutattuk meg azoknak a felhasználóknak, akiknek már van fiókjuk egy másik wikin, az úgynevezett "automatikusan létrehozott felhasználóknak"). Ezt a felmérési csoport és a kontrollcsoport közötti A/B tesztet azért választottuk, hogy megállapíthassuk, hogy a felmérés hatására a regisztrációt követő 24 órán belül alacsonyabb lesz-e azoknak a felhasználóknak az aránya, akik az első szerkesztést elvégzik (amit mi "szerkesztő-aktiválásnak" nevezünk). A kísérlet eredményeinek elemzése hamarosan elkészül.

A felmérés kinézetének és a benne szereplő kérdéseknek a gyors áttekintése egy mockup formájában itt érhető el. A felmérés cseh és koreai nyelven jelenik meg az adott wikikben.

Válaszadási arány
A cseh Wikipédián 669 felhasználónak, a koreai Wikipédián pedig 836 felhasználónak mutattuk meg a felmérést. Amikor a felhasználó megkapja a felmérést, egy sor kérdést kell kitöltenie, melyek mindegyike opcionális. Ezt követően a "Befejezés" gombra kattintva elküldhetik a felmérést (még akkor is, ha egyetlen kérdésre sem válaszoltak), a "Hagyd ki ezt a felmérést" gombra kattintva elvethetik válaszaikat, vagy más, az oldalt vagy a webhelyet elhagyó műveletet végezhetnek, például rákattinthatnak egy linkre a bal oldali navigációban vagy bezárhatják a lapjukat. Ez utóbbi műveletet "elhagyásnak" nevezzük. A két wiki esetében az ilyen műveletek közötti megoszlás a következő:

Az 1. táblázat azt mutatja, hogy a legtöbb felhasználó kitöltötte a kérdőívet, ami nagyszerű! Amint alább látni fogjuk, a szerkesztők a kérdéseinkre is válaszoltak (ahelyett, hogy válaszok nélkül küldték volna be a felmérést). Az abbahagyási arány meglehetősen magasnak tűnik, és először aggódtunk, hogy ez azt jelenti, hogy a felmérés miatt a szerkesztők teljesen elhagyják a weboldalt, ami nem lenne célravezető eredmény. Hogy ezt megvizsgáljuk, a csapatunk "Az első nap megértése" projektje által rögzített adatokat vizsgáltuk, mely adatokat gyűjt arról, hogy az új szerkesztők mit néznek meg az első 24 órában. Megállapítottuk, hogy a csehek esetében mindössze 47 felhasználó (7,0%) hagyta el az oldalt, míg a koreaiak esetében ez az arány 99 felhasználó (11,8%) volt. Mindkét arány a küszöbértékek alatt van, melyeket a felmérés megváltoztatására vagy kikapcsolására vonatkozóan határoztunk meg. Erre a kérdésre meggyőzőbb választ kapunk, amikor elemezzük a kontrollcsoportban a fiók létrehozása után az oldal elhagyásának arányát.

A válaszadási arányokat aszerint is fel lehet osztani, hogy a fiókot az asztali vagy a mobil oldalon hozták-e létre, de úgy találjuk, hogy az arányok általában hasonlóak.

Miért regisztráltál ma?
Miért regisztráltál ma?


 * Egy Wikipédia-szócikkben lévő elírás vagy hiba javítása érdekében
 * Információ hozzáadása egy Wikipédia-szócikkhez
 * Új Wikipédia-szócikk létrehozása
 * Wikipédia olvasása
 * Egyéb (kérjük, írd le)

Az első kérdésünk arra kérdez rá, hogy a felhasználó miért regisztrált, és több lehetőséget ad meg, valamint egy "Egyéb" opciót, ahol a szerkesztőnek egy szövegmezőt adunk a további magyarázatra. A két célnyelvi Wikipédia esetében a válaszok a következőképpen alakulnak, az arányok az egyes nyelveken válaszolók számán alapulnak:

Az első dolog, amit talán észre lehet venni, hogy a leggyakoribb opció különbözik a két nyelv között. Cseh nyelven a válaszadók 32,6%-a választja az új szócikk létrehozását, míg Koreában az olvasást (28,8%). Mindkét nyelven a másik lehetőség a harmadik a listán, az olvasást a cseh válaszadók 17,5%-a, az új szócikk létrehozását pedig a koreai válaszadók 19,7%-a választotta. Érdekes tanulság, hogy a Wikipédia olvasása sok szerkesztő regisztrálását motiválja, mivel a fiók megléte nem változtatja meg lényegesen az olvasás élményét. Ez utalhat a profil létrehozásával kapcsolatos téves felfogásra, de egyben lehetőséget is jelenthet a felhasználók, mint olvasók és potenciális szerkesztők bevonására.

Az információ hozzáadása egy szócikkhez mindkét nyelven következetesen a második lehetőség, és hasonló, 25% körüli arányban. Ugyanez vonatkozik a helyesírási hiba vagy elírás kijavítására is, mely a válaszok 17%-ával következetesen a negyedik helyen áll a listán.

Szerkesztetted már valaha a Wikipédiát?
Szerkesztetted már valaha a Wikipédiát?


 * Igen, sokszor
 * Igen, egyszer vagy kétszer
 * Nem, nem tudtam, hogy szerkeszthetem a Wikipédiát
 * Nem, egyéb okok miatt
 * Nem emlékszem

A második kérdés arra kérdez rá, hogy a szerkesztő szerkesztette-e már korábban a Wikipédiát, és öt lehetséges választ sorol fel. Egyes felhasználók a felmérést e kérdés megválaszolása nélkül is elküldik. Az alábbi 3. táblázat áttekintést ad a válaszokról, és az arányok ismét a felmérésre adott válaszok teljes számán alapulnak. Mindkét nyelven azt látjuk, hogy a "Nem, nem tudtam, hogy szerkeszthetem a Wikipédiát" a leggyakoribb válaszlehetőség, és hogy a válaszadók többsége azt mondja, hogy még nem szerkesztette korábban a Wikipédiát (mindkét "nem" opciót kombinálva: cseh: 50,5%; koreai: 63,2%). Ami a "Nem, nem tudtam, hogy szerkeszthetem a Wikipédiát" választ illeti, logikus, hogy sokan ezt a választ adják, tekintve, hogy hányan mondják, hogy olvasás céljából regisztrálnak. De mi is meglepődtünk, hogy ez a szám ilyen magas lett. Az egyik hipotézis az, hogy a kérdést a különböző válaszadók eltérő módon értelmezhetik. Az egyik lehetséges értelmezés a következő: "Nem, nem tudtam, hogy szerkeszthetem a Wikipédiát, amíg ez a felmérési kérdés rá nem mutatott erre", a másik pedig: "Nem, nem tudtam, hogy nemrég még szerkeszthettem a Wikipédiát, de miután rájöttem, hogy igen, úgy döntöttem, hogy regisztrálok". Többet fogunk megtudni erről a kérdésről, amint kereszttáblákat készítünk a többi kérdéssel szemben, és a jövőben fontolóra vehetjük ezeknek a válaszoknak az egyértelműbb megfogalmazását.

Érdemes megjegyezni azt is, hogy a válaszok sorrendje mindkét nyelven ugyanaz, és eltér attól a sorrendtől, ahogyan a lehetőségek a felhasználónak megjelennek. Ez azt jelenti, hogy a válaszadók válaszadáskor nem egyszerűen a lista első válaszát választották, hanem aktívan tudatják velünk, hogy korábban még nem szerkesztették a Wikipédiát.

Jelölj ki néhány témát, melyet szerkeszteni szeretnél
''Az emberek szerkeszthetik a Wikipédia szócikkeit olyan témákban, melyek érdeklik őket. Az alábbiakban felsorolunk néhány olyan témát, melyek szerkesztése népszerű. Válassz ki néhány témát, amit szerkeszteni szeretnél:''

Kifejezetten jelölőnégyzetként szerepel: Művészetek, Tudomány, Földrajz, Történelem, Zene, Sport, Irodalom, Vallás, Népi kultúra.

A legördülő menüből választható: Szórakozás, Ételek és italok, Életrajz, Katonai, Közgazdaságtan, Technológia, Film, Filozófia, Üzlet, Politika, Kormányzat, Mérnöki tudományok, Kézművesség és hobbi, Játékok, Egészségügy, Társadalomtudomány, Közlekedés, Oktatás.

A felmérés harmadik része arra kéri a válaszadókat, hogy válasszanak ki néhány témát, melyet esetleg szerkeszteni szeretnének. Kilenc téma jelölőnégyzetként jelenik meg, további tizennyolc téma pedig akkor jelenik meg, ha a felhasználó rákattint a mezőre vagy beírja azt. A mező szabadon kitölthető, így a válaszadók további témákat adhatnak hozzá. A válaszadók annyi témát választhatnak és adhatnak hozzá, amennyit csak akarnak.

Ez az elemzés csak a javasolt témákra terjed ki. A jövőbeni elemzések a felhasználó által megadott témákkal fognak foglalkozni, melyek elemzéséhez fordításra van szükség. Az alábbiakban nyelvenként egy-egy táblázatot mutatunk be. A táblázat azonosítja, hogy a felhasználó milyen módon választhatja ki a témát: "checkbox", azaz a kilenc jelölőnégyzet egyike; "prefilled", azaz a tizennyolc előre kitöltött téma egyike, ami a szabadon kitölthető mezőben található; vagy "other", azaz a válaszadó által hozzáadott téma.

We can see that the dominating topics are all the ones listed in the checkboxes. The least frequent checkbox is selected by 20.8% of respondents, while the most frequent topic in the free-form field is only chosen by 3.5% of respondents. It is noteworthy that respondents are selecting multiple topics, as opposed to just one.

Hasonló tendenciát látunk Koreában is, mint a cseh esetében: a témák kiválasztásakor a jelölőnégyzetek dominálnak, bár a legkevésbé népszerű jelölőnégyzet és a legnépszerűbb előre kitöltött téma közötti különbség kisebb (11,0%) Koreában, mint Csehországban (17,3%).

Szeretnéd, ha felvennénk veled a kapcsolatot, hogy segítsünk a szerkesztésben?
''Fontolgatjuk egy program indítását tapasztaltabb szerkesztők számára, hogy segítsenek az új szerkesztőknek a szerkesztésben. Szeretnéd, ha felvennénk veled a kapcsolatot, hogy segítsünk a szerkesztésben?''

Azt tapasztaljuk, hogy mindkét nyelven meglepően sok felhasználó érdeklődik a kapcsolatfelvétel iránt. A cseh nyelven 164 felhasználó (az összes válaszadó 36,4%-a) és a koreai nyelven 273 felhasználó (52,7%) válaszolt igennel erre a kérdésre. Ez azt jelenti, hogy az új szerkesztők körében egyértelműen van érdeklődés a Wikipédia szerkesztéséhez szükséges segítség iránt, és hogy ez egy potenciális helyszín a közösségi elérés számára. Amikor mélyebben beleássuk magunkat a felmérés válaszaiba, az erre a kérdésre adott válaszokat is össze fogjuk hasonlítani arra a kérdésre adott válasszal, hogy a felhasználó szerkesztett-e már Wikipédiát, valamint azzal, hogy miért regisztrált.

E-mail cím hozzáadása
Azok a felhasználók, akik nem adták meg e-mail címüket az első fiók létrehozásakor, kapnak egy második lehetőséget arra, hogy a felmérésben megadják e-mail címüket. Úgy találjuk, hogy nagyon kevés felhasználó teszi ezt meg: a cseh Wikipédián mindössze 13, a koreai Wikipédián pedig 20 felhasználó. Ez a cseh felhasználók 6,5%-ának felel meg, akik még nem rendelkeztek e-mail címmel, mikor a kérdőívet megmutattuk, valamint a koreai felhasználók 5,7%-ának.

Ismételt felmérési válaszok
Bár erre nincs kifejezett munkafolyamat, a felhasználók többször is részt vehetnek a felmérésben, ha újra meglátogatják a felmérés URL-címét. Csak a legfrissebb válaszaikat tároljuk, ami azt jelenti, hogy úgy tekintjük, hogy a legutóbbi válaszuk pontosan tükrözi az érdeklődési körüket és véleményüket. Ugyanakkor azt is tároljuk, hogy hányszor válaszoltak/kihagyták. Az alábbi 8. táblázat azt mutatja, hogyan oszlik meg a válaszok száma, ahol az arány az összes olyan felhasználóhoz viszonyítva van megadva, akik vagy elmentették vagy kihagyták a felmérést. Láthatjuk, hogy viszonylag ritkán fordul elő, hogy a felhasználók többször is részt vesznek a felmérésben, és ha valaki mégis megteszi, akkor jellemzően csak egy alkalommal. Ez azt jelenti, hogy kevés okot látunk arra, hogy a válaszokat elvetjük, ha a felhasználók többször is részt vesznek a felmérésben, és esetleg megváltoztatják a válaszaikat.

Épelméjűség-ellenőrzés
Különböző hitelességi ellenőrzéseket is lefuttattunk az adatainkon, hogy megbizonyosodjunk arról, hogy a dolgok megfelelően működnek. Például kiszámítottuk a felmérési és a kontrollcsoportba sorolt felhasználók eloszlását, melynek ideális esetben 50/50 arányban kellene lennie. Kiderült, hogy ez így is van, összességében a cseh Wikipédián az arányok 49,7%/50,3% felmérés/kontroll, a koreai Wikipédián pedig fordítva. Találunk némi eltérést, amikor a fiókokat asztali és mobilról történő regisztrációkra osztjuk (pl. hogy egyes esetekben 47/53), de nem eléggé ahhoz, hogy aggodalomra adjon okot, hogy a randomizálás kiegyensúlyozatlan vagy elfogult csoportokat eredményezett.

A jelentésen való munka során még nem vizsgáltuk meg alaposan az adatokat annak megállapítására, hogy a válaszok a valóságnak megfelelnek-e. Ha például egy felhasználó azt válaszolja, hogy nem tudta, hogy szerkesztheti a Wikipédiát, de azt is állítja, hogy sokszor szerkesztette már a Wikipédiát, akkor valószínűleg el kell vetnünk a válaszait minimum mindkét kérdésre, esetleg az egész felmérésre. Ezt tudomásul vesszük, és a közeljövőben a felmérés eredményeinek alaposabb vizsgálata keretében meg is fogjuk tenni.

Jegyzetek


A. függelék: A regisztrációkor hozzáadott e-mail
Hogyan határoztuk meg, hogy hány felhasználó nem adott meg e-mail címet a regisztrációkor, hogy ki tudjuk számítani ezt az arányt? Ez nem egyszerű, mert a MediaWiki adatbázis nem tárolja az időbélyeget arról, hogy egy felhasználó mikor adta meg az e-mail címét, és nincs olyan EventLogging séma sem, mely az ilyen jellegű információk naplózására szolgálna. Az egyetlen információ az adatbázisban, ami összefüggőnek tűnt, az az ellenőrző token lejárati időbélyege, melyet e-mailben kap a felhasználó, amikor megadja az e-mail címét.

Megvizsgáltuk a fiókregisztráció és az ellenőrző token lejáratának időbélyegei közötti különbséget a 2018. január 1. és július 1. között regisztráltak esetében mindkét Wikipédián, és megállapítottuk, hogy ez jellemzően valamivel több mint hét napra van beállítva. Mennyivel több az a "valamivel több"? Az esetek túlnyomó többségében kevesebb, mint tíz másodperc, ami szerintünk a rendszer által a fiók létrehozása és az azt követő, az ellenőrző token e-mailben történő elküldése közötti késleltetés (ekkor a lejárati időbélyegző "hét nap múlva" értékre van beállítva). Ezért egy egyszerű heurisztikát alkalmaztunk annak meghatározására, hogy a felhasználó a regisztrációkor megadott-e e-mailt: ez akkor történt meg, ha a két időbélyegző közötti különbség kisebb, mint "egy hét + tíz másodperc".

Egy másik dolog, amit figyelembe kell vennünk, hogy nincs információnk arról, hogy a felhasználó a regisztrációkor megadta-e az e-mail címét, de aztán úgy döntött, hogy törli azt. Ez azt jelenti, hogy a statisztikánkban úgy fog megjelenni, mint "nem adott meg e-mail címet a regisztrációkor". Úgy döntöttünk, hogy azt állítjuk, hogy ez ritkán fordul elő, mivel december 19-én a január 1. és július 1. közötti cseh regisztrációk 64%-a és a koreai regisztrációk 75%-a "nem rendelkezett" ellenőrzött e-mail címmel. Ez azt sugallta számunkra, hogy a felhasználók nagy valószínűséggel vagy olyan e-mail címet adnak meg, amelyet nem ellenőriznek, vagy nem igazán törődnek az e-mail ellenőrzéssel, ami azt jelenti, hogy valószínűleg nem is törlik az e-mail címüket.

Végül, a fenti "hozzáadott e-mail" szakaszban szereplő arány nem azon a felső határon alapult, hogy a regisztráció után milyen gyorsan adhatja hozzá egy felhasználó az e-mail címét. Ez azt jelenti, hogy azoknak a felhasználóknak, akik a felmérést röviddel a telepítés után vették fel, több idejük volt arra, hogy megadják a címüket. A jövőbeni számításokban lesz egy határérték (pl. egy hét), de addig is azt állítjuk, hogy ha még nem adtak meg nekünk címet, akkor nem valószínű, hogy visszatérnek, hogy ezt megtegyék (más szóval, hogy viszonylag valószínűtlen, hogy egy felhasználó a regisztráció után hozzáad egy e-mail címet).