Growth/Understanding first day/hu

Ez az oldal a Növekedési csapat „az első nap megértése” (más néven „szerkesztői életpálya”) projekten végzett munkáját írja le, és tartalmazza annak céljait, terveit, döntéseit és eredményeit. A legtöbb fokozatosan érkező újdonságot az általános a Növekedési csapat újdonságai oldalon, néhány nagyobb vagy részletesebb újdonságot pedig itt tesszük közzé.

Mivel ez a projekt teljesen a monitorozásról és mérésről szól, a WMF több csapata is részt vesz benne és alakítja, beleértve a jogi, biztonsági, elemző mérnök és termékelemző csapatot is. Fontos mindannyiunk számára a felhasználók személyiségi jogainak tiszteletben tartása, miközben folyamatosan tanulunk arról, mit kell még megtanulnunk a felhasználói élmény javítása érdekében. Mivel fokozatosan közelítjük a legjobb utat ennek elérésére, az ezen az oldalon leírt tervek változni fognak.

Jelenlegi állapot

 * 2018-11-19: a szerkesztői életpálya moduljának telepítése a cseh és a koreai Wikipédián.
 * 2019-01-15: A szerkesztői életpálya adataiból készített előzetes beszámoló itt érhető el.
 * 2019-01-16: a szerkesztői életpálya moduljának telepítése a vietnámi Wikipédián.
 * 2019-07-01: a szerkesztői életpálya moduljának telepítése a cseh és az arab Wikipédián.
 * 2020-07-16: úgy döntöttünk, hogy leállítjuk az EditorJourney telepítését új wikikre, mert befejeztük az általa generált adatok elemzését, és nem szeretnénk a szükségesnél több felhasználói adatot tárolni.

Összefoglalás
A legtöbb felhasználó, aki regisztrál, sosem végez szerkesztést, de azok, akik szerkesztenek, általában a regisztrációjukat követő első napon belül teszik azt. Nem sokat tudunk arról, hogy az új profilok tulajdonosai mit csinálnak a profiljuk létrehozását követő első napon - elolvassák-e a súgó tartalmát, megpróbálnak-e szerkeszteni, de nem teszik közzé, vagy valami más. Ha többet tudunk ezekről a kezdeti szerkesztésekről, az segíthet nekünk abban, hogy jobbá tegyük a felhasználói élményt, és hogy az új szerkesztők közül többen végezzék el a szerkesztést az első napon. Ahhoz, hogy megértsük, mit csinálnak az új regisztrált felhasználók az első napjukon, a cseh és a koreai Wikipédia új felhasználói élményét vizsgáltuk, hogy választ kapjunk ezekre a kérdésekre:


 * Mik a leggyakoribb folyamatok, amiken a cseh és a koreai új regisztráltak átmennek az első 24 órájuk során?
 * Az újonnan regisztráltak mekkora része megy át ezen folyamatok valamelyikén?
 * Mely folyamatok vezetnek és melyek nem vezetnek el az újonnan regisztráltak szerkesztéséhez?

A Növekedési csapat azon dolgozik, hogy megtalálja a választ ezekre a kérdésekre a célwikik (cseh, koreai és vietnámi Wikipédia) minden új felhasználójának első 24 órás időtartamára vonatkozó eseménynaplózás bevezetésével. Az új felhasználók élményeinek világos megértéséhez tervezzük továbbá, hogy összekapcsoljuk és felhasználjuk a már létező eseménynaplózási törekvések adatait is, például a visszhang (Echo), a vizuális szerkesztő (Visual Editor) vagy a vezetett túra (Guided Tour) esetén. Ez a lehetőség először 2018 novemberében vált elérhetővé a cseh és koreai Wikipédián, és egy előzetes beszámolót 2019 januárjában tettünk közzé róla.

Az erről a projektről szóló eredeti közösségi megbeszélés itt érhető el.

Miért van ez a projekt előnyben részesítve
Kutatásunk során sokat tanultunk az új szerkesztők motivációiról és igényeiről, és az egyik legfontosabb dolog, amit megtanultunk, hogy az új szerkesztők legelső szerkesztési tapasztalatai döntőek lehetnek abban, hogy folytatják-e a szerkesztést. A legtöbb ember, aki regisztrál a Wikipédián, soha nem szerkeszt, de azok közül, akik mégis, a szerkesztés általában a fiók létrehozásának napján történik. A "Személyre szabott első nap" projekttel együtt ez a projekt kulcsfontosságú a szerkesztési kísérletek első pillanatairól való tanulásunk folytatásához. Több információt kell szereznünk arról, hogy az új szerkesztők hogyan közelítik meg az első szerkesztésüket, hogy tudjuk, hol tudunk bekapcsolódni és segíteni. Például, ha azt látjuk, hogy sok új szerkesztő olvassa a súgó tartalmát, de aztán nem próbálkozik szerkesztéssel, akkor arra következtethetünk, hogy a súgó tartalma fontos, de a jelenlegi megfogalmazásában és megjelenítésében "nem hasznos". Vagy ha azt látjuk, hogy sok új szerkesztő egyenesen a szerkesztő megnyitásáig megy, de aztán távozik, mielőtt elmentené a szerkesztést, akkor arra a következtetésre juthatunk, hogy a legfontosabb hely a segítség nyújtására a szerkesztési élmény "belseje".

Ezt a projektet azért helyeztük előtérbe, mert:


 * Segítségével növelhetjük a tanulást a csapatunk új szerkesztőkkel való munkájának e korai szakaszában.
 * A közösségi tagok pozitívan nyilatkoztak az ötletről.
 * Ez megteremti az alapot ahhoz, hogy kiderüljön, vajon az új szerkesztők viselkedését megváltoztatjuk-e a változtatásokkal, amiket az új szerkesztői élményben eszközölünk.
 * A jövőben könnyen lefordítható és más wikikre is alkalmazható lesz.

Specifikációk
This section contains the evolving plans for measurement.

Overall parameters

 * Will apply to all new accounts created in Czech and Korean Wikipedias, but will exclude auto-created accounts from other wikis.
 * Will be active for the first 24 hours of the existence of a new account.
 * At the user level, will record visits to pages in namespaces where new editors might be seeking help, such as the Help, Wikipedia, or User namespaces (and their associated Talk spaces).
 * For pages in more sensitive namespaces, such as Article, Draft, or Portal, will record only that the namespace was visited, not the specific page title.
 * Data will only be available to people with NDA access.
 * Data will be anonymized, deleted, and/or aggregated after 90 days.

Specific questions
The outline below lays out the specific questions we want to answer with this instrumentation effort. Most of these questions will be answered with the new EditorJourney EventLogging schema being built for this project. Some questions, especially those under #4 ("After the editing experience begins") will be answered by connecting with existing EventLogging schemas built to measure existing features.


 * 1) Context: How often do accounts get created from the different possible account creation contexts?
 * 2) * Homepage
 * 3) * Reading experience
 * 4) * Editing experience
 * 5) Survey: When shown the “Personalized first day” survey right after account registration, do users respond to one or more questions in the survey, or skip the survey altogether and go back to what they were doing prior to account registration?
 * 6) After account creation, what are the various common workflows that new account holders go through before making an edit (or before never making an edit)? We want to count the frequency of workflows such as, but not limited to, the following. The reason it’s “not limited to” is that we don’t yet know which workflows we will discover.
 * 7) *Reading articles first: reading many pages in the Article namespace and then either leaving or editing.
 * 8) * Learning first: Consuming some sort of learning content and then either leaving or editing. This content is found in namespaces other than Article namespace, or through certain actions that may not be captured in page views or existing schemas:
 * 9) ** Viewing content in the Help, Wikipedia, or User namespaces (among others), including help desks
 * 10) ** Clicking on a link in a welcome message on their own user talk page
 * 11) ** Opening and reading notifications
 * 12) ** Opening and updating account settings/preferences
 * 13) ** Verifying or adding/updating email address.
 * 14) * Straight to editing: going straight to editing without reading many articles or any learning content
 * 15) ** This can either happen because the account was created from the editing experience, or the reader opened the editor from the reading experience soon after account creation.
 * 16) ** Is this the creation of a new page?
 * 17) ** When opening the editor, some wikis display a GuidedTour or GettingStarted. Did the user click on anything in GuidedTour or GettingStarted?
 * 18) * Any combination of the above, such as a workflow in which users read some articles, followed by reading a help page, followed by starting and abandoning an edits, followed by a successful edit.
 * 19) After the editing experience begins, what percent of users successfully save an edit? And for those who abort their edits, what do they do in the editor before aborting?
 * 20) * On what page is the attempted edit happening?
 * 21) * How often do users quickly exit the editor without actually interacting with the page?
 * 22) * How often do users do a substantial amount of interaction with the page before aborting?
 * 23) * How often do users switch the type of editor?
 * 24) * If the edit was saved, how many bytes changed in the edit?
 * 25) * Was the resulting edit reverted or thanked?
 * 26) After saving or aborting an edit, what happens next? (Return to Step 3).

Other schemas
This is a list of some of the other EventLogging schemas we may use to enrich the picture of what new account holders do in their first hours on the wiki:


 * ServerSideAccountCreation
 * Echo
 * EchoInteraction
 * PrefUpdate
 * EditAttemptStep
 * VisualEditorFeatureUse
 * Page creation
 * GettingStartedRedirectImpression
 * GuidedTourButtonClick
 * GuidedTourExited
 * GuidedTourExternalLinkActivation
 * GuidedTourGuiderHidden
 * GuidedTourGuiderImpression
 * GuidedTourInternalLinkActivation

User flows
In planning out this project's measurement and analysis needs, our team's designer assembled some visual user flows that help us chart out the journey of new users during their first hours in the wiki. As it says in the slides linked below: "The following user flows document the various pathways newly created Wikipedia accounts can take to become a newly 'activated' editor (after making a first edit), to being retained (2nd edit), through to 'survival' (3rd edit within first 6 weeks). The diagrams note the desired data to be captured at each user interaction, with the intention to both help the Growth team identify the various points for instrumentation, as well as helping visualize the funnel of New Editor retention." Though the flows extend our thinking to multiple edits in a new user's journey, we have since decided to constrain our measurement to just their first day.

The full slide deck is here, and also linked on this Phabricator task. At right is the image of the full user flow, which is the main slide from the slide deck. Please note that these are presented as an artifact of our team's thinking, but are no longer being updated as our approach continues to evolve. The Specifications section above reflects the current approach.

Analysis
Because the EditorJourney data records much detail on what newcomers do on their first day, we'll be able to ask and answer many questions using the dataset. In this sense, our analysis will never be complete, and we can always use the dataset to answer additional questions about newcomers. This section lists the analyses that have been completed. Community members should feel free to translate any of these reports into their languages. Future analyses will continue to address the list of questions in the "Specifications" section above.


 * EditorJourney initial report: the first report using the EditorJourney dataset, addressing the questions of what context newcomers create their accounts from, and how many newcomers do which activities at some point on their first day. Some important toplines:
 * This data substantially clarifies our understanding of newcomers: many of them notice outreach, look for help content, and a majority of them open an editor. It's good news that so many are engaged and trying to succeed, and the clarity gives us opportunities to meet them where they are, so that when they go looking for something helpful, they find it.
 * Large numbers of users view help or policy pages on their first day: 41.5% in Czech and 27.8% in Korean.
 * Large numbers of users view their own User or User Talk page on their first day: 33.8% in Czech and 39.3% in Korean.
 * A majority of new users open an editor on their first day – but about a quarter of them do not go on to save an edit during that time.