ORES/relecture de BWDS

From mediawiki.org
This page is a translated version of the page ORES/BWDS review and the translation is 100% complete.

Cette page donne un bref aperçu sur la manière de trier une liste générée de gros mots (bad words).

Comment fonctionne BWDS ?

BWDS parcourt l'historique du wiki pour trouver les mots le plus souvent ajoutés dans les modifications annulées (reverted), et qui sont plutôt rares dans les modifications acceptées. Cela signifie que le système tend à choisir les jurons et les mots informels que l'on ne trouve pas dans les articles (« con », « prout » , « shit » , etc...). Le système génère aussi des mots communs à toutes les modifcations parce qu'ils peuvent être utilisés en tant que mots d'arrêt (stopwords) lors du traitement du texte.

Comment trier

BWDS génère une page wiki qui inclue des listes de mots générés automatiquement. Voir par exemple la recherche des listes de mots en français. Nous avons besoins de personnes dont la langue cible est la langue maternelle pour nous aider à trier ces listes et supprimer les mots qui auraient été référencés par erreur.

liste générée
Cette liste comprend les mots ajoutés dans les modifications annulées. Cette liste est séparée en deux : une liste pour les gros mots (insultes, vulgarismes...) et une liste pour les mots informels (acceptés sur les pages de discussion mais pas dans les articles: Hello, haha ...)
liste d'arrêt
Cette liste inclut les mots communs à toutes les modifications. Elle ne nécessite pas de relecture par un humain et peut être ignorée.
gros mots
Elle comprend tous les mots de la liste générée indésirables quelque soit la page. Cela comprend les jurons, le pourriel et autres contenus qui seront annulés quelque soit l'endroit où ils apparaissent. N'hésitez pas à compléter cette liste avec d'autres gros mots qui ne seraient pas détectés par BWDS.
informels
Cette liste doit contenir tous les mots indésirables dans l'espace de noms des articles mais acceptables sur les pages de discussion. Ce sont par exemple "hello" ou "hahaha" qui sont normaux dans les discussions mais pas dans les articles. N'hésitez pas à compléter cette liste avec d'autres mots informels qui n'auraient pas été détectés par BWDS.

Où trouver ma liste BWDS ?

Nous avons pré-généré des listes sur beaucoup de gros wikis. Relisez nos listes de mots pour voir si une liste existe déjà pour votre wiki. Si ce n'est pas le cas, utilisez le bouton ci-dessous pour demander que cette liste soit générée. Voir aussi comment obtenir du support.