Jump to content

Equivset

From mediawiki.org
This page is a translated version of the page Equivset and the translation is 58% complete.

Equivset est une bibliothèque pour la détection visuelle de caractères UTF-8 similaires.

It is similar to the Unicode Consortium's confusables.txt but has some significant differences. confusables.txt lists character pairs that are visually identical or nearly identical, for example, Latin "A" and Greek "Α" (alpha). Equivset, on the other hand, is much broader, including pairs that merely look similar, for example, "S" and "$". Another difference is that equivset only includes letters and punctuation. It does not include symbols, emoji, or graphical elements.

Elle est utilisé dans Wikimédia dans les logiciels AntiSpoof  et AbuseFilter pour déterminer si deux caractères sont visuellement similaires.

Données

La bibliothèque fournit sa base de données d'ensembles d'équivalence de caractères en format JSON standard et texte clair (parcourir les fichiers)

Elle fournit également une bibliothèque d'accès pour PHP.

Liens externes