Equivset
Equivset est une bibliothèque pour la détection visuelle de caractères UTF-8 similaires.
Equivset est conçue pour empêcher des abus à travers l'imitation de mots et se concentre principalement sur les lettres et la ponctuation (pas d'emojis ou autres symboles). Elle contient des connections de caractères visuellement identiques des caractères unicode prêtant à confusion comme le latin "A" et le grec "Α" (alpha), tout comme des connections supplémentaires entre caractères visuellement similaires comme "S" et "$"(symbole dollar).
Elle est utilisé dans Wikimédia dans les logiciels AntiSpoof et AbuseFilter pour déterminer si deux caractères sont visuellement similaires.
Données
La bibliothèque fournit sa base de données d'ensembles d'équivalence de caractères en format JSON standard et texte clair (parcourir les fichiers)
Elle fournit également une bibliothèque d'accès pour PHP.