CAPTCHA/it

I CAPTCHAs (abbreviazione di "'Completely Automated Public Turing test to tell Computers and Humans A''part") sono utilizzati sulle wiki di Wikimedia, tramite l'estensione, come mezzo per prevenire lo spam e scoraggiare gli spammer. Nella maggior parte delle wiki, un utente può trovarsi di fronte a un CAPTCHA quando cerca di creare un account, di creare una nuova pagina o di aggiungere un link esterno a una pagina.

Su pt.wiki, tra il 2008 e il 2013 il CAPTCHA è stato anche usato "temporaneamente" su ogni modifica di utenti non registrati e nuovi, in modo da ridurre il vandalismo (vedi discussione e 41745).

L'attuale implementazione del CAPTCHA presenta una serie di problemi.


 * Sono disponibili solo in inglese (5309): le parole utilizzate dai nostri CAPTCHA, comunque siano creati, dovrebbero essere nella lingua dell'utente. Un numero imprecisato di nuovi utenti e di modifiche viene perso da persone che non parlano inglese.
 * Violano i principi di accessibilità (4845).
 * Non impediscono efficacemente ai bot di fare spam.



Alternative che potrebbero essere implementate in futuro


Immagini CAPTCHA
Le immagini Captcha non richiedono l'inserimento di testo, il che è utile per i dispositivi mobili e per i problemi di internazionalizzazione. Alcune idee basate sulle immagini:


 * Trova quella differente (view prototype) Vengono mostrate diverse immagini della stessa categoria (per esempio, persone) mescolate con un'immagine di una categoria diversa (per esempio, gatti). Un umano dovrebbe essere in grado di riconoscere quella diversa. Note that in this case, the question is always the same (find the different one) and the categories used are not exposed to the user.
 * Find all images of a kind (view prototype). Images from two or more categories are presented together. The user is explicitly asked to find all the images of a given type (e.g., all images of people wearing glasses).
 * Tag images (view prototype). The user is presented with images that contain some tagged elements and options to pick the correct tag (e.g., is it a bird? is it a plane?).

The hard part here is how to create images and verify data in a way that is not exploitable to spambots. You need a very large set of CAPTCHAs (hundreds of thousands, ideally), otherwise an attacker can just map your CAPTCHA database. If you use a public image repository (such as Commons) or a public data source (such as Commons categories), chances are an attacker can match the CAPTCHA to the source and figure out the solution from that.

Replacing CAPTCHA with a honeypot
One possibility for avoiding localizations issues with the CAPTCHA is simply to remove it and replace it with a honeypot.

A homegrown reCAPTCHA clone
Write a version of reCAPTCHA that uses document images that have been processed by MediaWiki's ProofreadPage extension for Wikisource: WikiCAPTCHA. In other words, a CAPTCHA that feeds data to ProofreadPage to augment its OCR processing. You might build on [//github.com/CristianCantoro/wikicaptcha existing code]. It is worth noting that "reCAPTCHA hold no specific patents for the technology behind their text CAPTCHA algorithms (At least none they discuss on their website or are able to be found on the US Patents & Trademark Office site", according to one blogger ).

Also discussed at Wikimania 2012 with the presentation Wikicaptcha: a ReCAPTCHA-like solution for Wikisource

The advantage of this approach is that we can make the latent work force currently wasted in CAPTCHA into profit for a Wikimedia project (Wikisource); and that we can start with a limited data set. In fact, working the reCaptcha way we could create some sort of bootstrap data set, then show people a mix of captchas with known and unknown solutions, and use the known ones for verification and the unknown ones for generating more data. But that is not easy and should get significant focus in the project if you want a CAPTCHA system which is of any practical use at the end.

Accessibility
The accessibility of our current CAPTCHA is extremely bad. If the user has impaired eyesight or uses a screenreader the text-based CAPTCHA is almost entirely inaccessible to them. A handful of our larger wikis solve this via a volunteer-run account request system. Alternatives like image CAPTCHAs still violate accessibility principles (4845), so an alternative such as an audio CAPTCHA should be considered.