Manual:Combating spam/cs

Stejně jako všechny současné dynamické webové stránky jsou wikis běžným cílem pro spammery, kteří chtějí propagovat produkty nebo webové stránky. MediaWiki nabízí řadu funkcí určených k boji proti vandalismu obecně. Na této stránce se konkrétně zabýváme wiki spamem, který je často automatizovaný.

Přehled
Běžné nástroje používané v boji proti spamu wiki obvykle spadají do těchto kategorií:


 * Vyžadování přihlášení a / nebo CAPTCHA u určitých operací, jako jsou úpravy, přidávání externích odkazů nebo vytváření nových uživatelů
 * Blokování úprav ze známých IP adres ze seznamu zakázaných nebo z adres IP, na nichž běží otevřené servery proxy
 * Blokování úprav, které přidávají konkrétní nechtěná klíčová slova nebo externí odkazy
 * Blokování specifických vzorů uživatelského jména a názvu stránky, které spamboty běžně používají
 * Blokování úprav novými nebo anonymními uživateli na konkrétních často cílených stránkách
 * Whitelisting (seznam povolených) známých editorů (jako jsou administrátoři, pravidelní přispěvatelé) a zároveň omezení pro nové nebo anonymní uživatele
 * Vyčištění skriptů nebo hromadné mazání stávajících příspěvků z nedávno zakázaných spambotů

Běžně se používá kombinace různých metod ve snaze udržet počet úprav spamu, robotů a otevřených proxy na minimu a zároveň omezit míru narušení způsobeného legitimním uživatelům webu.

Mnoho těchto funkcí není ve výchozím nastavení aktivováno. Pokud na serveru / hostiteli instalujete instalaci MediaWiki, pak jste jediný, kdo může provést potřebné změny konfigurace! V každém případě požádejte své uživatele o pomoc Pozor na spam Wiki (a udělejte to sami). V dnešní době může spam snadno přemoci malé komunity wiki. Pomáhá trochu zvýšit tlak. Také byste si měli uvědomit, že žádné z těchto řešení nelze považovat za zcela odolné proti spamu. Efektivní praxí je pravidelně kontrolovat „“ (Special:RecentChanges).

Nejrychlejší řešení nejprve vyzkoušejte
Boj proti spamu by neměl být příliš tvrdý. Pokud chcete rychle a výrazně omezit spam, zkuste nejprve tyto kroky.


 * Nainstalujte rozšíření StopForumSpam a zablokujte známé adresy IP spamu.
 * Nainstalujte a nastavte základní rozšíření antivandalismu (již bylo dodáno s poslední verzí), zejména.
 * Konfigurujtet QuestyCaptcha a v případě potřeby změňte výchozí nastavení pro vaši wiki.
 * Enable, can be used to block open proxies, Tor exit nodes or VPNs on specific actions like editing or account creation.

Pokud problémy přetrvávají, přečtěte si další část této stránky, kde najdete další řešení, a pošlete zprávu na mediawiki-l.

CAPTCHA
Jednou z běžnějších metod vyřazování automatických podání je použití CAPTCHA. Systému, který se snaží odlišit lidi od automatizovaných systémů tím, že požádá uživatele, aby vyřešil úkol, který je pro stroje obtížný. Rozšíření pro MediaWiki poskytuje rozšiřitelný rámec CAPTCHA, který lze spustit na řadě událostí, včetně


 * všech úprav
 * úprav přidávajících nové, nerozpoznané externí odkazy
 * registrace uživatele

Rozšíření se dodává se standardním testem, jedná se však o referenční implementaci a není určeno k produkčnímu použití. Operátorům Wiki, kteří instalují ConfirmEdit na veřejné wiki, se doporučuje používat jeden z modulů CAPTCHA obsažených v rozšíření (celkem jich je pět).

Nejodolnější CAPTCHA, které jsou dnes k dispozici, jsou vaše vlastní otázky QuestyCaptcha, pokud je přizpůsobíte pevně publiku vaší wiki a pravidelně je aktualizujete. ReCaptcha je v současné době poražen většinou spammerů ; Asirra CAPTCHA, která žádá uživatele, aby rozlišil kočky a psy, je pro uživatele obzvláště nepříjemná, ale může být účinná.

Je důležité si uvědomit, že CAPTCHA mohou blokovat více než nežádoucí roboty. Pokud skript není schopen projít CAPTCHA, pak to také může být čtečka obrazovky nebo jiný software nebo pomoc používaná nevidomými nebo zrakově postiženými. Jednou z možností v CAPTCHA, widgetu „reCAPTCHA“, je v takových případech alternativní zvukový CAPTCHA - ale někteří uživatelé počítačů selhávají při testech slyšení a čtení, takže to není úplně dobré řešení. Měli byste zvážit důsledky takové překážky a případně poskytnout alternativní prostředky pro postižené uživatele k vytváření účtů a přispívání, což je v některých jurisdikcích zákonný požadavek.

Also it will not completely spam-proof your wiki; according to Wikipedia "Spammers pay about $0.80 to $1.20 for each 1,000 solved CAPTCHAs to companies employing human solvers in Bangladesh, China, India, and many other developing nations." Z tohoto důvodu by měl být kombinován s jinými mechanismy.

rel="nofollow"
Ve výchozí konfiguraci MediaWiki přidává  k externím odkazům na wiki stránkách, což znamená, že jsou dodávány uživatelem. Mohou obsahovat spam. Proto by neměly být používány k ovlivňování algoritmů pro hodnocení stránek. Tento atribut ctí oblíbené vyhledávací nástroje, například Google.

Toto chování můžete vypnout na celém webu pomocí nebo na základě jmenného prostoru pomocí konfigurační proměnné.

Use of the  attribute alone will not stop spammers attempting to add marketing to a page, but it will at least prevent them from benefiting through increased page rank; we know for sure that some check this. Nonetheless, it should never be relied upon as the primary method of controlling spam as its effectiveness is inherently limited. It does not keep spam off your site.

See NoIndexHistory. Note that putting it on all external links is a rather heavy handed anti-spam tactic, which you may decide not to use (switch off the rel=nofollow option). See Nofollow for a debate about this. It's good to have this as the installation default though. It means lazy administrators who are not thinking about spam problems, will tend to have this option enabled. For more information, see Manual:Costs and benefits of using nofollow.

Rutina antispamu: opatření na míru
Každý spammer je jiný. I když všichni vypadají nudně podobně. Pokud obecná protiopatření nestačí, použijte před extrémními kroky nástroje, které vám umožní řešit konkrétní problémy, které máte.

Ochrana jednotlivých stránek
Spamboty často často opakovaně zasáhnou stejnou stránku. Běžné vzory pozorované u pagenů vytvořených pomocí spambotů zahrnují diskusní stránku, často mimo hlavní prostor (např. Category_talk: jsou málo používány, takže si vytvoří společné cíle) a další diskusní stránky

Nejvíce zneužívají úpravy na wiki, které nevyžadují k úpravám registraci. Pocházejí z anonymních zdrojů. Blokováním úprav na těchto konkrétních stránkách komukoli jinému než zavedeným uživatelům může zabránit opětovnému vytvoření spamových výpisů. Typically, any page which is already a regular visitor to special:log/delete on an individual wiki is a good candidate for page protection.


 * Semi-protection of individual pages.
 * In addition, this can be combined with changing the minimum requirements for MediaWiki to identify users as 'autoconfirmed'.
 * One may apply cascading protection to one or more pages that have links to the most frequently spammed pages. One can also use this trick to set up a handy list for use by admins.

Filtr zneužívání
(filtr zneužití) umožňuje privilegovaným uživatelům vytvářet pravidla zacílená na konkrétní typ spamu, který vaše wiki přijímá. Může pomoci automaticky zabránit akci nebo blokovat uživatele.

Může prozkoumat mnoho vlastností úprav. Například uživatelské jméno, věk uživatele, přidaný text, přidané odkazy atd. Nejúčinnější je v případech, kdy máte jednoho nebo více kvalifikovaných administrátorů, kteří jsou ochotni vám pomoci v boji proti spamu. Filtr zneužití může být účinný i proti spammerům podporovaným člověkem, ale vyžaduje nepřetržitou údržbu, aby reagoval na nové typy útoků.

Příklady boje proti automatickému spamu lze nalézt v Návod: Příklady boje proti spamu / Příklady filtru zneužití.

Seznam spamů (SpamBlacklist)
Výše uvedený přístup bude příliš těžkopádný, pokud se pokusíte blokovat více než hrst spamových adres URL. Lepším přístupem je dlouhá černá listina identifikující mnoho známých spamových adres URL.

Populární rozšíření pro MediaWiki je rozšíření, které blokuje úpravy, které přidávají URL na stránky do černé listiny. Sestavení takového seznamu na wiki umožňuje za pomoci privilegovaných uživatelů. Využívá seznamů získaných z externích zdrojů (ve výchozím nastavení) Používá rozsáhlou Černou listinu spamů.

Rozšíření (̝černá listina spamů) může být také užitečné, jako prostředek k zabránění opětovného vytvoření konkrétních skupin stránek, které používají 'bots k výpisu odkazových spamů.

Otevřené proxy
Otevřený server proxy je nebezpečný zejména proto, že se používá jako způsob, jak obejít protiopatření zaměřená na konkrétního narušitele; viz také Žádné otevřené servery proxy.

Existují někteří roboti, např. na Wikimedia wikis, detekující a blokující otevřené IP proxy. Jejich kód často není veřejný. Většina takových bloků, když si všimnete zneužití, se provádí ručně. Je proto důležité vědět, zda zneužívající IP je otevřený proxy server nebo něco jiného, aby se rozhodlo, jak se s tím vypořádat. Zejména, pokud se jedná o adresu IP používanou registrovaným uživatelem, získanou pomocí rozšíření.

Několik rozšíření, zejména rozšíření Tor block, blokuje řadu otevřených proxy serverů.

Od verze 1.22 je k dispozici, aby bloky byly účinnější.

Tvrdá opatření
Následující opatření jsou určena pro technicky zdatnější sysadminy, kteří vědí, co dělají. Je obtížnější je správně nastavit a sledovat. Pokud jsou implementovány špatně, mohou být příliš staré na to, aby byly stále efektivní, nebo dokonce mohou být pro vaši wiki kontraproduktivní.

$wgSpamRegex
MediaWiki poskytuje prostředky k filtrování textu úprav za účelem blokování nežádoucích doplňků prostřednictvím konfigurační proměnné. Můžete ji použít k blokování dalších úryvků textu nebo značek spojených s běžnými útoky na spam.

Obvykle se používá k vyloučení adres URL (nebo částí adres URL), na které nechcete uživatele odkazovat. Uživatelé dostanou vysvětlující zprávu, která uvádí, která část jejich upravovaného textu není povolena. umožňuje editaci této proměnné na wiki.

Tím se zabrání jakékoli zmínce o „online kasinu“ nebo „buy-viagra“ nebo „adipex“ nebo „phentermine“. '/i' na konci způsobí, že na případné vyhledávání nebude citlivý. Blokuje také úpravy, které se pokouší přidat skryté nebo přetékající prvky, což je běžný „trik“ používaný při mnoha hromadných útocích, které se pokouší skrýt spam před diváky. '/i' na konci způsobí, že na případné vyhledávání nebude citlivý. Blokuje také úpravy, které se pokouší přidat skryté nebo přetékající prvky, což je běžný „trik“ používaný při mnoha hromadných útocích, které se pokouší skrýt spam před diváky.

Změny konfigurace Apache
Pokud měníte konfiguraci své MediaWiki, používáte-li na Apache MediaWiki, můžete také provádět změny v konfiguraci webového serveru Apache, abyste zabránili spamu. Tato nastavení jsou obvykle umístěna do konfiguračního souboru virtuálního hostitele nebo do souboru s názvem .htaccess na stejném místě jako LocalSettings.php (Upozorňujeme, že pokud máte sdíleného webového hostitele, musí povolit AllowOverride, aby vám umožnil použití souboru .htaccess).

Filtrování podle agenta uživatele
Když na své wiki zablokujete nevyžádanou poštu, vyhledejte v protokolu přístupu k webu podle adresy IP a určete, který řetězec uživatelských agentů tato adresa IP poskytla. Například



The access log location for your virtual host is generally set using the CustomLog directive. Once you find the accesses, you'll see some lines like this:

The user agent is the last quoted string on the line, in this case an empty string. Some spammers will use user agent strings used by real browsers, while others will use malformed or blank user agent strings. If they are in the latter category, you can block them by adding this to your .htaccess file (adapted from this page):

SetEnvIf User-Agent ^regular expression matching user agent string goes here$ spammer=yes

Order allow,deny allow from all deny from env=spammer

Tím se vrátí chyba 403 Zakázané na jakoukoli adresu IP s uživatelským agentem, který odpovídá zadanému regulárnímu výrazu. Dejte pozor, abyste unikli všem potřebným znakům regexpu v řetězci uživatelského agenta, například. - se zpětným lomítkem (\). Chcete-li porovnat prázdné uživatelské agenty, použijte pouze znak „^$“.

I když je řetězec agenta spammeru používán skutečnými prohlížeči, pokud je starý nebo málokdy se vyskytující, můžete použít pravidla přepsání k přesměrování uživatelů na chybovou stránku a doporučit jim, aby upgradovali svůj prohlížeč:

RewriteCond %{HTTP_USER_AGENT} "Mozilla/5\.0 \(Windows; U; Windows NT 5\.1; en\-US; rv:1\.9\.0\.14\) Gecko/2009082707 Firefox/3\.0\.14 \(\.NET CLR 3\.5\.30729\)" RewriteCond %{REQUEST_URI} !^/forbidden/pleaseupgrade.html RewriteRule ^(.*)$ /forbidden/pleaseupgrade.html [L]

Zamezení blokování spammerů ve spotřebě zdrojů
Trvalý spammer nebo spam s poškozeným skriptem se může i nadále pokoušet spamovat vaši wiki poté, co byl zablokován, zbytečně náročnými zdroji. Přidáním pragmy deny from pragma, jako je následující, do souboru, můžete jim zabránit v načítání stránek vůbec a místo toho vrátit 403 zakázanou chybu:

Order allow,deny allow from all deny from 195.230.18.188

Černé seznamy adres IP
Většina nejproblematičtějších spamů přijímaných na webech MediaWiki pochází z adres, které ostatní webmasteři dlouho nazývají bot nebo otevřené proxy servery, ačkoli pro to existují pouze neoficiální důkazy. Tito roboti obvykle generují velké množství automatických registrací na webech fóra, komentují spam na blogu a vandalismus na stránkách wikis: nejčastěji linkspam, ačkoli existující obsah je někdy prázdný, doplněný náhodnými blábolícími znaky nebo upravován takovým způsobem, aby rozbil stávající Unicode text.

Poměrně jednoduchý CAPTCHA může problém významně snížit, protože může blokovat vytvoření určitých často nevyžádaných stránek. Tato opatření však problém nevylučují a zpřísnění bezpečnosti pro všechny uživatele v určitém okamžiku způsobí nepohodlí legitimních přispěvatelů.

Může být vhodnější namísto spoléhání se výhradně na CAPTCHA nebo jiná preventivní opatření, která ovlivňují všechny uživatele, zaměřit se konkrétně na IP adresy, o nichž již ostatní mistři stránek vědí, že jsou útočištěm net.abuse. Mnoho seznamů je již k dispozici, například stopforumspam.com obsahuje seznam "All IPs in CSV" (všech IP v CSV), který (od února 2012) obsahuje asi 200 000 IP známých spambotů.

Využití procesoru CPU a přetížení
Uvědomte si, že když se při pokusech o úpravy nebo zobrazení stránek provádí mnoho kontrol, roboti mohou snadno přetížit vaši wiki a narušit ji více, než pokud by nebyla chráněna. Sledujte náklady na ochranu svých zdrojů.

DNSBL
Můžete nastavit MediaWiki, aby zkontroloval každou editovací IP adresu proti jednomu nebo více DNSBL (blacklistům založeným na DNS), což nevyžaduje žádnou údržbu, ale mírně zvyšuje latenci úprav. Například můžete přidat tento řádek do LocalSettings.php a blokovat tak mnoho otevřených proxy serverů a známých spammerů:

For details of these DNSBLs, see Spamhaus: XBL and dnsbl.tornevall.org. For a list of DNSBLs, see Comparison of DNS blacklists. See also,.

Špatné chování a projekt HoneyPot
Špatné chování je první obranná linie blokující všechny požadavky známých spammerů identifikovaných pomocí HTTP hlaviček, IP adresy a dalších metadat; je k dispozici jako rozšíření MediaWiki, viz.

Pro maximální účinnost by měla být kombinována s http:BL API Key, které můžete získat na signing up for Project Honey Pot, distribuovaného projektu sledování spamu. Chcete-li se připojit k projektu HoneyPot, musíte do svého webového serveru přidat veřejně přístupný soubor a pomocí následujícího kódu rozšíření ve vašem LocalSettings.php (nebo přiloženém souboru PHP) vložit odkaz na každou stránku:

Nastavte $wgHoneyPotPath na cestu stránky honeypot v LocalSettings.php (např. "/ciralix.php"). Můžete změnit podobu výše uvedeného odkazu na kteroukoli z alternativ navržených v Project HoneyPot. Možná se budete muset přihlásit do Project HoneyPot, abyste viděli tyto alternativní způsoby, jak učinit odkazy honeypot neviditelné pro člověka.

Jakmile se zaregistrujete, zvolte Services&rarr;HTTP Blacklist, abyste získali http:BL API Key, a vložte svůj klíč do nastavení Bad Behavior's.ini.

$wgProxyList
Proměnnou můžete nastavit na seznamu IP, které chcete zakázat. Tento lze pravidelně naplňovat z externího zdroje pomocí skriptu cron, jako je například následující:

Poté nastavíte v LocalSettings.php:

Možná budete chtít uložit tyto příkazy do souboru nazvaného např. , takže jej můžete spouštět pravidelně.

Můžete také použít řešení pouze pro PHP (PHP-only) a stáhnout ip-list ze stopforumspamu. Za tímto účelem zkontrolujte dostupný skript PHP here.

Pokud tak učiníte a pro ukládání do mezipaměti používáte mezipaměť APC, možná budete muset zvýšit velikost apc.shm_size ve vašem php.ini, abyste se přizpůsobili tak velkému seznamu.

Právě jste zakázali sto čtyřicet tisíc spammerů. Doufejme, že to nebude mít žádný rušivý účinek na vaše legitimní uživatele. Řekl jste „adieu“ mnoha nejhorším známým spammerům na internetu. Dobrý riddance! To by mělo problém trochu utišit, alespoň na chvíli…

Honeypots, DNS BL's and HTTP BL's
140 000 mrtvých spammerů. Není to špatné, ale jakýkoli správný BOFH by se v tuto chvíli nudil a dychtivě by hledal 140 001 IP spamů, který by se náhodně zablokoval. A proč ne?

Naštěstí jsou k dispozici dynamicky aktualizované seznamy spambotů, otevřených proxy serverů a dalších problémových IP adres. Mnohé také umožňují automatickou kontrolu uživatelských jmen nebo e-mailových adres (pro přihlášené uživatele) proti stejným blacklistům.

Jednou formou černé listiny, kterou mohou správci MediaWiki znát, je DNS BL. Seznam serverů DNS hostovaný na serveru doménových jmen je databáze adres IP. Hledání adresy určuje, zda IP, která se pokouší zaregistrovat nebo upravit, je již známým zdrojem zneužití sítě.

Možnosti a  v MediaWiki poskytují primitivní příklad přístupu k černé listině DNS. Nastavte  v  a IP adresy uvedené jako HTTP spam jsou blokovány.

Černá listina DNS funguje takto:
 * Wiki obdrží žádost o úpravu nebo registraci nového uživatele z nějaké náhodné adresy IP (například ve formátu „123.45.67.89“)
 * Čtyři bajty IP adresy jsou umístěny v obráceném pořadí, poté následuje název požadovaného serveru černé listiny DNS
 * Výsledná adresa je vyžadována ze serveru pro doménové jméno (v tomto příkladu '89.67.45.123.zen.spamhaus.org.' a '89.67.45.123.dnsbl.tornevall.org.')
 * Server není nalezen (NXDOMAIN), pokud adresa není na černé listině. Pokud je na některém z blacklistů, je úprava blokována.


 * A wiki gets an edit or new-user registration request from some random IP address (for example, in the format '123.45.67.89')
 * The four IP address bytes are placed into reverse order, then followed by the name of the desired DNS blacklist server
 * The resulting address is requested from the domain name server (in this example, '89.67.45.123.zen.spamhaus.org.' and '89.67.45.123.dnsbl.tornevall.org.')
 * The server returns not found (NXDOMAIN) if the address is not on the blacklist. If is on either blacklist, the edit is blocked.

Vyhledávání v externě hostované černé listině obvykle přidává ne více než několik sekund k času potřebnému k uložení úprav. Na rozdíl od nastavení $1, které musí být načteno na každé stránce čtené nebo zapisované, se použití černé listiny DNS provádí pouze během registrace nebo úprav stránek. Tím není ovlivněna rychlost, jakou může systém obsluhovat požadavky na čtení stránky (většinu vašeho provozu). Unlike settings, which must be loaded on each page read or write, the use of the DNS blacklist only takes place during registration or page edits. This leaves the speed at which the system can service page read requests (the bulk of your traffic) unaffected.

Zatímco původní SORBS byl primárně určen pro řešení otevřených webových proxy a e-mailového spamu, existují i ​​jiné seznamy specifické pro webový spam (fóra, komentáře k blogům, úpravy wiki), které mohou být proto vhodnější:
 * $tornevall funguje velmi podobným způsobem jako SORBS DNSBL, ale zacílí na otevřené proxy a spam ve webové podobě. Většina jeho obsahu je konsolidována z jiných existujících seznamů zneužívajících IP.
 * $projecthoneypot se konkrétně zaměřuje na roboty, kteří shromažďují e-mailové adresy z webových stránek pro hromadné seznamy e-mailů, zanechávají komentářový spam nebo se pokoušejí ukrást hesla pomocí útoků ze slovníku. Vyžaduje uživatelský registr u projecthoneypot.org pro 12místný klíč API. Pokud by tento klíč (například) byl 'myapitestkey', vyhledávání by jinak vypadalo jako '89.67.45.123.http.dnsbl.sorbs.net.' nebo '89.67.45.123.opm.tornevall.org.' bude muset být 'myapitestkey.89.67.45.123.dnsbl.httpbl.org.'
 * Seznamy povolených webů mohou identifikovat e-mailové adresy a informace o uživateli spamu i přes jednoduchou adresu IP, ale neexistuje standardní formát pro odpověď ze serveru se seznamem HTTP. Například žádost o $botscout by vrátila "Y|IP|4", pokud je adresa na černé listině ('N' nebo prázdná, pokud je v pořádku), zatímco webová žádost o $stopforumspam by vrátila "ip yes  2009-04-16 23:11:19  41" pokud je adresa na blacklistu (čas, datum a počet lze ignorovat) nebo prázdná, pokud je adresa v pořáku.


 * .opm.tornevall.org. operates in a very similar manner to SORBS DNSBL, but targets open proxies and web-form spamming. Much of its content is consolidated from other existing lists of abusive IPs.
 * .dnsbl.httpbl.org. specifically targets 'bots which harvest email addresses from web pages for bulk mail lists, leave comment spam or attempt to steal passwords using dictionary attacks. It requires the user register with projecthoneypot.org for a 12-character API key. If this key (for example) were 'myapitestkey', a lookup which would otherwise look like '89.67.45.123.http.dnsbl.sorbs.net.' or '89.67.45.123.opm.tornevall.org.' would need to be 'myapitestkey.89.67.45.123.dnsbl.httpbl.org.'
 * Web-based blacklists can identify spammer's email addresses and user information beyond a simple IP address, but there is no standard format for the reply from an HTTP blacklist server. For instance, a request for http://botscout.com/test/?ip=123.45.67.89 would return "Y|IP|4" if the address is blacklisted ('N' or blank if OK), while a web request for http://www.stopforumspam.com/api?ip=123.45.67.89 would return "ip yes  2009-04-16 23:11:19  41" if the address is blacklisted (the time, date and count can be ignored) or blank if the address is good.

Bez jediného standardního formátu, kterým server černé listiny odpovídá na dotaz, neexistuje v balíčku MediaWiki integrovaná podpora pro většinu online seznamů známých spambotů. Neschopnost určit více než jeden server černé listiny dále omezuje užitečnost vestavěných možností $1 a $2. Od $rev bylo MediaWiki schopno kontrolovat více DNSBL definováním $3 jako pole. The inability to specify more than one blacklist server further limits the usefulness of the built-in and  options. Since 58061, MediaWiki has been able to check multiple DNSBLs by defining  as an array.

Většina operátorů černých listin poskytuje velmi omezenou softwarovou podporu (často cílenou na aplikace jiné než wiki, jako je phpBB nebo Wordpress). Protože stejné spamboty vytvářejí podobné problémy na většině webů s otevřeným obsahem, nejhorší pachatelé útočící na weby MediaWiki budou také usilovně cílit na tisíce webů bez wiki se spamem v komentářích blogu, příspěvcích na fóru a v knihách návštěv. As the same spambots create similar problems on most open-content websites, the worst offenders attacking MediaWiki sites will also be busily targeting thousands of non-wiki sites with spam in blog comments, forum posts and guestbook entries.

Automatický dotaz na více webů na černé listině je proto již široce používán při ochraně různých jiných forem webů s otevřeným obsahem a jména spambotů, řad a IP adres jsou již nyní příliš dobře známá. Zdá se, že za velkým procentem celkového problému je relativně malý počet spambotů. I v případě, že administrátoři nepřijímají vězně, existuje vzor, ve kterém stejná spambotová IP, která před sekundou zveřejnila linkspam na wiki, spamuje blogové komentáře někde jinde a bude mít spamovací příspěvky na fóru pár sekund od nynějška na místě vzdáleném půl světa. To si pořádně zapamatujte. Jeden sdílený externí záznam na černé listině může umlčet jednoho problematického „robota“ od zveřejnění na tisících webech. A relatively small number of spambots appear to be behind a large percentage of the overall problem. Even where admins take no prisoners, a pattern where the same spambot IP which posted linkspam to the wiki a second ago is spamming blog comments somewhere else now and will be spamming forum posts a few seconds from now on a site half a world away has been duly noted. One shared external blacklist entry can silence one problematic 'bot from posting on thousands of sites.

Tím se výrazně snižuje počet jednotlivých IP adres, které je třeba ručně blokovat a to vždy na jedné wiki a na jednom fóru, místními administrátory.

Ale co je to s honeypoty?
Některé weby zabývající se nevyžádanou poštou, například projecthoneypot.org, poskytují kód, kterým jste vyzváni k zahrnutí na své vlastní webové stránky.

Stránky obvykle obsahují jednu nebo více jedinečných, náhodných a skrytých e-mailových adres nebo odkazů, které nejsou určeny pro vaše lidské návštěvníky, ale pro spamboty. Při každém zobrazení stránky se vložené adresy automaticky změní, což umožňuje, aby jednotlivé kusy spamu byly přímo a přesvědčivě přiřazeny k IP adrese robotů, kteří získávali adresy z vašich stránek. IP adresa, kterou robot použil k prohlížení vašich stránek, je automaticky předána provozovatelům černé listiny. Odkaz na falešný „komentář“ nebo „knihu návštěv“ je často skrytý jako past do robotů, kteří odesílají spam do webových formulářů. Viz Honeypot (computing). Each time the page is served, the embedded addresses are automatically changed, allowing individual pieces of spam to be directly and conclusively matched to the IP address of bots which harvested the addresses from your sites. The IP address which the bot used to view your site is automatically submitted to the operators of the blacklist service. Often a link to a fake 'comment' or 'guest book' is also hidden as a trap to bots which post spam to web forms. See Honeypot (computing).

Jakmile bude adresa spammeru známa, bude přidána na černé listiny (viz výše), takže vy i ostatní budete mít v budoucnu na svých stránkách o jednoho nežádoucího robotického návštěvníka méně.

Zatímco skripty a servery černé listiny mohou automatizovat většinu úkolů identifikace a řešení spambotových IP adres, většina webů na černé listině poskytuje odkazy na webové stránky, na kterých lze ručně vyhledat informace o IP adrese nebo nahlásit zneužívající IP jako spamboty. Může být vhodné zahrnout některé z těchto odkazů na speciální: blokové stránky vaší wiki pro pohodlí administrátorů vašeho webu.

Další seznamy proxy a spambotů IPs
Zpravidla zadáním adresy libovolného robota nebo otevřeného serveru proxy do vyhledávače se vrátí mnoho seznamů, na kterých byly tyto zneužívající adresy IP již nahlášeny.

V některých případech budou tyto seznamy součástí antispamových webů. V jiných bude web obhajující používání otevřených proxy obsahovat nejen proxy, který byl zneužíván k spamování vaší instalace wiki, ale stovky dalších proxy serverů, také otevřených pro zneužití. Je také možné blokovat registrace wiki z anonymizovaných zdrojů, jako je Tor proxy (Tor Project - torproject.org), od uživatelů bugmenotů nebo z e-mailových adres (uvedených na undisposable.net) určených pouze pro jednorázové použití.

Seznamy blacklistů najdete také v Blacklists Compared - 1 March 2008 a spamfaq.net. Nezapomeňte, že seznamy určené ke snižování množství nevyžádaných e-mailů, pokud jsou nainstalovány, aby blokovaly spam na wiki nebo jiných webových formulářích, generují mnoho falešných poplachů. Automatické použití seznamu, který například zablokuje všechny známé bloky IP adres dynamického uživatele, může způsobit, že vaše wiki nebude použitelná.

Propojení na blacklistové weby IP ze stránky Special:Blockip vaší wiki (jako výhodu pro administrátory, kteří chtějí ručně zkontrolovat, zda je problémová adresa již známým 'botem'):


 * 1) Přidejte jeden řádek do  a nastavte:
 * 2) Přidejte následující text do MediaWiki:Blockiptext, který chcete zobrazit: " "

Na stránku, ze které administrátoři žádají o zablokování IP, přidá pozvánku na „zkontrolovat tuto IP adresu: Domain Tools, OpenRBL, Project Honeypot, Spam Cop, Spamhaus, Stop Spam Forum“. IP adresa je dostačující informace pro komentáře k Project Honeypot proti spambotům. Stop Forum Spam je méně vhodný pro hlášení problémů anon-IP, protože vyžaduje uživatelské jméno, IP a e-mail, pod kterým se problémový robot pokouší zaregistrovat na vašich stránkách. Zásady a možnosti jiných webů souvisejících s černými listinami se mohou lišit.

Upozorňujeme, že blokování adresy odesílání spamu na váš web není stejné jako blokování adres URL specifickými externími odkazy, které jsou spammed v upraveném textu. Udělejte obojí. Oba přístupy se používají v kombinaci, jako prostředek k doplnění (ale nikoli nahrazení) dalších nástrojů proti spamu, jako jsou titul nebo blacklisty uživatelských jmen a testy, které se pokoušejí určit, zda je editace prováděná člověkem nebo robotem (captchas, Bad Behavior nebo Akismet) mohou být velmi efektivní prostředky k oddělení spambotů od skutečných, živých lidských návštěvníků.

Pokud spam vyhrál bitvu
Stále můžete vyhrát válku! MediaWiki vám k tomu nabízí nástroje. Prostě upevněte své pozice, dokud nebudete připraveni znovu zaútočit. Viz, a zejména Cleaning up, Restrict edit.

Další nástroje bez podpory MediaWiki najdete v části Externí odkazy.

Další nápady
Tato stránka obsahuje seznam funkcí, které jsou aktuálně zahrnuty nebo dostupné jako záplaty. Na diskusní stránce najdete mnoho dalších nápadů pro funkce, které by mohly být přidány MediaWiki nebo které jsou ve vývoji.

Viz též

 * Manual:Combating vandalism contains more general advice
 * Manual:Preventing access
 * Manual:User rights
 * Spam Filter
 * A message on our mailing list of a successful setup avoiding spam and allow editing to non-registered users.

Rozšíření

 * &mdash; allows edit prevention and blocking based on a variety of criteria
 * A slimmed down can be used to moderate new user registrations, (doesn't require captchas).
 * &mdash; allows, among other things, the checking of the underlying IP addresses of account spammers to block them. Allows mass-blocking of spammers from similar locations.
 * &mdash; allows basic blocking of edits containing spam domains with a single regex
 * &mdash; allows for checking edits against the StopForumSpam service and allows for submitting data back to it when blocking users.
 * Category:Spam management extensions &mdash; category exhaustively listing spam management extensions
 * &mdash; don't show edits to normal users until approved by a moderator. This extension has the advantage that spam links are never shown to the public, so not creating incentive to post spam.
 * Category:Spam management extensions &mdash; category exhaustively listing spam management extensions
 * &mdash; don't show edits to normal users until approved by a moderator. This extension has the advantage that spam links are never shown to the public, so not creating incentive to post spam.

Useful only on some wiki farms:

Commercial services:

Seskupené v instalačním programu
Standardní tarball dostupný pro download nyní obsahuje většinu hlavních anti-spam rozšíření, včetně následujících:


 * &mdash; adds various types of CAPTCHAs to your wiki
 * &mdash; CAPTCHA based on answering questions
 * &mdash; removes all contributions by a user or IP
 * &mdash; prevents edits containing spam domains, list is editable on-wiki by privileged users

Externí odkazy

 * Some pywikipediabot scripts to aid in vandalism-fighting.
 * CleanMediawiki.sh: console utility to delete specified user accounts ID and their pages, revisions, changes, and related indexes and cache.