Manual:Combating spam/cs

Stejně jako všechny současné dynamické webové stránky jsou wikis běžným cílem pro spammery, kteří chtějí propagovat produkty nebo webové stránky. MediaWiki nabízí řadu funkcí určených k boji proti vandalismu obecně. Na této stránce se konkrétně zabýváme wiki spamem, který je často automatizovaný.

Přehled
Běžné nástroje používané v boji proti spamu wiki obvykle spadají do těchto kategorií:


 * Vyžadování přihlášení a nebo CAPTCHA u určitých operací, jako jsou úpravy, přidávání externích odkazů nebo vytváření nových uživatelů
 * Blokování úprav ze známých IP adres ze seznamu zakázaných nebo z adres IP, na nichž běží otevřené servery proxy
 * Blokování úprav, které přidávají konkrétní nechtěná klíčová slova nebo externí odkazy
 * Blokování specifických vzorů uživatelského jména a názvu stránky, které spamboty běžně používají
 * Blokování úprav novými nebo anonymními uživateli na konkrétních často cílených stránkách
 * Whitelisting (seznam povolených) známých editorů (jako jsou administrátoři, pravidelní přispěvatelé) a zároveň omezení pro nové nebo anonymní uživatele
 * Vyčištění skriptů nebo hromadné mazání stávajících příspěvků z nedávno zakázaných spambotů

Běžně se používá kombinace různých metod ve snaze udržet počet úprav spamu, robotů a otevřených proxy na minimu a zároveň omezit míru narušení způsobeného legitimním uživatelům webu.

Mnoho těchto funkcí není ve výchozím nastavení aktivováno. Pokud na serveru nebo hostiteli instalujete instalaci MediaWiki, pak jste jediný, kdo může provést potřebné změny konfigurace! V každém případě požádejte své uživatele, aby vám pomohli hlídat na wiki spam (a udělejte to sami), ale v dnešní době může spam snadno přemoci malé wiki komunity. Pomáhá trochu zvýšit tlak. Také byste si měli uvědomit, že žádné z těchto řešení nelze považovat za zcela odolné proti spamu. Efektivní praxí je pravidelně kontrolovat "" (Special:RecentChanges).



Nejrychlejší řešení nejprve vyzkoušejte
Boj proti spamu by neměl být příliš tvrdý. Pokud chcete rychle a výrazně omezit spam, zkuste nejprve tyto kroky.


 * Nainstalujte rozšíření StopForumSpam a zablokujte známé adresy IP spamu.
 * Nainstalujte a nastavte základní rozšíření antivandalismu (již bylo dodáno s poslední verzí), zejména.
 * Nakonfigurujte QuestyCaptcha a v případě potřeby změňte výchozí nastavení pro vaši wiki.
 * Zapněte, což může být použito pro blokování specifických akcí, jako editování či zakládání účtů, pro open proxy, servery sítě Tor či VPN.

Pokud problémy přetrvávají, přečtěte si další část této stránky, kde najdete další řešení, a pošlete zprávu na mediawiki-l.



CAPTCHA
Jednou z běžnějších metod vyřazování automatických podání je použití CAPTCHA. Systému, který se snaží odlišit lidi od automatizovaných systémů tím, že požádá uživatele, aby vyřešil úkol, který je pro stroje obtížný. Rozšíření pro MediaWiki poskytuje rozšiřitelný rámec CAPTCHA, který lze spustit na řadě událostí, včetně


 * všech úprav
 * úprav přidávajících nové, nerozpoznané externí odkazy
 * registrace uživatele

Rozšíření se dodává se standardním testem, jedná se však o referenční implementaci a není určeno k produkčnímu použití. Operátorům Wiki, kteří instalují ConfirmEdit na veřejné wiki, se doporučuje používat jeden z modulů CAPTCHA obsažených v rozšíření (celkem jich je pět).

Nejodolnější CAPTCHA, které jsou dnes k dispozici, jsou vaše vlastní otázky QuestyCaptcha. Přizpůsobte je přímo publiku vaší wiki a pravidelně je aktualizujete. ReCaptcha je v současné době poražen většinou spammerů ; Asirra CAPTCHA, která žádá uživatele, aby rozlišil kočky a psy, je pro uživatele obzvláště nepříjemná, ale může být účinná.

Je důležité si uvědomit, že CAPTCHA mohou blokovat nejenom nežádoucí roboty. Pokud skript není schopen projít CAPTCHA, pak to také může být čtečka obrazovky nebo jiný software nebo pomoc používaná nevidomými nebo zrakově postiženými. Jednou z možností v CAPTCHA, widgetu "reCAPTCHA", je v takových případech alternativní zvukový CAPTCHA - ale někteří uživatelé počítačů selhávají při testech poslechu a čtení, takže to není úplně dobré řešení. Měli byste zvážit důsledky takové překážky a případně poskytnout alternativní prostředky pro postižené uživatele k vytváření účtů a přispívání, což je v některých jurisdikcích zákonný požadavek.

Vaše wiki také nebude zcela chráněna proti spamu; podle Wikipedie "Spameři platí asi 0,80 až 1,20 $ za každých 1 000 vyřešených CAPTCHA společnostem zaměstnávajícím lidské řešitele v Bangladéši, Číně, Indii a mnoha dalších rozvojových zemích." Z tohoto důvodu by měl být kombinován s jinými mechanismy.

rel="nofollow"
Ve výchozí konfiguraci MediaWiki přidává  k externím odkazům na wiki stránkách, což znamená, že jsou dodávány uživatelem. Mohou obsahovat spam. Proto by neměly být používány k ovlivňování algoritmů pro hodnocení stránek. Tento atribut ctí oblíbené vyhledávací nástroje, například Google. Popular search engines such as Google honour this attribute.

Toto chování můžete vypnout na celém webu pomocí nebo na základě jmenného prostoru pomocí konfigurační proměnné.

Use of the  attribute alone will not stop spammers attempting to add marketing to a page, but it will at least prevent them from benefiting through increased page rank; we know for sure that some check this. Nonetheless, it should never be relied upon as the primary method of controlling spam as its effectiveness is inherently limited. It does not keep spam off your site.

See NoIndexHistory. Note that putting it on all external links is a rather heavy handed anti-spam tactic, which you may decide not to use (switch off the rel=nofollow option). See Nofollow for a debate about this. It's good to have this as the installation default though. It means lazy administrators who are not thinking about spam problems, will tend to have this option enabled. For more information, see Manual:Costs and benefits of using nofollow.



Rutina antispamu: opatření na míru
Každý spammer je jiný. I když všichni vypadají nudně podobně. Pokud obecná protiopatření nestačí, použijte před extrémními kroky nástroje, které vám umožní řešit konkrétní problémy, které máte. If the general countermeasures are not enough, before taking extreme steps make use of the tools which allow you to deal with the specific problems you have.



Ochrana jednotlivých stránek
Spamboty často opakovaně zasáhnou stejnou stránku. Běžné vzory pozorované u pagenů vytvořených pomocí spambotů zahrnují diskusní stránku, často mimo hlavní prostor (např. Category_talk: jsou málo používány, takže si vytvoří společné cíle) a další diskusní stránky. Common patterns observed in spambot-created pagenames include talk page, often outside main space (e.g. Category_talk: are little-used, so make common targets), and other discussion pages

Nejvíce jsou zneužívány úpravy na wiki, které k úpravám nevyžadují registraci. Pocházejí z anonymních zdrojů. Blokováním úprav na těchto konkrétních stránkách, komukoli jinému než zavedeným uživatelům, může zabránit opětovnému vytvoření spamových výpisů. Typically, any page which is already a regular visitor to special:log/delete on an individual wiki is a good candidate for page protection.


 * Semi-protection of individual pages.
 * In addition, this can be combined with changing the minimum requirements for MediaWiki to identify users as 'autoconfirmed'.
 * One may apply cascading protection to one or more pages that have links to the most frequently spammed pages. One can also use this trick to set up a handy list for use by admins.



Filtr zneužívání
(filtr zneužití) umožňuje privilegovaným uživatelům vytvářet pravidla zacílená na konkrétní typ spamu, který vaše wiki přijímá. Může pomoci automaticky zabránit akci nebo blokovat uživatele.

Může prozkoumat mnoho vlastností úprav. Například uživatelské jméno, věk uživatele, přidaný text, přidané odkazy atd. Nejúčinnější je v případech, kdy máte jednoho nebo více kvalifikovaných administrátorů, kteří jsou ochotni vám pomoci v boji proti spamu. Filtr zneužití může být účinný i proti spammerům podporovaným člověkem, ale vyžaduje nepřetržitou údržbu, aby reagoval na nové typy útoků.

Příklady boje proti automatickému spamu lze nalézt v.

Seznam spamů (SpamBlacklist)
Výše uvedený přístup bude příliš těžkopádný, pokud se pokusíte blokovat větší množství spamových adres URL. Lepším přístupem je dlouhá černá listina identifikující mnoho známých spamových adres URL. A better approach is to have a long blacklist identifying many known spamming URLs.

Populární rozšíření pro MediaWiki je rozšíření, které blokuje úpravy, které přidávají na stránky adresy URL uvedené na černé listině: Umožňuje vytvoření takovéhoto seznamu na wiki s pomocí privilegovaných uživatelů a umožňuje použití seznamů získaných z externích zdrojů (ve výchozím nastavení , používá rozsáhlý Spam blacklist).

Rozšíření (̝černá listina spamů) může být také užitečné, jako prostředek k zabránění opětovného vytvoření konkrétních skupin stránek, které používají 'bots k výpisu odkazových spamů.



Otevřené proxy
Otevřený server proxy je nebezpečný zejména proto, že se používá jako způsob, jak obejít protiopatření zaměřená na konkrétního narušitele. Viz také Žádné otevřené servery proxy.

Existují někteří roboti, např. na Wikimedia wikis, detekující a blokující otevřené IP proxy. Jejich kód často není veřejný. Většina takových bloků, když si všimnete zneužití, se provádí ručně. Je proto důležité vědět, zda zneužívající IP je otevřený proxy server nebo něco jiného, aby se rozhodlo, jak se s tím vypořádat. Zejména, pokud se jedná o adresu IP používanou registrovaným uživatelem, získanou pomocí rozšíření.

Několik rozšíření, zejména rozšíření, blokuje řadu otevřených proxy serverů.

Od verze 1.22 je k dispozici, pro zvýšení účinnosti bloků.



Tvrdá opatření
Následující opatření jsou určena pro technicky zdatnější systémové správce, kteří vědí, co dělají: Je těžší je správně nastavit a monitorovat. Pokud jsou implementovány špatně, mohou být příliš staré na to, aby byly stále účinné, nebo dokonce pro vaši wiki kontraproduktivní.

$wgSpamRegex
MediaWiki poskytuje prostředky k filtrování textu úprav za účelem blokování nežádoucích doplňků prostřednictvím konfigurační proměnné. Můžete ji použít k blokování dalších úryvků textu nebo značek spojených s běžnými útoky na spam.

Obvykle se používá k vyloučení adres URL (nebo částí adres URL), na které nechcete uživatele odkazovat. Uživatelé dostanou vysvětlující zprávu uvádějící, která část jejich upravovaného textu není povolena. umožňuje editaci této proměnné na wiki.

Tím se zabrání jakékoli zmínce o 'online kasinu' nebo 'buy-viagra' nebo 'adipex' nebo 'phentermine'. '/i' na konci způsobí, že na případné vyhledávání nebude citlivý. Blokuje také úpravy, které se pokouší přidat skryté nebo přetékající prvky, což je běžný "trik" používaný při mnoha hromadných útocích, které se pokouší skrýt spam před diváky.



Změny konfigurace Apache
Kromě změny konfigurace MediaWiki, pokud používáte MediaWiki na Apache, můžete provést změny v konfiguraci webového serveru Apache, abyste zabránili spamu. Tato nastavení jsou obvykle umístěna do konfiguračního souboru virtuálního hostitele nebo do souboru s názvem .htaccess na stejném místě jako LocalSettings.php (Upozorňujeme, že pokud máte sdíleného webového hostitele, musí povolit AllowOverride, aby vám umožnil použití souboru .htaccess).



Filtrování podle agenta uživatele
Když na své wiki zablokujete spamera, prohledejte protokol přístupu svého webu podle IP adresy a zjistěte, který řetězec uživatelského agenta daná IP adresa poskytla. Například:



The access log location for your virtual host is generally set using the CustomLog directive. Once you find the accesses, you'll see some lines like this:

The user agent is the last quoted string on the line, in this case an empty string. Some spammers will use user agent strings used by real browsers, while others will use malformed or blank user agent strings. If they are in the latter category, you can block them by adding this to your .htaccess file (adapted from this page):

SetEnvIf User-Agent ^regular expression matching user agent string goes here$ spammer=yes

Order allow,deny allow from all deny from env=spammer

Tím se vrátí chyba 403 Zakázané na jakoukoli adresu IP s uživatelským agentem, který odpovídá zadanému regulárnímu výrazu. Dbejte na to, abyste v řetězci uživatelského agenta vynechali všechny nezbytné znaky regulárního výrazu, například. - se zpětnými lomítky (\). Chcete-li spárovat prázdné uživatelské agenty, stačí použít "^$". Take care to escape all necessary regexp characters in the user agent string such as. - with backslashes (\). To match blank user agents, just use "^$".

I když je řetězec agenta spammeru používán skutečnými prohlížeči, pokud je starý nebo málokdy se vyskytující, můžete použít pravidla přepsání k přesměrování uživatelů na chybovou stránku a doporučit jim, aby aktualizovali svůj prohlížeč:

RewriteCond %{HTTP_USER_AGENT} "Mozilla/5\.0 \(Windows; U; Windows NT 5\.1; en\-US; rv:1\.9\.0\.14\) Gecko/2009082707 Firefox/3\.0\.14 \(\.NET CLR 3\.5\.30729\)" RewriteCond %{REQUEST_URI} !^/forbidden/pleaseupgrade.html RewriteRule ^(.*)$ /forbidden/pleaseupgrade.html [L]



Zabránění blokovaným spammerům ve spotřebovávání zdrojů
Trvalý spammer nebo ten s poškozeným skriptem se může i nadále pokoušet spamovat vaši wiki poté, co byla zablokována, a zbytečně tak spotřebovávat zdroje. Přidáním pragmy deny from, jako je následující, do souboru, můžete jim zabránit v načítání stránek vůbec a místo toho vrátit 403 Zakázaná chyba:

Order allow,deny allow from all deny from 195.230.18.188



Černé seznamy adres IP
Většina nejproblematičtějších spamů přijímaných na webech MediaWiki pochází z adres, které ostatní webmasteři dlouho nazývají bot nebo otevřené proxy servery, ačkoli pro to existují pouze neoficiální důkazy. Tito roboti obvykle generují velké množství automatických registrací na webech fóra, komentují spam na blogu a vandalismus na stránkách wikis: Nejčastěji linkspam, ačkoli existující obsah je někdy prázdný, doplněný náhodnými blábolícími znaky nebo upravován takovým způsobem, aby rozbil stávající Unicode text. These bots typically generate large numbers of automated registrations to forum sites, comment spam to blogs and page vandalism to wikis: most often linkspam, although existing content is sometimes blanked, prepended with random gibberish characters or edited in such a way as to break existing Unicode text.

Poměrně jednoduchý CAPTCHA může problém významně snížit, protože může blokovat vytvoření určitých často nevyžádaných stránek. Tato opatření však problém nevylučují a zpřísnění bezpečnosti pro všechny uživatele v určitém okamžiku způsobí nepohodlí legitimních přispěvatelů.

Může být vhodnější namísto spoléhání se výhradně na CAPTCHA nebo jiná preventivní opatření, která ovlivňují všechny uživatele, zaměřit se konkrétně na IP adresy, o nichž již ostatní mistři stránek vědí, že jsou útočištěm net.abuse. Mnoho seznamů je již k dispozici, například $1 obsahuje seznam "All IPs in CSV" (všech IP v CSV), který (od února 2012) obsahuje asi 200 000 IP známých spambotů. Many lists are already available, for instance stopforumspam.com has a list of "All IPs in CSV" which (as of feb. 2012) contains about 200,000 IPs of known spambots.



Využití procesoru CPU a přetížení
Uvědomte si, že když se při pokusech o úpravy nebo zobrazení stránek provádí mnoho kontrol, roboti mohou snadno přetížit vaši wiki a narušit ji více, než pokud by nebyla chráněna. Sledujte náklady na ochranu svých zdrojů. Keep an eye on the resource cost of your protections.

DNSBL
Můžete nastavit MediaWiki, aby zkontrolovala každou editovací IP adresu proti jednomu nebo více DNSBL (blacklistům založeným na DNS), což nevyžaduje žádnou údržbu, ale mírně zvyšuje latenci úprav. Například můžete přidat tento řádek do LocalSettings.php a blokovat tak mnoho otevřených proxy serverů a známých spammerů:

For details of these DNSBLs, see Spamhaus: XBL and dnsbl.tornevall.org. For a list of DNSBLs, see Comparison of DNS blacklists. See also,.

$wgProxyList
Proměnnou můžete nastavit na seznamu IP, které chcete zakázat. Tento lze pravidelně naplňovat z externího zdroje pomocí skriptu cron, jako je například následující: This can be populated periodically from an external source using a cron script such as the following:

Poté nastavíte v LocalSettings.php:

Možná budete chtít uložit tyto příkazy do souboru nazvaného např. , takže jej můžete spouštět pravidelně.

Můžete také použít řešení pouze pro PHP (PHP-only) a stáhnout ip-list ze stopforumspamu. Za tímto účelem zkontrolujte dostupný skript PHP [$url zde]. To do so check the PHP script available here.

Pokud tak učiníte a pro ukládání do mezipaměti používáte mezipaměť APC, možná budete muset zvýšit velikost apc.shm_size ve vašem php.ini, abyste se přizpůsobili tak velkému seznamu.

Právě jste zakázali sto čtyřicet tisíc spammerů. Doufejme, že to nebude mít žádný rušivý účinek na vaše legitimní uživatele. Řekli jste "adieu" mnoha nejhorším známým spammerům na internetu. Dobrý riddance! To by mělo problém trochu uklidnit. Alespoň na chvíli… Good riddance! That should make things a wee bit quieter, at least for a while…

Honeypots, DNS BLs and HTTP BLs
140 000 mrtvých spammerů. Není to špatné, ale jakýkoli správný BOFH by se v tuto chvíli nudil a dychtivě by hledal 140 001 IP spamů, který by se náhodně zablokoval. A proč ne?

Naštěstí jsou k dispozici dynamicky aktualizované seznamy spambotů, otevřených proxy serverů a dalších problémových IP adres. Mnohé také umožňují automatickou kontrolu uživatelských jmen nebo emailových adres (pro přihlášené uživatele) proti stejným blacklistům. Many also allow usernames or email addresses (for logged-in users) to be automatically checked against the same blacklists.

Jednou formou černé listiny, kterou mohou správci MediaWiki znát, je DNS BL. Seznam serverů DNS hostovaný na serveru doménových jmen je databáze adres IP. Hledání adresy určuje, zda IP, která se pokouší zaregistrovat nebo upravit, je již známým zdrojem zneužití sítě. An address lookup determines if an IP attempting to register or edit is an already-known source of net abuse.

Možnosti a  v MediaWiki poskytují primitivní příklad přístupu k černé listině DNS. Nastavte následující nastavení v a IP adresy uvedené jako HTTP spam jsou blokovány:

Černá listina DNS funguje takto:


 * Wiki obdrží žádost o úpravu nebo registraci nového uživatele z nějaké náhodné adresy IP (například ve formátu '123.45.67.89').
 * Čtyři bajty IP adresy jsou umístěny v obráceném pořadí, poté následuje název požadovaného serveru černé listiny DNS.
 * Výsledná adresa je vyžadována ze serveru pro doménové jméno (v tomto příkladu '89.67.45.123.zen.spamhaus.org.' a '89.67.45.123.dnsbl.tornevall.org.').
 * Server není nalezen (NXDOMAIN), pokud adresa není na černé listině. Pokud je na některém z blacklistů, je úprava blokována.

Vyhledávání v externě hostované černé listině obvykle přidává ne více než několik sekund k času potřebnému k uložení úprav. Na rozdíl od nastavení $1, které musí být načteno na každé stránce čtené nebo zapisované, se použití černé listiny DNS provádí pouze během registrace nebo úprav stránek. Tím není ovlivněna rychlost, jakou může systém obsluhovat požadavky na čtení stránky (většinu vašeho provozu). Na rozdíl od nastavení, které musí být načteno na každé stránce čtené nebo zapisované, se použití černé listiny DNS provádí pouze během registrace nebo úprav stránek. Tím není ovlivněna rychlost, jakou může systém obsluhovat požadavky na čtení stránky (většinu vašeho provozu).

Zatímco původní SORBS byl primárně určen pro řešení otevřených webových proxy a emailového spamu, existují i ​​jiné seznamy specifické pro webový spam (fóra, komentáře k blogům, úpravy wiki), které mohou být proto vhodnější:

Much of its content is consolidated from other existing lists of abusive IPs. It requires the user register with projecthoneypot.org for a 12-character API key. If this key (for example) were 'myapitestkey', a lookup which would otherwise look like '89.67.45.123.http.dnsbl.sorbs.net.' or '89.67.45.123.opm.tornevall.org.' would need to be 'myapitestkey.89.67.45.123.dnsbl.httpbl.org.' For instance, a request for http://botscout.com/test/?ip=123.45.67.89 would return "Y|IP|4" if the address is blacklisted ('N' or blank if OK), while a web request for http://www.stopforumspam.com/api?ip=123.45.67.89 would return "ip yes  2009-04-16 23:11:19  41" if the address is blacklisted (the time, date and count can be ignored) or blank if the address is good.
 * .opm.tornevall.org. funguje velmi podobným způsobem jako SORBS DNSBL, ale zacílí na otevřené proxy a spam ve webové podobě. Většina jeho obsahu je konsolidována z jiných existujících seznamů zneužívajících IP.
 * .dnsbl.httpbl.org. se konkrétně zaměřuje na roboty, kteří shromažďují emailové adresy z webových stránek pro hromadné seznamy emailů, zanechávají komentářový spam nebo se pokoušejí ukrást hesla pomocí útoků ze slovníku. Vyžaduje uživatelský registr u projecthoneypot.org pro 12místný klíč API. Pokud by tento klíč (například) byl 'myapitestkey', vyhledávání by jinak vypadalo jako '89.67.45.123.http.dnsbl.sorbs.net.' nebo '89.67.45.123.opm.tornevall.org.' bude muset být 'myapitestkey.89.67.45.123.dnsbl.httpbl.org.'.
 * Seznamy povolených webů mohou identifikovat emailové adresy a informace o uživateli spamu i přes jednoduchou adresu IP, ale neexistuje standardní formát pro odpověď ze serveru se seznamem HTTP. Například žádost o $botscout by vrátila "Y|IP|4", pokud je adresa na černé listině ('N' nebo prázdná, pokud je v pořádku), zatímco webová žádost o $stopforumspam by vrátila "ip yes  2009-04-16 23:11:19 41" pokud je adresa na blacklistu (čas, datum a počet lze ignorovat) nebo prázdná, pokud je adresa v pořádku.

Bez jediného standardního formátu, kterým server černé listiny odpovídá na dotaz, neexistuje v balíčku MediaWiki integrovaná podpora pro většinu online seznamů známých spambotů. Neschopnost určit více než jeden server černé listiny dále omezuje užitečnost vestavěných možností $1 a $2. Od $rev bylo MediaWiki schopno kontrolovat více DNSBL definováním $3 jako pole. Neschopnost určit více než jeden server černé listiny dále omezuje užitečnost vestavěných možností a. Od 58061 bylo MediaWiki schopno kontrolovat více DNSBL definováním  jako pole.

Většina operátorů černých listin poskytuje velmi omezenou softwarovou podporu (často cílenou na aplikace jiné než wiki, jako je phpBB nebo Wordpress). Protože stejné spamboty vytvářejí podobné problémy na většině webů s otevřeným obsahem, nejhorší pachatelé útočící na weby MediaWiki budou také usilovně cílit na tisíce webů bez wiki se spamem v komentářích blogu, příspěvcích na fóru a v knihách návštěv.

Automatický dotaz na více webů na černé listině je proto již široce používán při ochraně různých jiných forem webů s otevřeným obsahem a jména spambotů, řad a IP adres jsou již nyní příliš dobře známá. Zdá se, že za velkým procentem celkového problému je relativně malý počet spambotů. I v případě, že administrátoři nepřijímají zajatce, existuje vzor, ve kterém stejná spambotová IP, která před sekundou zveřejnila linkspam na wiki, spamuje blogové komentáře někde jinde a bude mít spamovací příspěvky na fóru pár sekund od nynějška na místě vzdáleném půl světa. To si pořádně zapamatujte. Jeden sdílený externí záznam na černé listině může umlčet jednoho problematického 'robota' od zveřejnění na tisících webů.

Tím se výrazně snižuje počet jednotlivých IP adres, které je třeba ručně blokovat a to vždy na jedné wiki a na jednom fóru, místními administrátory.



Ale co je to s honeypoty?
Některé weby zabývající se nevyžádanou poštou, například projecthoneypot.org, poskytují kód, kterým jste vyzváni k zahrnutí na své vlastní webové stránky.

Stránky obvykle obsahují jednu nebo více jedinečných, náhodných a skrytých emailových adres nebo odkazů, které nejsou určeny pro vaše lidské návštěvníky, ale pro spamboty. Při každém zobrazení stránky se vložené adresy automaticky změní, což umožňuje, aby jednotlivé části spamu byly přímo a přesvědčivě přiřazeny k IP adrese robotů, kteří získávali adresy z vašich stránek. IP adresa, kterou robot použil k prohlížení vašich stránek, je automaticky předána provozovatelům černé listiny. Odkaz na falešný 'komentář' nebo 'knihu návštěv' je často skrytý jako past do robotů, kteří odesílají spam do webových formulářů. Viz Honeypot (computing).

Jakmile bude adresa spammeru známa, bude přidána na černé listiny (viz výše), takže vy i ostatní budete mít v budoucnu na svých stránkách o jednoho nežádoucího robotického návštěvníka méně.

Zatímco skripty a servery černé listiny mohou automatizovat většinu úkolů identifikace a řešení spambotových IP adres, většina webů na černé listině poskytuje odkazy na webové stránky, na kterých lze ručně vyhledat informace o IP adrese nebo nahlásit zneužívající IP jako spambot. Může být vhodné zahrnout některé z těchto odkazů na speciální: Blokové stránky vaší wiki pro pohodlí administrátorů vašeho webu. It may be advisable to include some of these links on the special:blockip pages of your wiki for the convenience of your site's administrators.



Další seznamy proxy a spambotů IPs
Zpravidla zadáním adresy libovolného robota nebo otevřeného proxy serveru do vyhledávače se vrátí mnoho seznamů, na kterých byly tyto zneužívající adresy IP již nahlášeny.

V některých případech budou tyto seznamy součástí antispamových webů. V jiných bude web obhajující používání otevřených proxy obsahovat nejen proxy, který byl zneužíván k spamování vaší instalace wiki, ale stovky dalších proxy serverů, také otevřených pro zneužití. Je také možné blokovat registrace wiki z anonymizovaných zdrojů, jako je Tor proxy (Tor Project - torproject.org), od uživatelů bugmenotů nebo z emailových adres (uvedených na undisposable.net) určených pouze pro jednorázové použití.

Seznamy blacklistů najdete také v Blacklists Compared - 1 March 2008 a spamfaq.net. Nezapomeňte, že seznamy určené ke snižování množství nevyžádaných emailů, pokud jsou nainstalovány, aby blokovaly spam na wiki nebo jiných webových formulářích, generují mnoho falešných poplachů. Automatické použití seznamu, který například zablokuje všechny známé bloky IP adres dynamického uživatele, může způsobit, že vaše wiki nebude použitelná.

Propojení na blacklistové weby IP ze stránky Special:Blockip vaší wiki (jako výhodu pro administrátory, kteří chtějí ručně zkontrolovat, zda je problémová adresa již známým 'botem'):


 * 1) Přidejte jeden řádek do  a nastavte:
 * 2) Přidejte následující text do MediaWiki:Blockiptext, který chcete zobrazit: " "

Na stránku, ze které administrátoři žádají o zablokování IP, přidá pozvánku na "zkontrolovat tuto IP adresu: Domain Tools, OpenRBL, Project Honeypot, Spam Cop, Spamhaus, Stop Spam Forum". IP adresa je dostačující informace pro komentáře k Project Honeypot proti spambotům. Stop Forum Spam je méně vhodný pro hlášení problémů anon-IP, protože vyžaduje uživatelské jméno, IP a email, pod kterým se problémový robot pokouší zaregistrovat na vašich stránkách. Zásady a možnosti jiných webů souvisejících s černými listinami se mohou lišit. An IP address is sufficient information to make comments on Project Honeypot against spambots, Stop Forum Spam is less suited to reporting anon-IP problems as it requires username, IP and email under which a problem 'bot is attempting to register on your sites. The policies and capabilities of other blacklist-related websites may vary.

Upozorňujeme, že blokování adresy odesílání spamu na váš web není stejné jako blokování adres URL specifickými externími odkazy, které jsou spammed v upraveném textu. Udělejte obojí. Oba přístupy se používají v kombinaci, jako prostředek k doplnění (ale nikoli nahrazení) dalších nástrojů proti spamu, jako jsou titul nebo blacklisty uživatelských jmen a testy, které se pokoušejí určit, zda je editace prováděná člověkem nebo robotem (captchas nebo Akismet) mohou být velmi efektivní prostředky k oddělení spambotů od skutečných, živých lidských návštěvníků. Do both. Both approaches used in combination, as a means to supplement (but not replace) other anti-spam tools such as title or username blacklists and tests which attempt to determine whether an edit is made by a human or a robot (captchas or akismet) can be a very effective means to separate spambots from real, live human visitors.



Pokud spam vyhrál bitvu
Stále můžete vyhrát válku! MediaWiki vám k tomu nabízí nástroje. Prostě upevněte své pozice, dokud nebudete připraveni znovu zaútočit. Viz, a zejména Cleaning up, Restrict edit.

Další nástroje bez podpory MediaWiki najdete v části Externí odkazy.



Další nápady
Tato stránka obsahuje seznam funkcí, které jsou aktuálně zahrnuty nebo dostupné jako záplaty. Na diskusní stránce najdete mnoho dalších nápadů pro funkce, které by mohly být přidány MediaWiki nebo které jsou ve vývoji.

<span id="See_also">

Související odkazy

 * Manual:Combating vandalism contains more general advice
 * Manual:Preventing access
 * Manual:User rights
 * Spam Filter
 * A message on our mailing list of a successful setup avoiding spam and allow editing to non-registered users.

Rozšíření

 * &mdash; allows edit prevention and blocking based on a variety of criteria
 * A slimmed down can be used to moderate new user registrations, (doesn't require captchas).
 * &mdash; allows, among other things, the checking of the underlying IP addresses of account spammers to block them. Allows mass-blocking of spammers from similar locations.
 * &mdash; allows basic blocking of edits containing spam domains with a single regex
 * &mdash; allows for checking edits against the StopForumSpam service and allows for submitting data back to it when blocking users.
 * Category:Spam management extensions &mdash; category exhaustively listing spam management extensions
 * &mdash; don't show edits to normal users until approved by a moderator. This extension has the advantage that spam links are never shown to the public, so not creating incentive to post spam.
 * &mdash; don't show edits to normal users until approved by a moderator. This extension has the advantage that spam links are never shown to the public, so not creating incentive to post spam.

Useful only on some wiki farms:

Commercial services: <span id="Bundled_in_the_installer">

Seskupené v instalačním programu
Standardní tarball dostupný pro download nyní obsahuje většinu hlavních anti-spam rozšíření, včetně následujících:


 * &mdash; adds various types of CAPTCHAs to your wiki
 * &mdash; CAPTCHA based on answering questions
 * &mdash; removes all contributions by a user or IP
 * &mdash; prevents edits containing spam domains, list is editable on-wiki by privileged users

Nastavení


<span id="External_links">

Externí odkazy

 * Some pywikipediabot scripts to aid in vandalism-fighting.