Translations:Help:Extension:Translate/Translation memories/83/cs

Druhý průchod filtrování pochází z fulltextového vyhledávání. Definice se mísí s ad hoc algoritmem. Nejprve je text rozdělen do segmentů (slov) pomocí  od MediaWiki. Pokud je k dispozici dostatek segmentů, v podstatě odejmeme všechno, co není slovo, a normalizujeme případ. Potom vezmeme prvních deset jedinečných slov, která jsou dlouhá alespoň 5 bajtů (5 písmen v angličtině, ale i kratší slova pro jazyky s vícebajtovými kódovými body). Tato slova jsou potom uložena v fulltextovém indexu pro další filtrování pro delší řetězce.