Translations:Help:Extension:Translate/Translation memories/83/de

Die zweite Filterung erfolgt dann über die Volltextsuche. Sie Definitionen werden über einen Ad-hoc-Algorithmus gemischt. Zunächst wird der Text über MediaWikis  in Segmente (Wörter) aufgeteilt. Wenn es genügend Segmente gibt, wird alles entfernt, bei dem es sich nicht um Buchstaben handelt und normalisiert. Dann werden die ersten fünf Wörter ausgewählt, die mindestens 5 Bytes lang sind (5 Buchstaben in Englisch, jedoch wesentlich kürzere Wörter in Sprachen mit mehrere Bytes umfassenden Codepunkten). Diese Wörter werden dann im Volltext-Index für die zukünftige Filterung längerer Zeichenketten gespeichert.