Наличие просто огромного числа "кракозябр" в этом словаре сподвигло к обновлению своей небольшой программки для очистки всего этого безобразия... Спасибо fire-dance за его работу и мою идею
Что программа может: обрабатывать файлы очень большого размера, удалять весь мусор, теги HTML, коды символов ASCII преобразовывать в сами символы, удалять строки короче 8-ми символов, удалять все цифры или только 8-, 9-, 10-значные числа и т.п. Работает с текстом в формате Windows, но сохранять почищенный файл может и в *nix (LF). Корректно обрабатывает текстовые файлы и в nix-формате. Есть короткая встроенная справка. Нету: вирусов, кейлоггеров, троянов, руткитов и прочей братии.
Скачать можно здесь. Там же, уровнем выше (XXXL), лежат уже очищенные словари fire-dance пока ещё не все, но пополняются по мере очистки.
О спасибо я хотел чистить но как понимал насколько долго дело выйдет долго передумывал =)
Прога конечно хорошо узнать бы корректно она работает с выше перечислеными функциями цены вам бы небыло