Сообщение от
Kakoluk
Win XP(SP3) 2g оперативки, на момент теста свободных ~1g.
Win 7(SP1) 2g оперативки, на момент теста свободных ~1g.
(железка одна и та же)
1. 64-битная версия, кажется, с проблемами синтаксиса командной строки(относительно 32-х битной) - вываливается с хелпом.
2. Операции sort и remove, почему-то, режут от файла что то(при отчёте 0 строк), скажем был 196mb а осталось 180mb(проверить что вырезал нет возможности).
И тут Остапа понесло(с).
1. Пожелания : Сдаётся мне, у всех подобных программ одна беда, - нехватка оперативки для работы с большими файлами.
И следовательно, нужно изначально отталкиваться от работы с диском.
2. Блоковые чтение\запись с носителя, блоки выбирать не более 100mb(иначе, во время работы на слабых машинах будет жуткий тупняк, из за одновременной нехватки оперативки и работе с файлом подкачки.
Ну и как вишенка на торте, - использование распаралеливания на неодноядерных машинах(у меня 6-ядерный атлончик, жаль что грузится только на 17% при работе с подобным софтом).
Мой(AMD Phenom(tm) II X6 1055T), кстати, может представлятся как очень мощный одноядерный(в XP32), видимо распаралеливание идёт уже внутри.
Мой брательник когда то давно, написал одну прогу, которая предустанавливает соответствие
процессоров(для запуска старых игрушек и ПО, которые не понимают многоядерных камней под XP).
Если нужен исходник(на вижал), если, он вдруг поможет, то вот: https://yadi.sk/d/97ui3L8qjWXUJ
Я уж даже не мечтаю о работе через GPU как HashCat(это, уже из области фантастики).
P.S.
Не забрасывай прошу, этот проект, .. программа очень нужная, а если сможет работать с большими файлами при нехватке оперативки,
то и вовсе уникальная.
И не слушай никого про GUI, Мама говорила, что человеку нужно только самое необходимое, всё остальное - показуха. (c) Форест Гамп.
Если серьёзно, написать прикрученный пакетник(.bat) - пара минут.
Не отвлекайся на показуху.
ТЫ же сам говоришь, что человеку нужно самое необходимое, зачем же изобретать велосипед?
Ставь CYGWIN и вот: (я через CYGWIN работаю с словарями размером 40-70Гб, вообще без проблем)
1. Объединение файлов-словарей.
cat 1.lst 2.lst > all.lst # "склеивает" содержимое файлов 1.lst и 2.lst в файл all.lst, количество склеиваемых файлов может быть любым:
cat 1.lst 2.lst 3.lst 4.lst > all.lst # "склеивает" содержимое файлов 1.lst, 2.lst, 3.lst и 4.lst в файл all.lst
2. Для удаления повторов в файле-словаря необходимо выполнить две команды:
sort all.lst > all_srt.lst # "сортировка" содержимого файла all.lst по убыванию с выводом уже отсортированных данных в файл all_sort.lst
uniq all_srt.lst all_srt_without_doubles.lst # удаление повторящихся строк (дублей) из файла all_srt.lst
и запись итогового словаря в файл all_srt_without_doubles.lst уже без повторяющихся строк.
# Вторая и последующие копии повторяющихся соседних строк не записываются.
3. Итак. После выполения вышеприведенных команд вы имеете файл-словарь очищенный от дублей. Осталось лишь удалить из него строки длиной менее 8 символов,
так как такие строки не могут быть паролями для алгоритмов WPA/WPA2.
Для этого выполним:
sed -n '/^.\{8\}/p' all_srt_without_doubles.lst > 8_and_longer.lst
# таким образом в файле 8_and_longer.lst содержутся все строки из файла all_srt_without_doubles.lst длиной 8 и более символов.