Если речь идет о файле тхт, то следует соединить все в один файл и убрать дубликаты при помощи Text Duplicate Killer.
Число повторяющихся строк и покажет процент "похожести".
нееет. Попробую объяснить на примере: я собрал 2 базы, одну уже проспамил, вторая похожа на первую. Мне надо вытащить из второй базы свежие мыльники и их проспамить
База №1
1@mail.com
2@mail.com
3@@mail.com
База №2
1@mail.com
2@mail.com
3@@mail.com
blablabla@mail.com
Прога сверяет базы и свеженькую blablabla@mail.com записывает в отдельный фаил
Последний раз редактировалось le-mon; 02.02.2010 в 23:46..
как вариант - моя софтина http://forum.antichat.ru/thread174326.html
в удалении дублей: одну базу в левое, вторую вправое окошко и софтина удалит строки базы2 из базы1