HOME FORUMS MEMBERS RECENT POSTS LOG IN  
× Авторизация
Имя пользователя:
Пароль:
Нет аккаунта? Регистрация
Баннер 1   Баннер 2
НОВЫЕ ТОРГОВАЯ НОВОСТИ ЧАТ
loading...
Скрыть
Вернуться   ANTICHAT > ОФФТОП > Болталка
   
Ответ
 
Опции темы Поиск в этой теме Опции просмотра

Сверка 2-х Баз Мыл
  #1  
Старый 02.02.2010, 23:22
le-mon
Познающий
Регистрация: 11.04.2007
Сообщений: 57
С нами: 10044040

Репутация: -2
Smile Сверка 2-х Баз Мыл

Собственно надо проверить 2 базы на похожесть, и дельтануть из второй похожие мыла.

Замучился софтину искать, восновном склейщики, дубликаты и сортировка по доменам.
 
Ответить с цитированием

  #2  
Старый 02.02.2010, 23:25
Antonio Falkone
Познающий
Регистрация: 23.12.2009
Сообщений: 84
С нами: 8622795

Репутация: 106
По умолчанию

Если речь идет о файле тхт, то следует соединить все в один файл и убрать дубликаты при помощи Text Duplicate Killer.
Число повторяющихся строк и покажет процент "похожести".
 
Ответить с цитированием

  #3  
Старый 02.02.2010, 23:44
le-mon
Познающий
Регистрация: 11.04.2007
Сообщений: 57
С нами: 10044040

Репутация: -2
По умолчанию

нееет. Попробую объяснить на примере: я собрал 2 базы, одну уже проспамил, вторая похожа на первую. Мне надо вытащить из второй базы свежие мыльники и их проспамить

База №1
1@mail.com
2@mail.com
3@@mail.com

База №2
1@mail.com
2@mail.com
3@@mail.com
blablabla@mail.com

Прога сверяет базы и свеженькую blablabla@mail.com записывает в отдельный фаил

Последний раз редактировалось le-mon; 02.02.2010 в 23:46..
 
Ответить с цитированием

  #4  
Старый 02.02.2010, 23:55
sboy20042
Reservists Of Antichat - Level 6
Регистрация: 07.07.2007
Сообщений: 642
С нами: 9919046

Репутация: 1632


По умолчанию

______http://www.sendspace.com/file/xt3fto

инструкция внутри. 3-4 гига разруливает моментом
там есть функция пересечение, работает из контекстного меню.
__________________
<<<< Смотри на дату моей реги и завидуй!!!
 
Ответить с цитированием

  #5  
Старый 03.02.2010, 00:02
1n0y
Участник форума
Регистрация: 09.05.2009
Сообщений: 186
С нами: 8951426

Репутация: 102
По умолчанию

как вариант - моя софтина http://forum.antichat.ru/thread174326.html
в удалении дублей: одну базу в левое, вторую вправое окошко и софтина удалит строки базы2 из базы1
 
Ответить с цитированием

  #6  
Старый 03.02.2010, 00:14
SpangeBoB
Познавший АНТИЧАТ
Регистрация: 12.07.2008
Сообщений: 1,705
С нами: 9384806

Репутация: 1350


По умолчанию

Решу на powershell:
Цитата:
diff (gc base1.txt) (gc base2.txt) | % {if($_.SideIndicator.StartsWith("=>")){$_.inputobj ect}} > result.txt
 
Ответить с цитированием
Ответ



Предыдущая тема Следующая тема
Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
7 спамилок,пасер-чекер,сборщик баз ERROR_CODE Разное - Покупка, продажа, обмен 0 02.09.2006 14:26



Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
 


Быстрый переход




ANTICHAT ™ © 2001- Antichat Kft.