valind
20.01.2012, 00:35
Моё почтение, ребятки! Подскажите, пожалуйста, какой-нибудь бесплатный (может крякнутый) парсер или экстрактор, ну что-то в этом роде!
Ситуация такая. Есть куча ссылок и на каждой странице по этой ссылке, содержится, предположим такая инфа: «account type: old» или «account type: new» или «account type: unknown». Т.е. три варианты, ну бывает иногда проскочит какой-нибудь четвёртый вариант. Эта инфа - общедоступная, значит просматривать (парсить) можно без прокси и логина с паролём. Тупо ввёл ссылку и прочитал, вот только не хочется это всё ручками делать, речь идёт о нескольких миллионах страниц. Плюс прикол ещё в том, что мне нужно узнать инфу именно по моим ссылкам, а не всё подряд. Т.к. если введёшь не тот запрос, сайт покажет, что акк существует, но на самом деле – в реалии не существует.
То бишь, мне нужно что-то вроде Advanced Email Extractorа. Только не мыльники собирать, а конкретную инфу. Типа, указал страницу с ссылками и глубину проникновения (сканирования), а обратно получил (сохранил) документик с ссылками и инфой «account type: *****».
Может у кого-нибудь есть советы по этому поводу?! Или как-то возможно настроить этот Advanced Email Extractor через JScript?!
P.S. Возможно я не в ту ветку написал, тогда извиняюсь! Перенесите куда нужно.
Ситуация такая. Есть куча ссылок и на каждой странице по этой ссылке, содержится, предположим такая инфа: «account type: old» или «account type: new» или «account type: unknown». Т.е. три варианты, ну бывает иногда проскочит какой-нибудь четвёртый вариант. Эта инфа - общедоступная, значит просматривать (парсить) можно без прокси и логина с паролём. Тупо ввёл ссылку и прочитал, вот только не хочется это всё ручками делать, речь идёт о нескольких миллионах страниц. Плюс прикол ещё в том, что мне нужно узнать инфу именно по моим ссылкам, а не всё подряд. Т.к. если введёшь не тот запрос, сайт покажет, что акк существует, но на самом деле – в реалии не существует.
То бишь, мне нужно что-то вроде Advanced Email Extractorа. Только не мыльники собирать, а конкретную инфу. Типа, указал страницу с ссылками и глубину проникновения (сканирования), а обратно получил (сохранил) документик с ссылками и инфой «account type: *****».
Может у кого-нибудь есть советы по этому поводу?! Или как-то возможно настроить этот Advanced Email Extractor через JScript?!
P.S. Возможно я не в ту ветку написал, тогда извиняюсь! Перенесите куда нужно.