Просмотр полной версии : Нужен исходник mail паука на Делфи :)
Народ очень нужен исходинк простейшего, но рабочего mail паука на Delphi, у самого возникают проблемы в написании паука...
Выложите у кого есть, желательно с комментариями.
Буду очень благодарен.
Сам недавно начал писать паучка, который будет собирать мыльники на различных сайтах, но не все получается, поэтому и хотел бы посмотреть, как делают другие... Буду очень презнателен, если кто-то предоставит сорцы...
P.S. Понимаю, что это стоит денег, но все же.....
P.P.S. Не надо предлагать сделать за деньги, я подобные программы и так достать могу, мне надо самому научится и написать подобную программу....
Тут http://vx.netlux.org/vl.php и тут http://vx.netlux.org/ попробуй :)
zl0y
К сожалению, я не нашел там подобных исходников, возможно плохо искал, если что тыкни носом в подобный исходник....
Идешь сюда >> http://vx.netlux.org/src.php внизу выбираешь язык pascal :) и будет счастье?
Кстати что с си переписать проблема чтоли =) если знаешь я напрмиер знаю винапи ) и хватает.
Нет там: http://vx.netlux.org/src.php , паука там только черви, вирусы и один трой....
Народ, ну может все же есть у кого-то, разве мало кодеров на этом форуме? :_(
~Hidrag~
27.05.2007, 12:25
Просветите темного, что есть паук в данном контексте и принцип его работы? :)
программа, которая ищет вредоносный код во входящих е-mail сообщениях. если находит - делает все, что надо) удаляет\блокирует\спрашива ет пользователя и т. д.
2 Piflit немного не понял, паук- это программа, которая лезет в инет и шарится по сайту(ам) и ишет на этих сайтах mail адреса и сохраняет их в базу, в конечном результате в базе сохраняется определенное число (от нескольких десятко до сотен тысяч) подобных адресов... В основном этий базы адресов нужны для спама... :)
спасибо, просто гугл сказал немного другое=)
Ну так что, товарищи, никто не поделится? Подскажите хоть как создать наследника от WebBrowser'a, чтоб в нем не было картинок, только подробно и пошагово, пожалуйста... Речь идет про делфи, для тех кто в танке!
думаю, алогоритм такой:
1) получить список адресов для спайдинга
а) ручками
б) с помощью поисковика, например спайдер делает запрос в гугл на частозапрашиваемое слово. потом выцепляет оттуда ссылки на найденные сайты (*)
2) делать запросы на адреса, получать хтмл код в ответ и выдирать из него мыльники по маске (например, все слова (строки?) вида *@*.*
(*) означает, что я не знаю (мне стыдно :) ), как реализовать получение хтмл кода в обратном запросе, но думаю, это очень просто =)
ЗЫ [krot], можешь постучать мне в асю. разберемся вместе)
Использование WebBrowser'а нецелесообразно для такой задачи!
Надо GET запросом HTML-ку получить без использования WebBrowser'a, а затем отпарсить её...
Delphi исходник бесплатного HTML парсера. (http://megalib.com/item_show.htm?gl_item_id=901&gl_subject_id=21&action=item_show)
NetMan
Я считаю, страничку необходимо загружать и работать не только с кодом но и с уже обработаной браузером страничкой, т.к. при этом можно выдерать защищенные с помощью явы мыльники, а их частенько защищают так:
<!-- Защита Е-Майл от СПАМА-->
<center><font face="Arial">
<script LANGUAGE="Javascript">
username="mymail"
at="@"
domainname="mail.ru"
document.write("<A HREF='mailto:"+username+""+at+""+domainname+"'>"+username+""+at+""+domainname+"</a>")
</script>
</center></font>
<!--Конец ЗАЩИТЫ от СПАМА-->
Результат будет такой: mymail@mail.ru
здесь еще примеры защиты мыльника: _http://www.bizzon-board.com/forum/viewtopic.php?t=781
Так что, получается страничку все таки загружать необходимо, а значит и WebBrowser использовать.... либо ему подобный компонент(вот мне и нужна помощь в создании наследника, в котором не будет графики!).....
Piflit
Подобный алгоритм у меня уже есть, пока вся проблема заключается в уменьшении трафика...
А по части аси, кинь лучше в пм, а то расшифровывать влом, да и никогда этим не занимался :)
По поводу отключения картинок http://forum.sources.ru/index.php?showtopic=185383
NetMan
Пасиб за ссылочку, скачал компоненту... попробую...
Но все же я сам хочу написать подобную компоненту- наследника от браузера, как понимаю это не очень сложно сделать....
+1 за ссылку ;)
vBulletin® v3.8.14, Copyright ©2000-2026, vBulletin Solutions, Inc. Перевод: zCarot