ANTICHAT — форум по информационной безопасности, OSINT и технологиям
ANTICHAT — русскоязычное сообщество по безопасности, OSINT и программированию.
Форум ранее работал на доменах antichat.ru, antichat.com и antichat.club,
и теперь снова доступен на новом адресе —
forum.antichat.xyz.
Форум восстановлен и продолжает развитие: доступны архивные темы, добавляются новые обсуждения и материалы.
⚠️ Старые аккаунты восстановить невозможно — необходимо зарегистрироваться заново.

28.05.2007, 16:57
|
|
Banned
Регистрация: 11.08.2006
Сообщений: 1,522
Провел на форуме: 5128756
Репутация:
2032
|
|
думаю, алогоритм такой:
1) получить список адресов для спайдинга
а) ручками
б) с помощью поисковика, например спайдер делает запрос в гугл на частозапрашиваемое слово. потом выцепляет оттуда ссылки на найденные сайты (*)
2) делать запросы на адреса, получать хтмл код в ответ и выдирать из него мыльники по маске (например, все слова (строки?) вида *@*.*
(*) означает, что я не знаю (мне стыдно  ), как реализовать получение хтмл кода в обратном запросе, но думаю, это очень просто =)
ЗЫ [krot], можешь постучать мне в асю. разберемся вместе)
|
|
|

28.05.2007, 16:59
|
|
Участник форума
Регистрация: 09.02.2004
Сообщений: 122
Провел на форуме: 1089794
Репутация:
134
|
|
|
|
|

29.05.2007, 08:35
|
|
Познающий
Регистрация: 24.05.2007
Сообщений: 43
Провел на форуме: 484522
Репутация:
17
|
|
NetMan
Я считаю, страничку необходимо загружать и работать не только с кодом но и с уже обработаной браузером страничкой, т.к. при этом можно выдерать защищенные с помощью явы мыльники, а их частенько защищают так:
<!-- Защита Е-Майл от СПАМА-->
<center><font face="Arial">
<script LANGUAGE="Javascript">
username="mymail"
at="@"
domainname="mail.ru"
document.write("<A HREF='mailto:"+username+""+at+""+domainname+"'>"+u sername+""+at+""+domainname+"</a>")
</script>
</center></font>
<!--Конец ЗАЩИТЫ от СПАМА-->
Результат будет такой: mymail@mail.ru
здесь еще примеры защиты мыльника: _http://www.bizzon-board.com/forum/viewtopic.php?t=781
Так что, получается страничку все таки загружать необходимо, а значит и WebBrowser использовать.... либо ему подобный компонент(вот мне и нужна помощь в создании наследника, в котором не будет графики!).....
Piflit
Подобный алгоритм у меня уже есть, пока вся проблема заключается в уменьшении трафика...
А по части аси, кинь лучше в пм, а то расшифровывать влом, да и никогда этим не занимался 
|
|
|

29.05.2007, 17:16
|
|
Участник форума
Регистрация: 09.02.2004
Сообщений: 122
Провел на форуме: 1089794
Репутация:
134
|
|
|
|
|

31.05.2007, 16:36
|
|
Познающий
Регистрация: 24.05.2007
Сообщений: 43
Провел на форуме: 484522
Репутация:
17
|
|
NetMan
Пасиб за ссылочку, скачал компоненту... попробую...
Но все же я сам хочу написать подобную компоненту- наследника от браузера, как понимаю это не очень сложно сделать....
+1 за ссылку 
|
|
|
|
 |
|
|
Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
|
|
|
|