HOME    FORUMS    MEMBERS    RECENT POSTS    LOG IN  
Баннер 1   Баннер 2

ANTICHAT — форум по информационной безопасности, OSINT и технологиям

ANTICHAT — русскоязычное сообщество по безопасности, OSINT и программированию. Форум ранее работал на доменах antichat.ru, antichat.com и antichat.club, и теперь снова доступен на новом адресе — forum.antichat.xyz.
Форум восстановлен и продолжает развитие: доступны архивные темы, добавляются новые обсуждения и материалы.
⚠️ Старые аккаунты восстановить невозможно — необходимо зарегистрироваться заново.
Вернуться   Форум АНТИЧАТ > ПРОГРАММИРОВАНИЕ > С/С++, C#, Rust, Swift, Go, Java, Perl, Ruby
   
Ответ
 
Опции темы Поиск в этой теме Опции просмотра

  #1  
Старый 28.05.2007, 16:57
Piflit
Banned
Регистрация: 11.08.2006
Сообщений: 1,522
Провел на форуме:
5128756

Репутация: 2032


Отправить сообщение для Piflit с помощью ICQ
По умолчанию

думаю, алогоритм такой:
1) получить список адресов для спайдинга
а) ручками
б) с помощью поисковика, например спайдер делает запрос в гугл на частозапрашиваемое слово. потом выцепляет оттуда ссылки на найденные сайты (*)
2) делать запросы на адреса, получать хтмл код в ответ и выдирать из него мыльники по маске (например, все слова (строки?) вида *@*.*
(*) означает, что я не знаю (мне стыдно ), как реализовать получение хтмл кода в обратном запросе, но думаю, это очень просто =)
ЗЫ [krot], можешь постучать мне в асю. разберемся вместе)
 
Ответить с цитированием

  #2  
Старый 28.05.2007, 16:59
NetMan
Участник форума
Регистрация: 09.02.2004
Сообщений: 122
Провел на форуме:
1089794

Репутация: 134
По умолчанию

Использование WebBrowser'а нецелесообразно для такой задачи!
Надо GET запросом HTML-ку получить без использования WebBrowser'a, а затем отпарсить её...
Delphi исходник бесплатного HTML парсера.
 
Ответить с цитированием

  #3  
Старый 29.05.2007, 08:35
[krot]
Познающий
Регистрация: 24.05.2007
Сообщений: 43
Провел на форуме:
484522

Репутация: 17
По умолчанию

NetMan
Я считаю, страничку необходимо загружать и работать не только с кодом но и с уже обработаной браузером страничкой, т.к. при этом можно выдерать защищенные с помощью явы мыльники, а их частенько защищают так:
Цитата:
<!-- Защита Е-Майл от СПАМА-->
<center><font face="Arial">
<script LANGUAGE="Javascript">
username="mymail"
at="@"
domainname="mail.ru"
document.write("<A HREF='mailto:"+username+""+at+""+domainname+"'>"+u sername+""+at+""+domainname+"</a>")
</script>
</center></font>
<!--Конец ЗАЩИТЫ от СПАМА-->
Результат будет такой: mymail@mail.ru
здесь еще примеры защиты мыльника: _http://www.bizzon-board.com/forum/viewtopic.php?t=781
Так что, получается страничку все таки загружать необходимо, а значит и WebBrowser использовать.... либо ему подобный компонент(вот мне и нужна помощь в создании наследника, в котором не будет графики!).....


Piflit
Подобный алгоритм у меня уже есть, пока вся проблема заключается в уменьшении трафика...
А по части аси, кинь лучше в пм, а то расшифровывать влом, да и никогда этим не занимался
 
Ответить с цитированием

  #4  
Старый 29.05.2007, 17:16
NetMan
Участник форума
Регистрация: 09.02.2004
Сообщений: 122
Провел на форуме:
1089794

Репутация: 134
По умолчанию

По поводу отключения картинок http://forum.sources.ru/index.php?showtopic=185383
 
Ответить с цитированием

  #5  
Старый 31.05.2007, 16:36
[krot]
Познающий
Регистрация: 24.05.2007
Сообщений: 43
Провел на форуме:
484522

Репутация: 17
По умолчанию

NetMan
Пасиб за ссылочку, скачал компоненту... попробую...
Но все же я сам хочу написать подобную компоненту- наследника от браузера, как понимаю это не очень сложно сделать....
+1 за ссылку
 
Ответить с цитированием
Ответ



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Исходник Криптора на Delphi slesh С/С++, C#, Rust, Swift, Go, Java, Perl, Ruby 15 16.06.2008 22:34
НУжен Хелп Хацкеров anakin Болталка 18 21.09.2006 19:21
Нужен форум PEPSICOLA Болталка 6 02.02.2005 22:10



Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
 


Быстрый переход




ANTICHAT.XYZ