
28.05.2007, 16:57
|
|
Banned
Регистрация: 11.08.2006
Сообщений: 1,522
С нами:
10393869
Репутация:
2032
|
|
думаю, алогоритм такой:
1) получить список адресов для спайдинга
а) ручками
б) с помощью поисковика, например спайдер делает запрос в гугл на частозапрашиваемое слово. потом выцепляет оттуда ссылки на найденные сайты (*)
2) делать запросы на адреса, получать хтмл код в ответ и выдирать из него мыльники по маске (например, все слова (строки?) вида *@*.*
(*) означает, что я не знаю (мне стыдно  ), как реализовать получение хтмл кода в обратном запросе, но думаю, это очень просто =)
ЗЫ [krot], можешь постучать мне в асю. разберемся вместе)
|
|
|