
09.12.2008, 05:21
|
|
Постоянный
Регистрация: 24.05.2008
Сообщений: 589
Провел на форуме: 3629857
Репутация:
504
|
|
собственно я реализовал что-то подобное только на пхп (следовательно без многопоточности) пару деньков назад и вот что получилось:
PHP код:
// Mail harvester by gisTy
set_time_limit(0);
$crountMax = 200; //через сколько шагов проверять мыльники на наличие повторов и сохранять результат в файл.
$crount = 0;
$db = 0;
$massive[] = '';
$fh = fopen("mails.txt","a");//где mails.txt - файл с мыльниками.
for($i = 1;;$i++)
{
$url = "http://otvet.mail.ru/question/".$i;
$packet = file_get_contents($url);
preg_match_all("/<span id=\"online:(.*?)\" class=/i", $packet, $result);
$mas = array_pop($result);
$temp = array_merge($massive, $mas);
$massive = $temp;
$crount++;
if($crount == $crountMax)
{
$result = array_unique($massive);
fwrite($fh, implode("\n",$result));
$db += count($result);
unset($massive);
$massive[] = '';
unset($result);
unset($temp);
unset($mas);
unset($crount);
}
$packet = '';
}
?>
|
|
|