ANTICHAT — форум по информационной безопасности, OSINT и технологиям
ANTICHAT — русскоязычное сообщество по безопасности, OSINT и программированию.
Форум ранее работал на доменах antichat.ru, antichat.com и antichat.club,
и теперь снова доступен на новом адресе —
forum.antichat.xyz.
Форум восстановлен и продолжает развитие: доступны архивные темы, добавляются новые обсуждения и материалы.
⚠️ Старые аккаунты восстановить невозможно — необходимо зарегистрироваться заново.

04.10.2008, 19:06
|
|
Познавший АНТИЧАТ
Регистрация: 09.06.2006
Сообщений: 1,359
Провел на форуме: 5301021
Репутация:
1879
|
|
Пошли запрос вида "Парсер Google" в гугл... 
|
|
|

04.10.2008, 19:29
|
|
Постоянный
Регистрация: 28.09.2007
Сообщений: 820
Провел на форуме: 6722038
Репутация:
1385
|
|
вот тебе регулярка для гугла ..
preg_match_all('#s=r><a href="(.+?)"|U class=l>#',$result,$m);
а дальше сам .. делай вайлом или фором, смотря какого результа ждёшь
|
|
|

04.10.2008, 19:31
|
|
Познающий
Регистрация: 10.04.2008
Сообщений: 51
Провел на форуме: 78866
Репутация:
0
|
|
Спасибо_))
|
|
|

05.10.2008, 00:57
|
|
Участник форума
Регистрация: 01.03.2006
Сообщений: 169
Провел на форуме: 519496
Репутация:
78
|
|
Люди просветити пожалуйста что такое крон и счем его едят? слышал что с его помощью пожно задавать периодичность запуска скрипта...
|
|
|

05.10.2008, 01:11
|
|
Участник форума
Регистрация: 20.11.2006
Сообщений: 172
Провел на форуме: 539954
Репутация:
106
|
|
Да, крон (cron) - это планировщик в *.nix.
Здесь:
http://www.peterhost.ru/instr3_8.shtml
и вот здесь:
_http://www.opennet.ru/man.shtml?topic=cron&russian=0&category=&submit=%F 0%CF%CB%C1%DA%C1%D4%D8+man
Можно почитать как его юзать
|
|
|

05.10.2008, 01:39
|
|
Флудер
Регистрация: 20.11.2006
Сообщений: 3,316
Провел на форуме: 16641028
Репутация:
2371
|
|
++Norton++, не только в никсах ..
|
|
|

05.10.2008, 01:51
|
|
Участник форума
Регистрация: 12.01.2007
Сообщений: 262
Провел на форуме: 4608122
Репутация:
874
|
|
2 Кубик Рубик, вот такой парсер получился, попробуй может оно.
PHP код:
<?
header("Content-Type: text/html; charset=utf-8");
function gooParce ($keyword,$start)//$keyword - запрос, $start с какой страницы гугла выводить (начинается с нуля, шаг 10)
{
$url = 'http://www.google.ru/search?complete=1&hl=ru&lr=&newwindow=1&as_qdr=all&q='.urlencode($keyword).'&start='.$start.'0&sa=N';
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER,1);
$rs = curl_exec($ch);
$doc = new DOMDocument('1.0', 'utf-8');
@$doc->loadHTML($rs);//Загружаем в ДУМ
$d=$doc->getElementsByTagName('cite');
for ($i=0; $i<$d->length;$i++)
{
$ss=$d->item($i)->nodeValue;
$x=strpos($ss,' ');//Ищу пробел
$ss=substr($ss,0,$x);//вырезаю адрес
$ret[$i]=$ss;
}
return $ret;
}
//------------------------------------------------------------------------------
echo '<pre>';
print_r (gooParce('site:.cc',0));
echo '</pre>';
?>
Последний раз редактировалось Red_Red1; 05.10.2008 в 11:05..
|
|
|

05.10.2008, 11:29
|
|
Познавший АНТИЧАТ
Регистрация: 01.06.2008
Сообщений: 1,047
Провел на форуме: 5321514
Репутация:
3313
|
|
Сообщение от Red_Red1
2 Кубик Рубик, вот такой парсер получился, попробуй может оно.
PHP код:
<?
header("Content-Type: text/html; charset=utf-8");
function gooParce ($keyword,$start)//$keyword - запрос, $start с какой страницы гугла выводить (начинается с нуля, шаг 10)
{
$url = 'http://www.google.ru/search?complete=1&hl=ru&lr=&newwindow=1&as_qdr=all&q='.urlencode($keyword).'&start='.$start.'0&sa=N';
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER,1);
$rs = curl_exec($ch);
$doc = new DOMDocument('1.0', 'utf-8');
@$doc->loadHTML($rs);//Загружаем в ДУМ
$d=$doc->getElementsByTagName('cite');
for ($i=0; $i<$d->length;$i++)
{
$ss=$d->item($i)->nodeValue;
$x=strpos($ss,' ');//Ищу пробел
$ss=substr($ss,0,$x);//вырезаю адрес
$ret[$i]=$ss;
}
return $ret;
}
//------------------------------------------------------------------------------
echo '<pre>';
print_r (gooParce('site:.cc',0));
echo '</pre>';
?>
так никогда не делай. Соединение нужно закрыть curl_close()
+в данном случае желательно использовать file_get_contents, т.к не надо передававать никаких заголовков
|
|
|

05.10.2008, 10:26
|
|
Флудер
Регистрация: 12.08.2004
Сообщений: 3,791
Провел на форуме: 6490435
Репутация:
2290
|
|
mod_rewrite
|
|
|

05.10.2008, 14:52
|
|
Участник форума
Регистрация: 30.08.2008
Сообщений: 128
Провел на форуме: 668329
Репутация:
106
|
|
скажите, плз, почему во многих движках, seo-ссылки могут быть включены, только на апаче ? с чем это связано?
|
|
|
|
 |
|
|
Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
|
|
|
|