
05.10.2008, 11:29
|
|
Познавший АНТИЧАТ
Регистрация: 01.06.2008
Сообщений: 1,047
Провел на форуме: 5321514
Репутация:
3313
|
|
Сообщение от Red_Red1
2 Кубик Рубик, вот такой парсер получился, попробуй может оно.
PHP код:
<?
header("Content-Type: text/html; charset=utf-8");
function gooParce ($keyword,$start)//$keyword - запрос, $start с какой страницы гугла выводить (начинается с нуля, шаг 10)
{
$url = 'http://www.google.ru/search?complete=1&hl=ru&lr=&newwindow=1&as_qdr=all&q='.urlencode($keyword).'&start='.$start.'0&sa=N';
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER,1);
$rs = curl_exec($ch);
$doc = new DOMDocument('1.0', 'utf-8');
@$doc->loadHTML($rs);//Загружаем в ДУМ
$d=$doc->getElementsByTagName('cite');
for ($i=0; $i<$d->length;$i++)
{
$ss=$d->item($i)->nodeValue;
$x=strpos($ss,' ');//Ищу пробел
$ss=substr($ss,0,$x);//вырезаю адрес
$ret[$i]=$ss;
}
return $ret;
}
//------------------------------------------------------------------------------
echo '<pre>';
print_r (gooParce('site:.cc',0));
echo '</pre>';
?>
так никогда не делай. Соединение нужно закрыть curl_close()
+в данном случае желательно использовать file_get_contents, т.к не надо передававать никаких заголовков
|
|
|