
17.11.2009, 20:18
|
|
Познающий
Регистрация: 27.11.2007
Сообщений: 97
Провел на форуме: 540764
Репутация:
57
|
|
Парсим выдачу google blog search
Хочу написать парсер выдачи google blog search, столкнулся с проблемой, не получается сделать проверку собранных урлов из google blog search на уникальность.
Логика работы, собираем из фида ссылки, и потом сравниваем с сылками из файла, если совпадение не найдено передаем уникальные урлы дальше. Кривая регулярка для парсинга уролов:
Код:
$url = "http://blogsearch.google.com/blogsearch_feeds?hl=en&q=bla&lr=&ie=utf-8&num=10&output=rss";
$rss = @file_get_contents($url);
$count = 10;
for ($i = 0; $i < $count; $i++) {
preg_match_all("|<link>(.*)</link>|Uis", $rss, $linka);
}
echo var_dump($linka);
|
|
|