Pycckoe1
19.09.2009, 02:27
В общем может у кого есть парсер, который парсит рефераты с сайта http://referat.yandex.ru/ или может кто написать может?
только что накидал..
это чтобы парсил и выводил в браузер рефераты из раздела астрономия<?php
$site = file_get_contents("http://referat.yandex.ru/astronomy.xml");
#меняешь здесь astronomy.xml на нужный тебе(посмотреть их можно на главной, там ссылки будут на разделы)
preg_match("/margin-left:0;\">(.*)<\/h1>/i", $site, $title);
preg_match_all("/<p>(.*)<\/p>/i", $site, $text);
echo "<b>".$title[1]."</b>\n<br />\n";
foreach ($text[1] as $k => $val)
echo "<br />".$val."\n";
?>
это чтобы писал в файл с названием - как название реферата и текстом самого реферата внутри:
<?php
$site = file_get_contents("http://referat.yandex.ru/astronomy.xml");
#меняешь здесь astronomy.xml на нужный тебе(посмотреть их можно на главной, там ссылки будут на разделы)
preg_match("/margin-left:0;\">(.*)<\/h1>/i", $site, $title);
preg_match_all("/<p>(.*)<\/p>/i", $site, $text);
$fp = fopen($title[1]."txt", "w");
fwrite ($fp, implode("\n",$text[1]));
fclose($fp);
?>
vBulletin® v3.8.14, Copyright ©2000-2026, vBulletin Solutions, Inc. Перевод: zCarot