
25.11.2008, 11:01
|
|
Участник форума
Регистрация: 19.02.2008
Сообщений: 186
С нами:
9591697
Репутация:
96
|
|
Опять я с тупыми вопросами  Теперь у мну не работает парсер.
Код:
#Обьявление необходимых модулей
use warnings;
use LWP 5.64;
use encoding "cp1251";
#Создаем "броузер" и обьявляем переменные
$urlWnews='http://www.kinopoisk.ru/level/2/page/';
$newsview='http://www.kinopoisk.ru/level/2/news/';
$numbOnpage=5;
$parsWpage=2;
$browser = LWP::UserAgent->new;
$browser->agent('Mozilla/4.76 [en] (Win98; U)');
#Узнаем номер новостей на каждой странице
$sr=1;$i=0;
while($parsWpage > $sr){
$urlWnews="http://www.kinopoisk.ru/level/2/page/" . "$sr";
print "Parsim $urlWnews\n";
while($numbOnpage > $i) {
$response=$browser->get($urlWnews) or die ("DIE!");
$response=$response->as_string;
@ms=$response=~m/<a href="\/level\/2\/news\/(.*)\/" class="continue">/ig;
print $ms[$i] . "\n";
$i++;
}
$i=0;
$sr++;
}
#Самый чоткий момент, вытаскиваем новости! #Помочь тут :))
$i=0;$max=$#ms;
while($max > $i){
$newsview .= $ms[$i];
$response=$browser->get($newsview) or die ("DIE!");
$response=$response->as_string;
@titl=$response=~m/<title>(.*)<\/title>/ig;
$titl[$i] .= '.txt';
@text=$response=~m/<tr><td style="padding-top:10px;padding-bottom:20px" colspan=2 class="news">[^\.]<td><\/tr>/ig; # ВОт тут не получается
open(FF,">$titl[$i]");
print FF $text;
close(FF);
}
Cобственно говоря все до парсинга самой новости работает. А вот с последним проблемы, помогите плз!
Последний раз редактировалось $p01nt; 25.11.2008 в 15:32..
|
|
|