ANTICHAT.XYZ    VIDEO.ANTICHAT.XYZ    НОВЫЕ СООБЩЕНИЯ    ФОРУМ  
Баннер 1   Баннер 2
Antichat снова доступен.
Форум Antichat (Античат) возвращается и снова открыт для пользователей. Здесь обсуждаются безопасность, программирование, технологии и многое другое. Сообщество снова собирается вместе.
Новый адрес: forum.antichat.xyz
Вернуться   Форум АНТИЧАТ > Программирование > PHP, PERL, MySQL, JavaScript
   
Ответ
 
Опции темы Поиск в этой теме Опции просмотра

Переборщик +вывод в файл
  #1  
Старый 25.09.2007, 15:45
Аватар для Klaus Doring
Klaus Doring
Участник форума
Регистрация: 23.07.2007
Сообщений: 100
Провел на форуме:
620976

Репутация: 52
Отправить сообщение для Klaus Doring с помощью ICQ
По умолчанию Переборщик +вывод в файл

Есть ссылка mysyte.com/1.html
Нужно вывести содержимое страниц, для каждой отдельный файл в которых есть что нибудь, то есть не выводится слово error
есть 999999 файлов. Можно как то это сделать? Может есть какой нибудь уже готовый скрипт на Перле например?
 
Ответить с цитированием

  #2  
Старый 25.09.2007, 19:10
Аватар для demonoid
demonoid
Banned
Регистрация: 12.01.2007
Сообщений: 113
Провел на форуме:
4094601

Репутация: 495
По умолчанию

надеюсь я правильно понял

Код:
#!/usr/bin/perl -w

use LWP::Simple;
use strict;
use warnings;
 
use constant URL      => 'http://forum.antichat.ru/memberlist.php?s=&do=getall&page={PAGES}&sort=reputation&order=DESC&pp=50';
use constant MAX_PAGE => '4';  
use constant FORMAT   => 'html';

#   Опции:
#  ~~~~~~
#  Отсортировать результат поиска по: Репутация | по убываиню
#  Число пользователей на страницу: 50 

my $content = undef;
my $resp = undef;
my $url = URL;

for( 0..MAX_PAGE ) 
{
   $url  =~ s/{PAGES}/$_/e;
   print "[$_] GET $url \n";
   $content = get $url || exit printf "ERROR : get URL : %s \n",$url;
   open $resp, ">", "$_.".FORMAT;  
   print $resp $content;
   close( $resp );
   $url = URL;
}
 
Ответить с цитированием

  #3  
Старый 26.09.2007, 14:15
Аватар для Klaus Doring
Klaus Doring
Участник форума
Регистрация: 23.07.2007
Сообщений: 100
Провел на форуме:
620976

Репутация: 52
Отправить сообщение для Klaus Doring с помощью ICQ
По умолчанию

Что то не работает. Вроде задал параметр, который увеличиваться должен. Дело в том что там не html! И еще вывод в файл должен быть содержимого страниц.
 
Ответить с цитированием

  #4  
Старый 26.09.2007, 16:38
Аватар для demonoid
demonoid
Banned
Регистрация: 12.01.2007
Сообщений: 113
Провел на форуме:
4094601

Репутация: 495
По умолчанию

Напиши на конкретном примере, что не работает

Код:
use constant FORMAT   => 'html'; #Это формат, в который будут сохраняться страницы
Цитата:
И еще вывод в файл должен быть содержимого страниц.
Так и есть :\\
 
Ответить с цитированием

  #5  
Старый 26.09.2007, 16:57
Аватар для Spyder
Spyder
Members of Antichat - Level 5
Регистрация: 09.10.2006
Сообщений: 1,698
Провел на форуме:
9098076

Репутация: 4303


По умолчанию

Klaus Doring, хз, мб я глючу, но вот твой первый пост меня убил. Очень похоже на бессмысленный набор слов
Напиши нормально что тебе надо
 
Ответить с цитированием

  #6  
Старый 26.09.2007, 17:11
Аватар для Klaus Doring
Klaus Doring
Участник форума
Регистрация: 23.07.2007
Сообщений: 100
Провел на форуме:
620976

Репутация: 52
Отправить сообщение для Klaus Doring с помощью ICQ
По умолчанию

Ммм... как сделать. Отправляешь запрос, получаешь содержимое страницы, анализируешь его, сохраняешь если надо. Повторяешь 99999 раз.
Или на другом языке...
Цель:
Можно задавать адрес программе
Можно задавать увеличиваемый параметр в адресе
Можно фильтровать по слову, чтобы при Error404 не сохранялась страничка на диск
Можно сохранить все страницы от 1-99999.html
 
Ответить с цитированием
Ответ



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
МикроДжоинер для начинающих ReanimatoR Статьи 23 02.01.2010 15:07
Основные команды командной строчки. Егорыч+++ *nix 65 01.10.2009 17:27
Исправление для IPB 2.1.x _GaLs_ Форумы 6 20.06.2007 09:31
Урок анатомии .exe-вирусы $iD Авторские статьи 1 08.03.2007 10:15



Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
 


Быстрый переход




ANTICHAT.XYZ