ANTICHAT — форум по информационной безопасности, OSINT и технологиям
ANTICHAT — русскоязычное сообщество по безопасности, OSINT и программированию.
Форум ранее работал на доменах antichat.ru, antichat.com и antichat.club,
и теперь снова доступен на новом адресе —
forum.antichat.xyz.
Форум восстановлен и продолжает развитие: доступны архивные темы, добавляются новые обсуждения и материалы.
⚠️ Старые аккаунты восстановить невозможно — необходимо зарегистрироваться заново.
 |

25.09.2007, 15:45
|
|
Участник форума
Регистрация: 23.07.2007
Сообщений: 100
Провел на форуме: 620976
Репутация:
52
|
|
Переборщик +вывод в файл
Есть ссылка mysyte.com/1.html
Нужно вывести содержимое страниц, для каждой отдельный файл в которых есть что нибудь, то есть не выводится слово error
есть 999999 файлов. Можно как то это сделать? Может есть какой нибудь уже готовый скрипт на Перле например?
|
|
|

25.09.2007, 19:10
|
|
Banned
Регистрация: 12.01.2007
Сообщений: 113
Провел на форуме: 4094601
Репутация:
495
|
|
надеюсь я правильно понял
Код:
#!/usr/bin/perl -w
use LWP::Simple;
use strict;
use warnings;
use constant URL => 'http://forum.antichat.ru/memberlist.php?s=&do=getall&page={PAGES}&sort=reputation&order=DESC&pp=50';
use constant MAX_PAGE => '4';
use constant FORMAT => 'html';
# Опции:
# ~~~~~~
# Отсортировать результат поиска по: Репутация | по убываиню
# Число пользователей на страницу: 50
my $content = undef;
my $resp = undef;
my $url = URL;
for( 0..MAX_PAGE )
{
$url =~ s/{PAGES}/$_/e;
print "[$_] GET $url \n";
$content = get $url || exit printf "ERROR : get URL : %s \n",$url;
open $resp, ">", "$_.".FORMAT;
print $resp $content;
close( $resp );
$url = URL;
}
|
|
|

26.09.2007, 14:15
|
|
Участник форума
Регистрация: 23.07.2007
Сообщений: 100
Провел на форуме: 620976
Репутация:
52
|
|
Что то не работает. Вроде задал параметр, который увеличиваться должен. Дело в том что там не html! И еще вывод в файл должен быть содержимого страниц.
|
|
|

26.09.2007, 16:38
|
|
Banned
Регистрация: 12.01.2007
Сообщений: 113
Провел на форуме: 4094601
Репутация:
495
|
|
Напиши на конкретном примере, что не работает
Код:
use constant FORMAT => 'html'; #Это формат, в который будут сохраняться страницы
И еще вывод в файл должен быть содержимого страниц.
Так и есть :\\
|
|
|

26.09.2007, 16:57
|
|
Members of Antichat - Level 5
Регистрация: 09.10.2006
Сообщений: 1,698
Провел на форуме: 9098076
Репутация:
4303
|
|
Klaus Doring, хз, мб я глючу, но вот твой первый пост меня убил. Очень похоже на бессмысленный набор слов
Напиши нормально что тебе надо
|
|
|

26.09.2007, 17:11
|
|
Участник форума
Регистрация: 23.07.2007
Сообщений: 100
Провел на форуме: 620976
Репутация:
52
|
|
Ммм... как сделать. Отправляешь запрос, получаешь содержимое страницы, анализируешь его, сохраняешь если надо. Повторяешь 99999 раз.
Или на другом языке... 
Цель:
Можно задавать адрес программе
Можно задавать увеличиваемый параметр в адресе
Можно фильтровать по слову, чтобы при Error404 не сохранялась страничка на диск
Можно сохранить все страницы от 1-99999.html
|
|
|
|
 |
|
Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
|
|
|
|