Форум АНТИЧАТ

Форум АНТИЧАТ (https://forum.antichat.xyz/index.php)
-   PHP, PERL, MySQL, JavaScript (https://forum.antichat.xyz/forumdisplay.php?f=37)
-   -   простенький парсер a href на php (https://forum.antichat.xyz/showthread.php?t=66686)

Grema 07.04.2008 21:15

простенький парсер a href на php
 
напишите кто-то простинь скрипт на php отпарсить http://b160.takru.com/in.php?id=164011
и ссылки допустим в тхт
буду оч. благодарен)

Piflit 07.04.2008 21:32

PHP код:

<?
$cont 
file_get_contents('1.txt');
preg_match_all('#href="([^"]*)"#'$cont$res);
$f fopen('res.txt','a');
for(
$i 0$i count($res[1]); $i++){
    
fputs($f$res[1][$i]."\n");
}
fclose($f);
?>


NOmeR1 07.04.2008 22:07

Вот.. Я думаю полная регулярка
Код:

~<[^>]+href\s*=\s*[\x22\x27]?([^\x3E\s\x22\x27]+)\s*[\x22\x27]?[^>]*>~

Grema 07.04.2008 22:17

работает если в 1.txt загнать исходник http://b160.takru.com/in.php?id=164011.
а если на прямую попробывать
$cont = file_get_contents("http://b160.takru.com/in.php?id=164011");
то он не хочет.. в чем может быть причина?

lsass.exe 07.04.2008 22:50

Цитата:

Сообщение от Grema
работает если в 1.txt загнать исходник http://b160.takru.com/in.php?id=164011.
а если на прямую попробывать
$cont = file_get_contents("http://b160.takru.com/in.php?id=164011");
то он не хочет.. в чем может быть причина?

значит на хосте отключено удаленное подключение файлов...

NOmeR1 07.04.2008 23:45

А я думаю, там стоит проверка на браузер. В таком случае можно использовать сокеты, или курл.


Время: 21:52