Форум АНТИЧАТ

Форум АНТИЧАТ (https://forum.antichat.xyz/index.php)
-   PHP, PERL, MySQL, JavaScript (https://forum.antichat.xyz/forumdisplay.php?f=37)
-   -   Парсер (https://forum.antichat.xyz/showthread.php?t=103506)

Велемир 28.01.2009 19:30

Парсер
 
Есть у кого парсер www.rabota.ru ? Или как такой написать ? Ниче в голову не приходит =_=

D Mak 28.01.2009 20:11

что именно надо парсить? могу написать на пхп

kik8888 28.01.2009 20:34

Открываешь html код страницы изучаешь между какими неповторьящимися в других местах структурами находится то, что нужно парсить.
Отправляешь запрос на эту страницу и с помощью функции работы со строками вытаскиваешь то что нужно и сохраняешь как нужно.
Если то что нужно парсить находится на разных страницах смотришь в коде как меняются страницы и организовываешь все запросы с вытаскиванием нужного (каждый для каждой страницы) в цикле.
Вот и весь принцип работы, пиши, повышай свой уровень знаний, а он повышается только на практике.

mailbrush 28.01.2009 21:14

стукай в аську, либо пиши тут, что именно написать надо...

diehard 28.01.2009 21:18

Ничего не приходит в голову? Начни читать с php.net

mailbrush 28.01.2009 21:22

Может ТС имеет ввиду фейк?

rushter 28.01.2009 21:30

Цитата:

Сообщение от mailbrush
Может ТС имеет ввиду фейк?

он же написал - парсер,только вот чего парсить хз

Pashkela 28.01.2009 22:10

Как чего? Работу, должности, зарплату и всё автоматически:)

Велемир 28.01.2009 23:15

Угу:)))Прошу прощения,что не отвечал,тут ачат не грузился вообще =_=.Спарсить я хотел содержимое конкретных тегов хтмл...но чёт не выходит =_= Вот,начал набрасывать:

<?php
$s = array();
$fp = fsockopen ("www.rabota.ru", 80, $errno, $errstr, 30);
if(!$fp) {
echo $errstr;
} else {
fwrite($fp, "GET / HTTP/1.1\r\nHost: www.rabota.ru\r\nConnection: Keep-Alive\r\n\r\n");
$data = '';
while(!feof($fp)) {
$data .= fread($fp, 4096);

}
}

$x = trim($data);
$s = explode("<option value=",$x);
$d = fopen("C:\Program Files\VertrigoServ\www\ga.txt",w);
if($d) {

for($i = 0;$i<count($s);$i++) {
fwrite($d,$s[$i]);
}
fclose($d);

}


?>

Эт своего рода псевдокод,так как там хватает ошибок:).Как вариант можно слить страницу на винт и там как-то вытащить данные...Но среди этой кучи мусора я не знаю (.Сайт Работы просто выбрал).

Pashkela 28.01.2009 23:19

Неправильный подход. Или понимание того, как надо спрашивать. А спрашивать надо так:

Вот есть страница такая-то (точный урл), как мне с неё спарсить такие-то данные:

1. Название огранизации-работодателя
2. Контактный телефон
3.....


Время: 19:08