PDA

Просмотр полной версии : Парсер


Велемир
28.01.2009, 19:30
Есть у кого парсер www.rabota.ru ? Или как такой написать ? Ниче в голову не приходит =_=

D Mak
28.01.2009, 20:11
что именно надо парсить? могу написать на пхп

kik8888
28.01.2009, 20:34
Открываешь html код страницы изучаешь между какими неповторьящимися в других местах структурами находится то, что нужно парсить.
Отправляешь запрос на эту страницу и с помощью функции работы со строками вытаскиваешь то что нужно и сохраняешь как нужно.
Если то что нужно парсить находится на разных страницах смотришь в коде как меняются страницы и организовываешь все запросы с вытаскиванием нужного (каждый для каждой страницы) в цикле.
Вот и весь принцип работы, пиши, повышай свой уровень знаний, а он повышается только на практике.

mailbrush
28.01.2009, 21:14
стукай в аську, либо пиши тут, что именно написать надо...

diehard
28.01.2009, 21:18
Ничего не приходит в голову? Начни читать с php.net

mailbrush
28.01.2009, 21:22
Может ТС имеет ввиду фейк?

rushter
28.01.2009, 21:30
Может ТС имеет ввиду фейк?
он же написал - парсер,только вот чего парсить хз

Pashkela
28.01.2009, 22:10
Как чего? Работу, должности, зарплату и всё автоматически:)

Велемир
28.01.2009, 23:15
Угу:)))Прошу прощения,что не отвечал,тут ачат не грузился вообще =_=.Спарсить я хотел содержимое конкретных тегов хтмл...но чёт не выходит =_= Вот,начал набрасывать:

<?php
$s = array();
$fp = fsockopen ("www.rabota.ru", 80, $errno, $errstr, 30);
if(!$fp) {
echo $errstr;
} else {
fwrite($fp, "GET / HTTP/1.1\r\nHost: www.rabota.ru\r\nConnection: Keep-Alive\r\n\r\n");
$data = '';
while(!feof($fp)) {
$data .= fread($fp, 4096);

}
}

$x = trim($data);
$s = explode("<option value=",$x);
$d = fopen("C:\Program Files\VertrigoServ\www\ga.txt",w);
if($d) {

for($i = 0;$i<count($s);$i++) {
fwrite($d,$s[$i]);
}
fclose($d);

}


?>

Эт своего рода псевдокод,так как там хватает ошибок:).Как вариант можно слить страницу на винт и там как-то вытащить данные...Но среди этой кучи мусора я не знаю (.Сайт Работы просто выбрал).

Pashkela
28.01.2009, 23:19
Неправильный подход. Или понимание того, как надо спрашивать. А спрашивать надо так:

Вот есть страница такая-то (точный урл), как мне с неё спарсить такие-то данные:

1. Название огранизации-работодателя
2. Контактный телефон
3.....

vikseriq
29.01.2009, 22:18
ТС, стукни - расскажу и продвину ) И определись точнее, что хочешь парсить: свежее, определенный город/профессию/пол Не стейняйся. Про опыт правду сказали.