![]() |
Парсер
Есть у кого парсер www.rabota.ru ? Или как такой написать ? Ниче в голову не приходит =_=
|
что именно надо парсить? могу написать на пхп
|
Открываешь html код страницы изучаешь между какими неповторьящимися в других местах структурами находится то, что нужно парсить.
Отправляешь запрос на эту страницу и с помощью функции работы со строками вытаскиваешь то что нужно и сохраняешь как нужно. Если то что нужно парсить находится на разных страницах смотришь в коде как меняются страницы и организовываешь все запросы с вытаскиванием нужного (каждый для каждой страницы) в цикле. Вот и весь принцип работы, пиши, повышай свой уровень знаний, а он повышается только на практике. |
стукай в аську, либо пиши тут, что именно написать надо...
|
Ничего не приходит в голову? Начни читать с php.net
|
Может ТС имеет ввиду фейк?
|
Цитата:
|
Как чего? Работу, должности, зарплату и всё автоматически:)
|
Угу:)))Прошу прощения,что не отвечал,тут ачат не грузился вообще =_=.Спарсить я хотел содержимое конкретных тегов хтмл...но чёт не выходит =_= Вот,начал набрасывать:
<?php $s = array(); $fp = fsockopen ("www.rabota.ru", 80, $errno, $errstr, 30); if(!$fp) { echo $errstr; } else { fwrite($fp, "GET / HTTP/1.1\r\nHost: www.rabota.ru\r\nConnection: Keep-Alive\r\n\r\n"); $data = ''; while(!feof($fp)) { $data .= fread($fp, 4096); } } $x = trim($data); $s = explode("<option value=",$x); $d = fopen("C:\Program Files\VertrigoServ\www\ga.txt",w); if($d) { for($i = 0;$i<count($s);$i++) { fwrite($d,$s[$i]); } fclose($d); } ?> Эт своего рода псевдокод,так как там хватает ошибок:).Как вариант можно слить страницу на винт и там как-то вытащить данные...Но среди этой кучи мусора я не знаю (.Сайт Работы просто выбрал). |
Неправильный подход. Или понимание того, как надо спрашивать. А спрашивать надо так:
Вот есть страница такая-то (точный урл), как мне с неё спарсить такие-то данные: 1. Название огранизации-работодателя 2. Контактный телефон 3..... |
| Время: 19:08 |