![]() |
Помогите мне сделать web-паучка
Как обычно GOOGLIL но нифига не нашол.
Как на php + mysql можно сделать простого паучка, который бы работал по следующему алгоритму: 1. Получить ссылку на ресурс. 2. Паук заходит на сайт и собирает ссылки на все страницы. 3. По найденным ссылкам на страницы он добавляет найденный материал (текст страницы) в базу данных Mysql. Помогите , просто даже не знаю с чего начать. |
начни с чтения по темам:
Сокеты + регулярные выражения + Insert Into |
Посмотри скрипт который писал NOmeR1
Цитата:
|
Мало понял из того что ТС написал....непонятно откуда получать ссылку на ресурс, какую именно инфу сохранять и т.д....
Вот самый простейший пример: PHP код:
|
если я правильно понял, то алгоритм такой:
1) даёш паучку ссайт 2) он берёт с него все ссылки и 2.1)добавляет в бд 2.2)переходит по ним. далее к п.2 хотя может тебе просто нужен поисковый двиг... =\ |
Хм...по этому алгоритму оно может нихреново зациклиться :))))
|
Цитата:
|
| Время: 12:34 |