HOME FORUMS MEMBERS RECENT POSTS LOG IN  
× Авторизация
Имя пользователя:
Пароль:
Нет аккаунта? Регистрация
Баннер 1   Баннер 2
НОВЫЕ ТОРГОВАЯ НОВОСТИ ЧАТ
loading...
Скрыть
Вернуться   ANTICHAT > ПРОГРАММИРОВАНИЕ > PHP
   
Ответ
 
Опции темы Поиск в этой теме Опции просмотра

Помогите мне сделать web-паучка
  #1  
Старый 14.07.2008, 17:31
MafiaBoy3
Banned
Регистрация: 14.04.2007
Сообщений: 297
С нами: 10040168

Репутация: 38
По умолчанию Помогите мне сделать web-паучка

Как обычно GOOGLIL но нифига не нашол.

Как на php + mysql можно сделать простого паучка, который бы работал по следующему алгоритму:
1. Получить ссылку на ресурс.
2. Паук заходит на сайт и собирает ссылки на все страницы.
3. По найденным ссылкам на страницы он добавляет найденный материал (текст страницы)
в базу данных Mysql.


Помогите , просто даже не знаю с чего начать.
 
Ответить с цитированием

  #2  
Старый 14.07.2008, 17:40
diehard
Постоянный
Регистрация: 30.09.2007
Сообщений: 815
С нами: 9796693

Репутация: 659


По умолчанию

начни с чтения по темам:
Сокеты + регулярные выражения + Insert Into
 
Ответить с цитированием

  #3  
Старый 14.07.2008, 18:41
mff
Познавший АНТИЧАТ
Регистрация: 12.03.2008
Сообщений: 1,379
С нами: 9560486

Репутация: 1809


По умолчанию

Посмотри скрипт который писал NOmeR1
Цитата:
Сообщение от NOmeR1  
Уф.. Я сёдня потрудился, написал скрипт, который получает все ссылки с сайта.
http://forum.antichat.ru/threadnav65761-36-10.html
 
Ответить с цитированием

  #4  
Старый 14.07.2008, 18:48
.:EnoT:.
Постоянный
Регистрация: 29.05.2007
Сообщений: 850
С нами: 9975266

Репутация: 1916


По умолчанию

Мало понял из того что ТС написал....непонятно откуда получать ссылку на ресурс, какую именно инфу сохранять и т.д....
Вот самый простейший пример:
PHP код:
<?php
#Подключаем БД
mysql_connect('localhost''user''pass') or die('No connect');
mysql_select_db('mysql') or die('No connect');
#Откуда-то получаем ссылку на ресурс
$site 'site.ru';
#Хапаем код сайта
$content file_get_contents($site);
#Парсим ссылки
preg_match_all('/<a href="(.+)" (.+)<\/a>/'$content$links);
#Ходим по ссылкам и сохраняем инфу в БД
foreach($links[1] as $link){
        
#Получаем инфу с сайта
    
$str file_get_contents($link);
        
#Заносим в БД
    
mysql_query('INSERT INTO `table` VALUE(null, '.$str.')');
    
mysql_close();
}
?>
Более того готовый скрипт парсинга выложили выше, тебе только доработать под себя....не забывай только проверять на абсолютные и относительные ссылки.
 
Ответить с цитированием

  #5  
Старый 14.07.2008, 21:04
mr.The
Познавший АНТИЧАТ
Регистрация: 30.04.2007
Сообщений: 1,205
С нами: 10016425

Репутация: 1257


По умолчанию

если я правильно понял, то алгоритм такой:
1) даёш паучку ссайт
2) он берёт с него все ссылки и
2.1)добавляет в бд
2.2)переходит по ним. далее к п.2

хотя может тебе просто нужен поисковый двиг... =\
 
Ответить с цитированием

  #6  
Старый 15.07.2008, 09:22
biophreak
Постоянный
Регистрация: 03.08.2007
Сообщений: 367
С нами: 9880226

Репутация: 209
По умолчанию

Хм...по этому алгоритму оно может нихреново зациклиться )))
 
Ответить с цитированием

  #7  
Старый 25.07.2008, 03:48
Whirt
Участник форума
Регистрация: 24.06.2008
Сообщений: 105
С нами: 9410256

Репутация: 276
По умолчанию

Цитата:
Сообщение от biophreak  
Хм...по этому алгоритму оно может нихреново зациклиться )))
+1, поэтому нужно составить карту ссылок, исключающую дубликаты, иначе будет вечный цикл. Так же опционально можно сделать фильтр глубины, чтобы уменьшить число итераций (допустим обрабатываются ссылки на 3 уровня вниз, обрабатываются ссылки только с данного домена, etc.)
 
Ответить с цитированием
Ответ



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Письма девочек-подростков в журнал "Yes!" Lolik Болталка 43 03.03.2009 22:43
Как сделать сниффер??? Помогите!!! GooF PHP 13 25.05.2005 05:18
Помогите сделать , что-нибудь плохое с форумом ромашка Болталка 94 18.04.2005 06:43



Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
 


Быстрый переход




ANTICHAT ™ © 2001- Antichat Kft.

×

Создать сделку

Продавец: ник или ID

Название сделки:

Сумма USDT:

Срок сделки, дней:

Кто платит комиссию:

Условия сделки:

После создания сделки средства будут зарезервированы в холде до завершения сделки.

×

Мои сделки

Загрузка...
×

Сделка


Загрузка чата...
×

ESCROW ADMIN PANEL

Загрузка...
Загрузка...