PDA

Просмотр полной версии : Ищу скрипты - спайдеры


Algol
21.09.2006, 12:55
Ищу скрипты для создания поисковой машины. Необходим спайдер для сканирования web-сайтов инета (НЕ одного сайта).
Язык - любой (в т.ч. Perl и C) - под юникс.
Если кто нить где-то встречал подобные (возможно и платные) скрипты - просьба отписать.

censored!
21.09.2006, 13:27
Может ковырнуть: http://company.yandex.ru/technology/products/yandex-server.xml

Algol
22.09.2006, 02:40
Может ковырнуть: http://company.yandex.ru/technology/products/yandex-server.xml

Нет, ковырять не нужно :)

madnet
22.09.2006, 10:50
Гляень MnoGoSearch отличная софтина, под никсы бесплатная. Сам на ней сижу.

Все удобно кладется в БД. Работает со всеми типами БД. можно организовать как поиск по сайту так и по сети.

Выводить можно из БД встроеными средствами своим скриптом либо использовать php api после установки модуля. Вообщем замечательная штука, особенно учитывая ее цену.

Система - http://www.mnogosearch.org/
Неплохой ман - http://linux.yaroslavl.ru/docs/conf/mnogosearch/index-ru.html

Егорыч+++
22.09.2006, 10:58
http://www.cs.ioc.ee/~ando/sphider/

А вообще тут много всего

http://www.hotscripts.com/PHP/Scripts_and_Programs/Search_Engines/index.html

Algol
22.09.2006, 11:18
Гляень MnoGoSearch отличная софтина, под никсы бесплатная. Сам на ней сижу.

Все удобно кладется в БД. Работает со всеми типами БД. можно организовать как поиск по сайту так и по сети.

Выводить можно из БД встроеными средствами своим скриптом либо использовать php api после установки модуля. Вообщем замечательная штука, особенно учитывая ее цену.

Система - http://www.mnogosearch.org/
Неплохой ман - http://linux.yaroslavl.ru/docs/conf/mnogosearch/index-ru.html

Да, это я находил, смотрел описание. Но по-моему она ориентированна на индексирование одного сайта. Кроме того, серьезные инет-поисковики на БД не сидят, это крайне неэффективно.

madnet
22.09.2006, 13:14
>Да, это я находил, смотрел описание. Но по-моему она ориентированна на >индексирование одного сайта. Кроме того, серьезные инет-поисковики на БД не сидят, это крайне неэффективно.

Нет какразтаки она ориентировано на вариацию, тоесть ты можеш выбрать мультиДБ и работать со множеством сайтов, конечно до поисковика типа Гугла она не дотянет я не спорю.

По поводу БД трудно сказать, не нравится БД бери сурс и меняй на что хочеш!

[hidden]
22.09.2006, 20:04
Algol, а как же иначе хранить данные по проиндексированным сайтам, как не в БД?

bul.666
23.09.2006, 01:50
Впринципе сожно и на файлах...

madnet
25.10.2006, 14:34
Algol, напиши plz чем закончились твои поиски!

ZaCo
25.10.2006, 20:32
2bul.666 да просто гениально.
>>серьезные инет-поисковики на БД не сидят, это крайне неэффективно.
почему бы не использовать бд типа sqlite?)