PDA

Просмотр полной версии : Как собрать свой список сайтов с высоким ПР?


+r0ot?r+
01.05.2008, 12:08
Здравствуйте,не мог ли бы вы мне подсказать как быстро можно собрать список .edu сайтов с ПР>=5???
Если данный список есть у кого-либо,то прошу его выложить.Заранее спасибо.

kot777
01.05.2008, 13:57
Ща заодно шеллы к ним выложу

Piflit
01.05.2008, 13:59
Ща заодно шеллы к ним выложу
угу. с выборкой по рутшеллам с pr=9,10. ТС поставит +++

+r0ot?r+
01.05.2008, 14:49
Ща заодно шеллы к ним выложу

Было бы неплохо)))

Karantin
01.05.2008, 14:57
проще сразу нашару прогрузить стафф ТС

Underwit
01.05.2008, 15:55
Вот список едушек с пиаром.
Всё что выдал гугль.
пр >= 5
2 минуты работы
http://www.rapidshare.ru/662538

Спасибо спасибо! оваций и плюсов не надо)))

+r0ot?r+
01.05.2008, 16:21
Спасибо спасибо! оваций и плюсов не надо)))

Хоть не надо,но всё равно большое спасибо!

aka PSIH
01.05.2008, 16:49
Вот очень полезный скрипт:


--------[ Использование скрипта: ]---------------------

в файл search.inc вписываем все запросы к google, например:

site:.edu
inurl:"/guestbook/"
inurl:"/gb/"

В файл site.inc если нужны дополнительные зоны - вписываем под имеющимися

Запускаем getdb.pl. В окне будут показыватся запросы и полученные результаты.

После сбора ссылок скрипт автоматически удалит дублирующиеся ссылки и начнет проверку на PageRank

В результате ссылки будут раскиданы по текстовым файлам pr0.txt - pr10.txt ,
и один общий файл db_pr.txt, отсортированный так, что в начале идут ссылки с самым высоким PR.

После сбора ссылок их количество можно посмотреть запустив:


count.pl db_pr.txt

Также присутствуют отдельные скрипты для удаления дублей и проверки pagerank

remdup.pl - удаляет дупы из файла db.txt и сохраняет чистый в файл db_rmd.txt

checkpr.pl - проверяет страницы из файла db_rmd.txt на pagerank и раскидывает их в файлы с pr_[x].txt,
где x - pagerank страницы, а также создает один общий файл db_pr.txt , в начале идут ссылки с самымвысоким PR


Для парсинга просто запроса без доменных зон - в файле sites.inc стереть все и
просто нажать Enter (сделать перенос строки).

http://www.sendspace.com/file/o6numb
pwd: JHgfjdai7