
25.01.2010, 10:22
|
|
Постоянный
Регистрация: 12.06.2008
Сообщений: 654
Провел на форуме: 4512757
Репутация:
973
|
|
Сообщение от CyberHunter
Скажите как изменить чтобы работал? Как раз нужен подобный скрипт 
Эмм, если честно, то я не уверен что он вам подойдёт, если обратите внимание на то, что он требует pyCURL и знание питоновских регулярок...
Лучше уж пропросите чтоб Вам его переписали под стандартную библиотеку...
Но на всякий случай :
Код:
#!usr/bin/env python3
import re
import curl
import time
dork = 'inurl:page_id+"Gallery+powered+by+fMoblog"'
page = 10
reg = 'class=r»«a href="([^"&]*)'
print "# start"
print "# dork:" + dork
print "# all page: " + str(page)
fo = open('google.txt','w')
print "# google.txt open"
for i in xrange(0,page):
url = "http://www.google.com/search?q="+dork+"&start=" + str(i*10)
rez = curl.url_get(url)
rez = re.findall(reg,rez)
for item in rez:
fo.write(item+"\n")
print "# page "+str(i+1)+" done"
time.sleep(2)
fo.close
print '# all done'
P.S. pyCURL под рукой нету чтобы проверить, но должно работать.
|
|
|