
26.01.2010, 01:34
|
|
Познавший АНТИЧАТ
Регистрация: 26.03.2007
Сообщений: 1,095
С нами:
10067064
Репутация:
455
|
|
он не работает...в чем ошибка ?
Так же гугл отбрасывает сторонние юсерагенты.
login999 подскажи пожалуйста что надо с pyCURL делать ? как подключить ? скачал я из инета набор файлов отсюда , что дальше?!
Гугл в помощь =) Какая версия питона? а так http://python.su/forum/viewtopic.php?id=3985
|
|
|

27.01.2010, 10:28
|
|
Постоянный
Регистрация: 12.06.2008
Сообщений: 654
С нами:
9427413
Репутация:
973
|
|
Код:
#!/usr/bin/env python
#-*-encoding:UTF-8-*-
import re
import urllib2
import time
HEADERS = {
"User-Agent" : "Opera/9.64 (Windows NT 5.1; U; en) Presto/2.1.1",
"Accept" : "text/html, application/xml;q=0.9, application/xhtml+xml, image/png, image/jpeg, image/gif, image/x-xbitmap, */*;q=0.1",
"Accept-Language" : "ru,uk-UA;q=0.9,uk;q=0.8,en;q=0.7",
"Accept-Charset" : "iso-8859-1, utf-8, utf-16, *;q=0.1",
"Accept-Encoding" : "identity, *;q=0",
"Connection" : "Keep-Alive"
}
def curl_url_get(url):
request = urllib2.Request(url, headers=HEADERS)
data = urllib2.urlopen(request).read()
return data
dork = 'inurl:page_id+"Gallery+powered+by+fMoblog"'
page = 10
reg = 'class=r»«a href="([^"&]*)'
print "# start"
print "# dork:" + dork
print "# all page: " + str(page)
fo = open('google.txt','w')
print "# google.txt open"
for i in xrange(0,page):
url = "http://www.google.com/search?q="+dork+"&start=" + str(i*10)
rez = curl_url_get(url)
rez = re.findall(reg,rez)
for item in rez:
fo.write(item+"\n")
print "# page "+str(i+1)+" done"
time.sleep(2)
fo.close
print '# all done'
Кому там нужен типа гуглопарсер.
Из того парсера просто убрал pyCURL, не более того.
То что он ничего не находит это не значит, что я там чего-то накосячил.
Регулярка там кривая нах =\.
P.S. Под Python 2.6
Последний раз редактировалось login999; 27.01.2010 в 10:31..
|
|
|

27.01.2010, 12:33
|
|
Участник форума
Регистрация: 04.05.2006
Сообщений: 161
С нами:
10537558
Репутация:
158
|
|
login999
https://forum.antichat.ru/showthread.php?p=1838949#post1838949
http://docs.python.org/library/json.html
Последний раз редактировалось Solker; 27.01.2010 в 12:37..
|
|
|

27.01.2010, 21:14
|
|
Познающий
Регистрация: 17.01.2010
Сообщений: 33
С нами:
8586496
Репутация:
33
|
|
daniel_1024:
http://python.org/download/releases/2.5.4
http://pycurl.sourceforge.net/download/pycurl-ssl-7.18.2.win32-py2.5.exe
Инсталлеры с офф паг, не со сторонних ресурсов
Чесно говоря, не вижу смысла использовать для доркера пикурл, если в задачу не входит использование соксов, вполне хватит стандартных либ
|
|
|

27.01.2010, 21:40
|
|
Постоянный
Регистрация: 12.06.2008
Сообщений: 654
С нами:
9427413
Репутация:
973
|
|
Сообщение от taxpayer
py2.5
...
|
|
|

27.01.2010, 22:01
|
|
Постоянный
Регистрация: 06.01.2010
Сообщений: 785
С нами:
8602291
Репутация:
256
|
|
Скажите что случилось? Раньше все программы мог запустить, а сейчас - в консоли пишу все как раньше, пишет неверный путь. Путь введен верно 100%. В чем может быть проблема? Переустановил интерпретатор в стандартную директорию, не помогло. Хз что случилось...
|
|
|

27.01.2010, 23:26
|
|
Постоянный
Регистрация: 12.06.2008
Сообщений: 654
С нами:
9427413
Репутация:
973
|
|
Сообщение от CyberHunter
Скажите что случилось? Раньше все программы мог запустить, а сейчас - в консоли пишу все как раньше, пишет неверный путь. Путь введен верно 100%. В чем может быть проблема? Переустановил интерпретатор в стандартную директорию, не помогло. Хз что случилось...
Скриншот/трейсбек ф студию 
|
|
|

28.01.2010, 22:03
|
|
Познавший АНТИЧАТ
Регистрация: 26.03.2007
Сообщений: 1,095
С нами:
10067064
Репутация:
455
|
|
Сообщение от login999
Скриншот/трейсбек ф студию 
+5 и с новой авой =)
|
|
|

30.01.2010, 16:59
|
|
Постоянный
Регистрация: 06.01.2010
Сообщений: 785
С нами:
8602291
Репутация:
256
|
|
Скриншот/трейсбек ф студию
Уже все пашет)
Вот другой вопрос:
Есть код типа:
Код:
if x == 5:
print("asdf"),
elif x<5:
print("asddddf"),
elif x>5:
print("aaaaaa")
как сделать так чтобы при каждом запуске надо вводить значение х?
|
|
|

30.01.2010, 19:28
|
|
Участник форума
Регистрация: 31.10.2007
Сообщений: 213
С нами:
9751512
Репутация:
14
|
|
Всем привет ! Пробовал я потестить Google App Engine - поставил я SDK - установка прошла нормально , но вот создал я значит простое приложение , пишу в консоле
Код:
dev_appserver.py testpr
- и обламываюсь , никакой сервер не стартует, пытаясь потом запустить приложение через иконку получаю в ответ
Код:
See the logfile 'C:\Program Files\Google_appengine\launcher\GoogleAppEngineLauncher.exe.log' for details
Как решить проблему , и как собственно заставить данный тестовый сервер работать !?
Последний раз редактировалось 043nKRuT0y; 30.01.2010 в 19:30..
|
|
|
|
 |
|
|
Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
|
|
|
|