HOME FORUMS MEMBERS RECENT POSTS LOG IN  
× Авторизация
Имя пользователя:
Пароль:
Нет аккаунта? Регистрация
Баннер 1   Баннер 2
НОВЫЕ ТОРГОВАЯ НОВОСТИ ЧАТ
loading...
Скрыть
Вернуться   ANTICHAT > ПРОГРАММИРОВАНИЕ > PHP
   
Ответ
 
Опции темы Поиск в этой теме Опции просмотра

  #1  
Старый 26.01.2010, 01:34
gold-goblin
Познавший АНТИЧАТ
Регистрация: 26.03.2007
Сообщений: 1,095
С нами: 10067064

Репутация: 455


По умолчанию

Цитата:
он не работает...в чем ошибка ?
Так же гугл отбрасывает сторонние юсерагенты.
Цитата:
login999 подскажи пожалуйста что надо с pyCURL делать ? как подключить ? скачал я из инета набор файлов отсюда , что дальше?!
Гугл в помощь =) Какая версия питона? а так http://python.su/forum/viewtopic.php?id=3985
 
Ответить с цитированием

  #2  
Старый 27.01.2010, 10:28
login999
Постоянный
Регистрация: 12.06.2008
Сообщений: 654
С нами: 9427413

Репутация: 973


По умолчанию

Код:
#!/usr/bin/env python
#-*-encoding:UTF-8-*-

import re
import urllib2
import time

HEADERS = {
           "User-Agent" : "Opera/9.64 (Windows NT 5.1; U; en) Presto/2.1.1",
           "Accept" : "text/html, application/xml;q=0.9, application/xhtml+xml, image/png, image/jpeg, image/gif, image/x-xbitmap, */*;q=0.1",
           "Accept-Language" : "ru,uk-UA;q=0.9,uk;q=0.8,en;q=0.7",
           "Accept-Charset" : "iso-8859-1, utf-8, utf-16, *;q=0.1",
           "Accept-Encoding" : "identity, *;q=0",
           "Connection" : "Keep-Alive"
          }


def curl_url_get(url):
    request = urllib2.Request(url, headers=HEADERS)
    data = urllib2.urlopen(request).read()
    return data

dork = 'inurl:page_id+"Gallery+powered+by+fMoblog"'
page = 10
reg = 'class=r»«a href="([^"&]*)'
print "# start"
print "# dork:" + dork
print "# all page: " + str(page)
fo = open('google.txt','w')
print "# google.txt open"
for i in xrange(0,page):
    url = "http://www.google.com/search?q="+dork+"&start=" + str(i*10)
    rez = curl_url_get(url)
    rez = re.findall(reg,rez)
    for item in rez:
        fo.write(item+"\n")
    print "# page "+str(i+1)+" done"
    time.sleep(2)
fo.close
print '# all done'
Кому там нужен типа гуглопарсер.
Из того парсера просто убрал pyCURL, не более того.
То что он ничего не находит это не значит, что я там чего-то накосячил.
Регулярка там кривая нах =\.
P.S. Под Python 2.6

Последний раз редактировалось login999; 27.01.2010 в 10:31..
 
Ответить с цитированием

  #3  
Старый 27.01.2010, 12:33
Solker
Участник форума
Регистрация: 04.05.2006
Сообщений: 161
С нами: 10537558

Репутация: 158
По умолчанию

login999

https://forum.antichat.ru/showthread.php?p=1838949#post1838949

http://docs.python.org/library/json.html

Последний раз редактировалось Solker; 27.01.2010 в 12:37..
 
Ответить с цитированием

  #4  
Старый 27.01.2010, 21:14
taxpayer
Познающий
Регистрация: 17.01.2010
Сообщений: 33
С нами: 8586496

Репутация: 33
По умолчанию

daniel_1024:
Цитата:
http://python.org/download/releases/2.5.4
http://pycurl.sourceforge.net/download/pycurl-ssl-7.18.2.win32-py2.5.exe
Инсталлеры с офф паг, не со сторонних ресурсов

Чесно говоря, не вижу смысла использовать для доркера пикурл, если в задачу не входит использование соксов, вполне хватит стандартных либ
 
Ответить с цитированием

  #5  
Старый 27.01.2010, 21:40
login999
Постоянный
Регистрация: 12.06.2008
Сообщений: 654
С нами: 9427413

Репутация: 973


По умолчанию

Цитата:
Сообщение от taxpayer  
py2.5
...
 
Ответить с цитированием

  #6  
Старый 27.01.2010, 22:01
CyberHunter
Постоянный
Регистрация: 06.01.2010
Сообщений: 785
С нами: 8602291

Репутация: 256


По умолчанию

Скажите что случилось? Раньше все программы мог запустить, а сейчас - в консоли пишу все как раньше, пишет неверный путь. Путь введен верно 100%. В чем может быть проблема? Переустановил интерпретатор в стандартную директорию, не помогло. Хз что случилось...
 
Ответить с цитированием

  #7  
Старый 27.01.2010, 23:26
login999
Постоянный
Регистрация: 12.06.2008
Сообщений: 654
С нами: 9427413

Репутация: 973


По умолчанию

Цитата:
Сообщение от CyberHunter  
Скажите что случилось? Раньше все программы мог запустить, а сейчас - в консоли пишу все как раньше, пишет неверный путь. Путь введен верно 100%. В чем может быть проблема? Переустановил интерпретатор в стандартную директорию, не помогло. Хз что случилось...
Скриншот/трейсбек ф студию
 
Ответить с цитированием

  #8  
Старый 28.01.2010, 22:03
gold-goblin
Познавший АНТИЧАТ
Регистрация: 26.03.2007
Сообщений: 1,095
С нами: 10067064

Репутация: 455


По умолчанию

Цитата:
Сообщение от login999  
Скриншот/трейсбек ф студию
+5 и с новой авой =)
 
Ответить с цитированием

  #9  
Старый 30.01.2010, 16:59
CyberHunter
Постоянный
Регистрация: 06.01.2010
Сообщений: 785
С нами: 8602291

Репутация: 256


По умолчанию

Цитата:
Скриншот/трейсбек ф студию
Уже все пашет)
Вот другой вопрос:
Есть код типа:
Код:
if x == 5:
	print("asdf"),
elif x<5:
    print("asddddf"),
elif x>5:
    print("aaaaaa")
как сделать так чтобы при каждом запуске надо вводить значение х?
 
Ответить с цитированием

  #10  
Старый 30.01.2010, 19:28
043nKRuT0y
Участник форума
Регистрация: 31.10.2007
Сообщений: 213
С нами: 9751512

Репутация: 14
По умолчанию

Всем привет ! Пробовал я потестить Google App Engine - поставил я SDK - установка прошла нормально , но вот создал я значит простое приложение , пишу в консоле
Код:
dev_appserver.py testpr
- и обламываюсь , никакой сервер не стартует, пытаясь потом запустить приложение через иконку получаю в ответ
Код:
See the logfile 'C:\Program Files\Google_appengine\launcher\GoogleAppEngineLauncher.exe.log' for details
Как решить проблему , и как собственно заставить данный тестовый сервер работать !?

Последний раз редактировалось 043nKRuT0y; 30.01.2010 в 19:30..
 
Ответить с цитированием
Ответ





Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
 


Быстрый переход




ANTICHAT ™ © 2001- Antichat Kft.