ANTICHAT — форум по информационной безопасности, OSINT и технологиям
ANTICHAT — русскоязычное сообщество по безопасности, OSINT и программированию.
Форум ранее работал на доменах antichat.ru, antichat.com и antichat.club,
и теперь снова доступен на новом адресе —
forum.antichat.xyz.
Форум восстановлен и продолжает развитие: доступны архивные темы, добавляются новые обсуждения и материалы.
⚠️ Старые аккаунты восстановить невозможно — необходимо зарегистрироваться заново.

20.05.2009, 22:57
|
|
Познавший АНТИЧАТ
Регистрация: 15.01.2008
Сообщений: 1,166
Провел на форуме: 2459557
Репутация:
606
|
|
а что ты именно парсить хочешь то?
|
|
|

21.05.2009, 08:50
|
|
Banned
Регистрация: 21.11.2007
Сообщений: 181
Провел на форуме: 1066435
Репутация:
1013
|
|
Код:
#!/usr/bin/python
#coded by faza02
import urllib
import re
link=raw_input(u'link: ')
for b in range(0, 51, 10):
google=str(urllib.urlopen('http://www.google.ru/m?site=search&eosr=on&q=' + link + '&start=' + str(b)+ '&sa=N&mrestrict=xhtmlonly').read())
link=re.findall(r';u=http%3A%2F%2F.*?\"\>',google)
link=str(link)[2:-2]
link=urllib.unquote(link)
link=link.replace(';u=','')
link=link.replace('\">','')
link=link.replace(', ','\n')
link=link.replace('\'','')
f=open(u'c:/2.txt','a+')
f.write(link+"\n")
f.close()
print 'ok!1'
|
|
|

21.05.2009, 10:08
|
|
.::Club Life::.
Регистрация: 28.01.2005
Сообщений: 1,205
Провел на форуме: 7426415
Репутация:
1398
|
|
GlobalSquid SE Parser v1.8
Вроде нормальный, ставишь таймаут 5 сек, и без прокси по тихой собирает.
|
|
|

22.05.2009, 22:16
|
|
Участник форума
Регистрация: 04.03.2009
Сообщений: 298
Провел на форуме: 1241030
Репутация:
229
|
|
На питоне даже в Хакере 05 есть
|
|
|
|
Похожие темы
|
| Тема |
Автор |
Раздел |
Ответов |
Последнее сообщение |
|
парсер дампов БД v.o2
|
eLWAux |
С/С++, C#, Rust, Swift, Go, Java, Perl, Ruby |
15 |
07.09.2009 18:56 |
|
Посоветуйте....
|
WEED |
Болталка |
10 |
11.12.2006 22:20 |
|
Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
|
|
|
|