
10.10.2009, 11:22
|
|
Banned
Регистрация: 27.05.2009
Сообщений: 17
С нами:
8924963
Репутация:
75
|
|
Парсер для vBulletin
Не обращайте внимание на говнокод, но работает. и парсит.
Иногда вылазят бяки всякие ввиде "</font></b>", а так нормально отработал.
Код:
#!/usr/bin/python
# -*- coding: utf-8 -*-
import urllib,urllib2 ,re
lonk = 'http://forum.antichat.ru/memberlist.php?'
data = {}
data['do'] = 'getall'
data['page'] = '0'
data['pp'] = '100' ## кол-во юзеров на странице
data['order'] = 'asc'
data['postslower'] = '10' ## условие: у юзера больше 10 сообщений
data['sort'] = 'username'
for i in xrange(1,1000): ## дибильный цыкл, слишком большой!!!
data['page'] = i ## текущая страница в листе юзеров
url_values = urllib.urlencode(data)
d = urllib2.urlopen(lonk + url_values)
for a in re.findall('member\.php(.+)&u=(.+)">(.+)</a>', d.read()):
print a[2]
## скрипт просто выводит в консоль ники
## чтобы писать в файл, я запускал так: python achat.py >> ausers.txt
|
|
|