PDA

Просмотр полной версии : pWeb - PHP удобный класс для парсинга сайтов(создания автореггеров\спамеров)


joks
10.09.2009, 19:40
pWeb (Parser Web) 1.0 Beta
Описание:

PHP класс для интеграции с сайтами. Идеально подходит для написания всевозможных автоматических регистраторов, спамеров, парсеров и.т.д.
С помощью этого класса вы сократите время на написание ваших продуктов во много раз. Класс использует открытую библиотеку cURL, для интеграции с сайтами.
Встроенны модули парсинга HTML разметки и заголовков.

Основные преимущества:

Автоматичеки следит за cookies. Это позволяет свободно гулять по сайту, не беспокоясь о потере авторизации.
Очень удобный парсер HTML разметки. Можно получить доступ к любому тегу и его аттрибутам. Благодаря ему вы забудете про регулярные выражения для получения данных input !
Автоматический парсер заголовков, полученных сервером.
Большое количество дополнительных функций, для поиска нужных тегов, и быстрого доступа к ним.
Интегрированы функции для работы с ac-service (АнтиКапча), что позволяет буквально одной строкой кода разгадывать капчу.
Основан на ООП, и очень легок в использовании. Его найдут удобным как профессиональный программисты, так и у новичков в PHP не возникнет с ним трудностей.


Пример скрипта, использующего pWeb.
Скрипт автоматического регистратора на blog.ru (заметьте. ~35 строк несжатого кода)



<?
include('pWeb.php');

$wb = new pWeb();
$wb->log_file='log.txt';
$wb->auto=1;
$wb->auto_location=0;
$wb->session_cookies=1;

$wb->fast_load('http://blog.ru/registration/step1?backurl=http%3A%2F%2Fblog.ru%2F');
$c_url = 'http://blog.ru'.$wb->get_elem_by_attr('width', '200', 'img')->attrs['src'];
$wb->ac_key = '**********8943d36a2cec85c3374a';

$c = $wb->ac_rec($c_url);

$form=$wb->get_elem_by_attr('id', 'registration', 'form');
$inp = $wb->get_inputs($form->tag_id);
$wb->append_inputs($inp);

$wb->post_data['user_data[code]'] = $c;
$wb->post_data['user_data[email]'] = $wb->gen_email();
$wb->post_data['user_data[nick]'] = $wb->gen_str();
$wb->post_data['user_data[password]'] = $wb->gen_str();
$wb->post_data['user_data[password_confirm]'] = $wb->post_data['user_data[password]'];
$wb->post_data['user_data[sex]'] = 'male';
$wb->method='post';
$wb->url = 'http://blog.ru/registration/step1/submit';
$wb->load();
echo '<center><h1>Аккаунт зарегистрирован.</h1><br>
<h3>E-Mail: '.$wb->post_data['user_data[email]'].'</h3><br>
<h3>Pass: '.$wb->post_data['user_data[password]'].'</h3><br>
<h3>Login: '.$wb->post_data['user_data[nick]'].'</h3><br></center>';


Более усовершенствованный скрипт. Автоматически регистрирует аккаунт на blog.ru и добавляет новый пост. (~80 строк несжатого кода)

Пример (http://dorn.nxt.ru/sample2.txt)

обычно такие скрипты занимают от 300 до 1000 строк кода. Работы с классом с первого взгляда может показаться трудной. однако это абсолютно не так. Все функции легко запоминаются, и работа идет ооочень быстро.

В текущей бета-версии есть некоторые недостатки, а это:


Нету доступа к HTML внутри тегов. То есть нет доступа к тексту, который не в тегах на странице.
Есть некоторые проблемы при закачке файлов не удаленный сервер.


В принципе они не серьезны.

При покупке ВСЕ последующие обновления бесплатны.

Цена:

Стоимость необфускованого кода составляет 10$. Вы имеете право перепродавать данный класс, только в своих продуктах, но НЕ ОТДЕЛЬНО(конечно желательно чтобы вы не убирали всего две строки моего авторства).


Money Back(Возврат денег)
Если вы найдете ошибку в его работе, то я НЕ ГАРАНТИРУЮ, что в любом случае верну вам деньги.
Я полностью верну деньги в случае, если вы найдете ошибку, которая не описана в недостатках, но не позволяет выполнить действие, предусмотренное его явными функциями,
и я не исправлю эту ошибку в близжайшее время. То есть если вы нашли баг, сообшили мне о нем, я сочел его полностью справедливым и не исправил в течении 2-3х дней, то я ПОЛНОСТЬЮ возвращаю вам деньги.

Во всех остальных случаюх, я могу только пообещать исправить\дополнить бибилотеку в слудеющем обновлении(обновление бесплатно).

Мои гарантии:

Я могу предоставить свои отзывы в качестве PHP программиста (http://forum.antichat.ru/showthread.php?p=1128150)
Также я предостовляю описание всех функций (http://dorn.nxt.ru/Description.txt) , чтобы вы не думали про кота в мешке




В близжайшем времени наблюдается обновление.
Будут произведены следующие улучшения:

добавлен парсер CSS
добавлен интерпритатор javascript(пока примитивный)
добавлены модули интерграции с другими сервисами по распознаванию капчи
добавлены все функции, наличие которых пожелают пользователи
организован доступ к HTML коду внутри тегов (innerHTML)
добавлена функция полной копии сайта на сервер. (можно использовать как создатель фейков или просто создание копий сайтов)
добавлен парсер XML
добавлены функции для работы с ajax
улучшена отладка
тшательно проработана документация, добавлены прмиеры пользования
...и еще много интересных дополнений


Покупка\Консультации\Связь :

E-Mail jokz[@]nxt.ru
ICQ 2-7777-29