PDA

Просмотр полной версии : SMParser II - парсер vesna.yandex.ru


shuba
11.04.2010, 14:05
SMParser функционал

- парсить рандомные и конкретные тематики
- появились настройки форматирования текста
- использовать прокси
- на ходу синонимизировать текст

Общий вид софтины

http://www.seomazzi.ru/wp-content/uploads/2010/01/smparser01.jpg

Настройки


Количество текстов - определяет сколько текстов надо спарсить
Ширина строки - определяет ширину строки текста записываемого в файл
Пробелы после H1 - если стоит галка "Заголовки текстов", можно указать отступы после них
Пробелы после P - дефолтная статья имеет три параграфа, здесь можно указать их отступы
пробелы после текста - пробелы после текста ))
Заголовки текстов - если галка стоит собираются еще и заголовки, если нет текст идет сплошняком
Рандомные темы - для парсинга выбираются случайные темы, иначе есть блок правее где можно указать необходимые
Синонимизировать - синонимизирует текст встроенной базой синонимов
Перезаписывать файл - если задаются рандомные темы или выбранно больше 2-х тем то файл с текстами будет иметь префикс mix_data, если выбрана одна тема файл будет иметь ее название, например: literature_16.01.10.txt. Так вот если вы хотите что бы эти файлы перезаписывались каждый раз при начале парсинга ставьте галку.
Использовать прокси - При каждом запросе программа будет брать случайное прокси из файла. Использует прокси из файла /resurs/proxy.txt . Если хотите указать свои прокси указывайте из в файле proxy_for_chek.txt и нажимайте кнопку проверка прокси.
Потоков для проверки прокси - указывайте количество, если проксей много то лучше по больше, хотя я сознательно ограничил максимальную планку потоков, дабы не получать бан от сайта по которому они проверяются )
Таймаут для прокси - как написанно так и есть
Задержки в запросах - время в секундах, через которое будет производиться следующий запрос.

Скачать (http://depositfiles.com/files/wsokikz1w)

Скачал на вин7, потребовалась вот Эта (http://depositfiles.com/files/8eo1kibob) DLL'ka

(с) (http://www.seomazzi.ru/programmy/smparser-ii.html)

Lihosvet
16.04.2010, 12:49
Скажите пожалуйста как яндекс относиться к этому тексту? :)

LTK*
16.04.2010, 13:43
Контент там почти уникальный!

toper07
20.04.2010, 11:20
Ммм..... мою прожку выложили :D
Скажите она еще работает?
Кстати если есть что написать и пожелать то вам сюды (http://forum.seomazzi.ru/)
Там же и запись на бете тест инвайтера вконтакте :)

.antibiotic.
20.04.2010, 11:25
у меня был скрипт... ваще нерандомизировал ниче.. когда то доры лезли нормально

Lihosvet
21.04.2010, 03:03
toper07 большое спасибо!!! :)

vaddd
21.04.2010, 07:11
Ммм..... мою прожку выложили :D
Скажите она еще работает?
Кстати если есть что написать и пожелать то вам сюды (http://forum.seomazzi.ru/)
Там же и запись на бете тест инвайтера вконтакте :)
работает, прекрасно парсит

toper07
21.04.2010, 07:51
работает, прекрасно парсит

Спасибо вам, добрый человек.
Кстати, нашел там багу-прога не все запроса делает через проксятины, но если она все прекрасно парсит , то это не важно. Важно чтоб парсила...

RealMarkus
21.04.2010, 08:00
Спасибо вам, добрый человек.
Кстати, нашел там багу-прога не все запроса делает через проксятины, но если она все прекрасно парсит , то это не важно. Важно чтоб парсила...
Мь дело в прокси... кодеин не прокатывает иногда.
А вообще прога ниче так. Тоже на питоне написана ?

toper07
21.04.2010, 08:13
Мь дело в прокси... кодеин не прокатывает иногда.
А вообще прога ниче так. Тоже на питоне написана ?
Да это питон.
Сейчас вообще модно писать для веба на питоне.