Antichat снова доступен.
Форум Antichat (Античат) возвращается и снова открыт для пользователей.
Здесь обсуждаются безопасность, программирование, технологии и многое другое.
Сообщество снова собирается вместе.
Новый адрес: forum.antichat.xyz
 |
SMParser II - парсер vesna.yandex.ru |

11.04.2010, 14:05
|
|
Постоянный
Регистрация: 22.05.2009
Сообщений: 514
Провел на форуме: 3579051
Репутация:
133
|
|
SMParser II - парсер vesna.yandex.ru
SMParser функционал
- парсить рандомные и конкретные тематики
- появились настройки форматирования текста
- использовать прокси
- на ходу синонимизировать текст
Общий вид софтины
Настройки
Количество текстов - определяет сколько текстов надо спарсить
Ширина строки - определяет ширину строки текста записываемого в файл
Пробелы после H1 - если стоит галка "Заголовки текстов", можно указать отступы после них
Пробелы после P - дефолтная статья имеет три параграфа, здесь можно указать их отступы
пробелы после текста - пробелы после текста ))
Заголовки текстов - если галка стоит собираются еще и заголовки, если нет текст идет сплошняком
Рандомные темы - для парсинга выбираются случайные темы, иначе есть блок правее где можно указать необходимые
Синонимизировать - синонимизирует текст встроенной базой синонимов
Перезаписывать файл - если задаются рандомные темы или выбранно больше 2-х тем то файл с текстами будет иметь префикс mix_data, если выбрана одна тема файл будет иметь ее название, например: literature_16.01.10.txt. Так вот если вы хотите что бы эти файлы перезаписывались каждый раз при начале парсинга ставьте галку.
Использовать прокси - При каждом запросе программа будет брать случайное прокси из файла. Использует прокси из файла /resurs/proxy.txt . Если хотите указать свои прокси указывайте из в файле proxy_for_chek.txt и нажимайте кнопку проверка прокси.
Потоков для проверки прокси - указывайте количество, если проксей много то лучше по больше, хотя я сознательно ограничил максимальную планку потоков, дабы не получать бан от сайта по которому они проверяются )
Таймаут для прокси - как написанно так и есть
Задержки в запросах - время в секундах, через которое будет производиться следующий запрос.
Скачать
Скачал на вин7, потребовалась вот Эта DLL'ka
Последний раз редактировалось shuba; 11.04.2010 в 14:08..
|
|
|

16.04.2010, 12:49
|
|
Познающий
Регистрация: 03.12.2009
Сообщений: 36
Провел на форуме: 68866
Репутация:
7
|
|
Скажите пожалуйста как яндекс относиться к этому тексту? 
|
|
|

16.04.2010, 13:43
|
|
Познающий
Регистрация: 03.03.2006
Сообщений: 48
Провел на форуме: 151798
Репутация:
11
|
|
Контент там почти уникальный!
|
|
|

20.04.2010, 11:20
|
|
Новичок
Регистрация: 23.02.2010
Сообщений: 3
Провел на форуме: 6461
Репутация:
0
|
|
Ммм..... мою прожку выложили
Скажите она еще работает?
Кстати если есть что написать и пожелать то вам сюды
Там же и запись на бете тест инвайтера вконтакте 
Последний раз редактировалось toper07; 20.04.2010 в 11:24..
|
|
|

20.04.2010, 11:25
|
|
[bald man]
Регистрация: 13.07.2009
Сообщений: 623
Провел на форуме: 4490909
Репутация:
1167
|
|
у меня был скрипт... ваще нерандомизировал ниче.. когда то доры лезли нормально
|
|
|

21.04.2010, 03:03
|
|
Познающий
Регистрация: 03.12.2009
Сообщений: 36
Провел на форуме: 68866
Репутация:
7
|
|
toper07 большое спасибо!!! 
|
|
|

21.04.2010, 07:11
|
|
Познающий
Регистрация: 06.01.2009
Сообщений: 69
Провел на форуме: 116125
Репутация:
3
|
|
Сообщение от toper07
Ммм..... мою прожку выложили
Скажите она еще работает?
Кстати если есть что написать и пожелать то вам сюды
Там же и запись на бете тест инвайтера вконтакте 
работает, прекрасно парсит
|
|
|

21.04.2010, 07:51
|
|
Новичок
Регистрация: 23.02.2010
Сообщений: 3
Провел на форуме: 6461
Репутация:
0
|
|
Сообщение от vaddd
работает, прекрасно парсит
Спасибо вам, добрый человек.
Кстати, нашел там багу-прога не все запроса делает через проксятины, но если она все прекрасно парсит , то это не важно. Важно чтоб парсила...
|
|
|

21.04.2010, 08:00
|
|
Познающий
Регистрация: 27.11.2009
Сообщений: 48
Провел на форуме: 326942
Репутация:
5
|
|
Сообщение от toper07
Спасибо вам, добрый человек.
Кстати, нашел там багу-прога не все запроса делает через проксятины, но если она все прекрасно парсит , то это не важно. Важно чтоб парсила...
Мь дело в прокси... кодеин не прокатывает иногда.
А вообще прога ниче так. Тоже на питоне написана ?
Последний раз редактировалось RealMarkus; 21.04.2010 в 08:06..
|
|
|

21.04.2010, 08:13
|
|
Новичок
Регистрация: 23.02.2010
Сообщений: 3
Провел на форуме: 6461
Репутация:
0
|
|
Сообщение от RealMarkus
Мь дело в прокси... кодеин не прокатывает иногда.
А вообще прога ниче так. Тоже на питоне написана ?
Да это питон.
Сейчас вообще модно писать для веба на питоне.
|
|
|
|
 |
|
Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
|
|
|
|