ANTICHAT.XYZ    VIDEO.ANTICHAT.XYZ    НОВЫЕ СООБЩЕНИЯ    ФОРУМ  
Баннер 1   Баннер 2
Antichat снова доступен.
Форум Antichat (Античат) возвращается и снова открыт для пользователей. Здесь обсуждаются безопасность, программирование, технологии и многое другое. Сообщество снова собирается вместе.
Новый адрес: forum.antichat.xyz
Вернуться   Форум АНТИЧАТ > SЕО/Финансовые задачи/Социальные сети > SЕО - тонкости, методы раскрутки > Статьи
   
Ответ
 
Опции темы Поиск в этой теме Опции просмотра

  #21  
Старый 14.12.2009, 14:14
Аватар для le-mon
le-mon
Познающий
Регистрация: 11.04.2007
Сообщений: 57
Провел на форуме:
1024865

Репутация: -2
По умолчанию

Цитата:
Сообщение от Lavrik  
Описание:
Универсальный граббер с DLE сайтов на uCoz (модуль новости)
Краткое инфо по пользованию граббера:
1. Требования к хостингу
  • Версия PHP >= 5;
  • Должна присутствовать библиотека iconv;
  • Хостинг должен быть с поддержкой сокетов.
2. Установка
1) Залейте содержимое скрипта на хостинг.
2) Установите на директорию cache права на запись(chmod 777).
3. Настройка
Откройте файл config.php
Впишите ваш домен на укозе:
Код:
$_cfg['ucoz']['site'] = 'www.ru';
Установите логин администатора/модератора/репортера и его пароль:
Код:
$_cfg['ucoz']['login'] = 'lavrik';
$_cfg['ucoz']['password'] = '785fgsd24asd';
3. Как пользоваться?
Зайдите через браузер http://your_site.ru/grabber_path/
В поле about:blank впишите адрес DLE сайта с которого будите граббить и жмите энтер
В новой версии реализовано:
  • Возможность использовать синонимайзер
  • Возможность создавать правила для граббинга с любых сайтов(подобных DLE)
Исправленно:
  • Ставить ссылки в теги <noindex></noindex> $_cfg['grabber']['savecontents'] = TRUE; // TRUE - вкл. FALSE - выкл.
  • Возможность создавать правила для граббинга с любых сайтов(подобных DLE)
Как пропускать содержимое новостей через синонимайзер:
ГЛАВНОЕ: для того чтоб вы могли использовать данную опцию у вас должен быть синонимайзер! Я рекомендую SmartRewriter
1) Установите в конфиге
Код:
$_cfg['grabber']['savecontents'] = FALSE;
на
Код:
$_cfg['grabber']['savecontents'] = TRUE;
2) Установите на директорию contents права на запись(chmod 777)
3) Добавляйте новости как раньше они появятся в папке contents (!! кодировка файлов будет в UTF-8 !!)
4) Пропустите содержимое директории contents через синонимайзер
5) Зайдите через браузер в http://your_site.ru/grabber_path/ на главной странице будет ссылка Залить контент нажмите ее. И ожидайте пока контент будет заливается
Как создавать правила для граббинга с любых сайтов:
1) Откройте файл mysites.txt
2) korrespondent.net меняете на сайт который будите граббить
3) Заходите на главную страницу нажимаете просмотр HTML кода ищите HTML фрагмент который повторяется
допустим это <div id='news-id и его закрывающий элемент допустим это </td></tr>
Между ними поставьте (.*)
Получится <div id='news-id(.*)</td></tr>
4) [title], [small], [fulllink], [full] - работает по тому же принципу что и [style]
5) [qpage] Фрагмет HTML кода со страницами
Ищет последнюю страницу страницу автоматически
6) [page] - url формат страниц
Например, есть ссылка - http://0day.kiev.ua/modules.php?name=News&pagenum=2
Формат [page] Будет такой http://0day.kiev.ua/modules.php?name=News&pagenum=(.*)
7) Список функций и их предназначение:
@striptags - Ф-ция удаляет теги
@clean - Ф-ция удаляет лишние пробелы, табуляции и тд.
@htmltobb - Ф-ция преобразует HTML код в BB коды
@rm(value) - Ф-ция удаляет содержимое value с текста (например ...)
Описание функций: @a, @a.ТЕГ, @a(текст)б @restart и @emptyhtml
Допустим вам надо поставить имя автора в начале текста или в конце
Например:
<td>Автор: Vasya</td></tr><tr><td><div id='news-2412'>Новость: текст текст текст</div>
То для того чтоб поставить автора в начало необходимо выполнить такие команды
[full]
@a([b ]Автор:[/b ])
Автор: (.*)</td>
@a
@restart
id='news-(.*)</div>
'>Новость: (.*)
@a.center
@emptyhtml
Ф-ция @a - выполняет добавление содержимого в поток
Ф-ция @a.center - выполнит добавление в поток + содержимое будет в тегах Ф-ция @restart - загрузит нетронутый HTML код ( после выполнения команды Автор: (.*) текст для обработки будет Vasya для того чтоб он обрел первичный вид:
Код:
<td>Автор: Vasya</td></tr><tr><td><div id='news-2412'>Новость: текст текст текст</div>
надо выполнить команду @restart )
Ф-ция @emptyhtml - в конце обработки сценария [small], [full], [title] обработанный текст автоматически добавляется в поток для того чтоб этого не случилось , используйте данную функцию
Если сайт в кодировке UTF-8 то следует использовать функцию @utf
8) Ну это, пожалуй и все запускайте браузер вводите http://your_site.ru/grabber_path/ и начинайте граббить сайт
Скачать
Всё супер, но проблема в том, что на версиях dle 8.2, 8.3 нет грабба. Хелп.
 
Ответить с цитированием

  #22  
Старый 03.01.2010, 16:32
Аватар для SIEG_KLAS
SIEG_KLAS
Новичок
Регистрация: 04.07.2009
Сообщений: 2
Провел на форуме:
1821

Репутация: 0
По умолчанию

подскажите пожалуйста... а если у меня картинку(скриншот) надо вписывать в отдельную строку то можно настроить граббер чтобы ссылка на имэйдж вставлялась в отдельное поле???
 
Ответить с цитированием

  #23  
Старый 03.01.2010, 21:00
Аватар для ReduKToR
ReduKToR
Постоянный
Регистрация: 05.01.2009
Сообщений: 684
Провел на форуме:
3281634

Репутация: 485


Отправить сообщение для ReduKToR с помощью ICQ
По умолчанию

SIEG_KLAS,да...смотри сорц скрипта...и вставляй определенный тег в то место,которое отвечает за оторажение всех тегов в окне граббера
 
Ответить с цитированием

  #24  
Старый 22.01.2010, 16:24
Аватар для nuBo
nuBo
Участник форума
Регистрация: 29.12.2008
Сообщений: 174
Провел на форуме:
2522520

Репутация: 215
Отправить сообщение для nuBo с помощью ICQ
По умолчанию

все отлично работает, спасибо
подскажите пару DLE сайтов с нормальными новостями
 
Ответить с цитированием

  #25  
Старый 23.01.2010, 18:56
Аватар для dark-klin
dark-klin
Участник форума
Регистрация: 10.08.2009
Сообщений: 107
Провел на форуме:
259882

Репутация: 10
Отправить сообщение для dark-klin с помощью ICQ Отправить сообщение для dark-klin с помощью AIM Отправить сообщение для dark-klin с помощью Yahoo
По умолчанию

Нормально выполнено пользуюсь уже как 3 месяца.
 
Ответить с цитированием

  #26  
Старый 23.01.2010, 22:37
Аватар для skochwm
skochwm
Новичок
Регистрация: 27.10.2009
Сообщений: 1
Провел на форуме:
1652

Репутация: 0
По умолчанию

Грабит этот грабер контент под сайты «фильмы онлайн»?
 
Ответить с цитированием

  #27  
Старый 04.02.2010, 23:43
Аватар для mayak
mayak
Познающий
Регистрация: 10.11.2009
Сообщений: 47
Провел на форуме:
85899

Репутация: 0
По умолчанию

Проблема с категориями, помогите решить. Очистка кеша не помогло.
 
Ответить с цитированием

  #28  
Старый 16.02.2010, 13:39
Аватар для sqk
sqk
Участник форума
Регистрация: 08.09.2009
Сообщений: 118
Провел на форуме:
1982033

Репутация: 81
По умолчанию

А можно как-нибудь настроить или поправить этот граббер, чтоб я ему указал категорию... допустим http://music.ru/rap/ и он всю категорию грабит, начиная с последней страницы.
Или хотя бы чтоб указал последнюю страницу... допустим http://music.ru/rap/page/98/
и чтоб он грабил 98-ую страницу, потом 97-ую, и так по порядку до первой.
Помогите, в долгу не останусь.
 
Ответить с цитированием

  #29  
Старый 17.02.2010, 18:45
Аватар для sqk
sqk
Участник форума
Регистрация: 08.09.2009
Сообщений: 118
Провел на форуме:
1982033

Репутация: 81
По умолчанию

Оп, на нулледе мод нарыл, может пригодится кому-нибудь:
Цитата:
ТС вродебы не запрещал вылаживать моды. Вот мой мод старой версии, полностью АВТОМАТИЧЕСКИЙ.

Скачать: http://depositfiles.com/files/8m19j1t7e
Запускаем грабер, и переходим вручную на 2-ю страницу. Всё, дальше автоматом будет грабить.

Для того чтобы он резал ссылки (просто текстом делал) в файле datalife.php
разкометируем:
PHP код:
$html preg_replace"#<a.*?href[=]?[='\"](\S+?)['\" >].*?>(.*?)<\\/a>#is",    "\\1\\2",  $html ); 
и закоментируем:
PHP код:
$html preg_replace"#<a.*?href[=]?[='\"](\S+?)['\" >].*?>(.*?)<\\/a>#is",    "<noindex>[url=\\1]\\2[/url]</noindex>",  $html ); 
Для того чтобы грабер грабил не каждую страницу, а через несколько в файле func.js
разкоментируем:
PHP код:
location.href=qwer.replace(arrq[1],ert+Math.floor(Math.random()*5) + 1); 
и закоментируем:
PHP код:
location.href=qwer.replace(arrq[1],ert 1); 
[c] Nevep
Но, это все равно не то он грабит все подряд и все в одну категорию.
Кто крон может написать? Или помогите мне, написать его
---
спасибо, уже сам все написал

Последний раз редактировалось sqk; 22.02.2010 в 22:47..
 
Ответить с цитированием

  #30  
Старый 18.02.2010, 01:39
Аватар для demko
demko
Новичок
Регистрация: 19.11.2009
Сообщений: 2
Провел на форуме:
10647

Репутация: 0
По умолчанию

Хелп, дайте версию которая работает, у меня грабит но категории почему то на сайте юкоза выбрать не могу. Подскажите дельным советом, кэш чистил, в конфиге ввожу сайт, к нему лог и пасс, сам заходил, всё верное.
Хелп плз
 
Ответить с цитированием
Ответ



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Найден способ взлома UcoZ! Artemik Форумы 54 04.02.2010 00:56
Скрипты под Ucoz Vandam PHP, PERL, MySQL, JavaScript 14 26.02.2009 16:50
Ru.phreak Faq silveran Электроника и Фрикинг 0 21.07.2005 10:20



Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
 


Быстрый переход




ANTICHAT.XYZ