![]() |
Нужна прога для мониторинга сайтов
Нужна прога которая следила бы за присутствием моей ссылки/HTML/JavaScript кода на чужых сайтах.
Вчера целый день гуглил, сегодня Ачат перекаповал - не нашол :( Помогите... |
Автоматом или полу автоматом?
Готовое решение не предложу (принципильно) но дам направление Список ресурсов + PHP/Perl скрипт - тянеш страниц с ресурсов по списку + Загоняеш в регулярку и ищеш свой код + не нашол , отправляеш себе мыло Это все в крон (под винду тоже есть порт) Примерно с полтинник строк кода |
Да какую нибуть... Любая помощ или инфо будет очень полезна ! Нужно чтобы скрипт/прога обхажывала указанные сайты и их страницы в поиске нужного кода, в конце показавала результат. Желательно обойтись без спама на мыло :D Текущий список сайтов ~ 50 штук, будет стремительно увеличиватся...
|
Пишеш php скрипт. Гет страницы, парсинг, запись результов в файл. А вот чтоб следить чтоб ссылка находилась в видимом поле низнаю и как.
|
код написал, но только есть одна загвоздка.
не могу придумать как найти нужную ссылку на всей странице ? Что в preg_match нужно написать, чтобы он нашёл нужный текст ? ТС, вид у ссылки какой ? <a href="http://antichat.ru">ANTICHAT.RU</a> ? |
@+casper+ На этом варианте остановлися...
@geforse Надо еще придумать как найти ссылку на ВСЕХ остальных станицах сайта =) Тоесть, скрипт должен искать линки, ведущие на страницы сканируемого сайта и проверять о наличии кода там (можно и обойтись... но не желательно). Вид ссылки может быть разный, надо искать это <a href="http://antichat.ru С JavaScript-ом, думаю будет лекче, он один для всех, но спец-символов полно... Еще думаю - не лучше ли будет, впарить еще один JavaScript к линкам/коду который будет орать моему серверу - "Я на http://antichat.ru/index.php !". Но тогда могут вырезать ссылку и оставить только оратора =) Иду доки курить, скрипты искать, голову мучеть... |
Цитата:
|
^_WhitE_DeMoN_^ Решили конкурировать с сапой, но на пхп все сделать? :D
PHP код:
|
Цитата:
Я больше cURL люблю, чем file_get_contents() Я имел ввиду что нужно написать в preg_match_all(), чтобы нашлась нужная ссылка Быть может найти все ссылки -> Поместить в массив -> Циклом проверять каждый элемент массива на соответствие с нужной... |
@Gifts Большая конкуренция не получится =) Но надо же както выживать... Да и люди не любят back-link ставить, придется заставить =)
Спасибо за код, очень помогло ! @geforse С cURL-ом не знаком... Все равно... Работаю над етим =) + Потом буду ставить, кто больше поможет... Спасибо всем ! Вот пока что накодил: Код:
<?php |
@geforse Ты мне об этом говорил ?
PHP код:
Но какой метод лучше пользовать, preg_match или strpos ? Еще, база адресов у меня находится в .dat (txt) файле, вот в таком формате Код:
циферки.числа||циферки.числа||0||0||текст||http://адрес.сайта/|| |
Цитата:
|
Да знаю что не твой :D
Я про это: Цитата:
|
Помогитее =)
Вот че написал: PHP код:
Цитата:
Че я не так делаю ? Поправьте меня... Доки курить нет времени и желания, дрыхнуть пора :( Но, Ачат не спит ;) |
Цитата:
|
Цитата:
|
Извини, но, я так думаю или ты правда перепутал чето...
Цитата:
//Edit: Какой же я придурок... PHP код:
У кого есть идеи, пусть не стесняется :D Может лучше вариант предложит... |
если это некий чекер, то лучше curl_multi или просто curl
Код:
$value = str_replace(array("http://","www.","//|","/|"),array('','','|','|'),$value);Код:
циферки.числа||циферки.числа||1||0||текст||http://адрес.сайта/||Код:
$array = array('a href="http://че.ищем', 'a href="http://может.еще.че', 'Имя.нашего.сервиса'); |
FireFenix Большое спасибо, люблю такие мнения.
Да, это должно быть похоже на чекер :D С curl-ом не знаком... Особых преимуществ регулярных выражений сдесь не вижу, а и я о них еще только читаю :) А про индусский код - согласен, посмотрю что можно сделать, как только дочитаю... и еще - этот кусок не мой, один чувак его скинул в тему :D |
А можно намного проще, просто посылать на гугл запросы в виде:
site:www.сайт.domen "href="твой сайт"" Расскажу что я юзал: Есть бесплатная прога для мониторинга http://www.yccy.ru/ там много возможностей, но одна из: Цитата:
И сайт http://www.backlinkwatch.com но он выдает все беклинки которые проиндексированы |
| Время: 06:47 |