Форум АНТИЧАТ

Форум АНТИЧАТ (https://forum.antichat.xyz/index.php)
-   PHP, PERL, MySQL, JavaScript (https://forum.antichat.xyz/forumdisplay.php?f=37)
-   -   Нужна прога для мониторинга сайтов (https://forum.antichat.xyz/showthread.php?t=137544)

^_WhitE_DeMoN_^ 26.08.2009 20:57

Нужна прога для мониторинга сайтов
 
Нужна прога которая следила бы за присутствием моей ссылки/HTML/JavaScript кода на чужых сайтах.
Вчера целый день гуглил, сегодня Ачат перекаповал - не нашол :( Помогите...

POS_troi 26.08.2009 22:27

Автоматом или полу автоматом?

Готовое решение не предложу (принципильно) но дам направление

Список ресурсов +

PHP/Perl скрипт - тянеш страниц с ресурсов по списку +

Загоняеш в регулярку и ищеш свой код +

не нашол , отправляеш себе мыло

Это все в крон (под винду тоже есть порт)

Примерно с полтинник строк кода

^_WhitE_DeMoN_^ 27.08.2009 00:31

Да какую нибуть... Любая помощ или инфо будет очень полезна ! Нужно чтобы скрипт/прога обхажывала указанные сайты и их страницы в поиске нужного кода, в конце показавала результат. Желательно обойтись без спама на мыло :D Текущий список сайтов ~ 50 штук, будет стремительно увеличиватся...

+casper+ 27.08.2009 01:01

Пишеш php скрипт. Гет страницы, парсинг, запись результов в файл. А вот чтоб следить чтоб ссылка находилась в видимом поле низнаю и как.

geforse 27.08.2009 09:29

код написал, но только есть одна загвоздка.
не могу придумать как найти нужную ссылку на всей странице ?
Что в preg_match нужно написать, чтобы он нашёл нужный текст ?

ТС, вид у ссылки какой ?
<a href="http://antichat.ru">ANTICHAT.RU</a> ?

^_WhitE_DeMoN_^ 27.08.2009 17:59

@+casper+ На этом варианте остановлися...
@geforse Надо еще придумать как найти ссылку на ВСЕХ остальных станицах сайта =) Тоесть, скрипт должен искать линки, ведущие на страницы сканируемого сайта и проверять о наличии кода там (можно и обойтись... но не желательно). Вид ссылки может быть разный, надо искать это <a href="http://antichat.ru
С JavaScript-ом, думаю будет лекче, он один для всех, но спец-символов полно...

Еще думаю - не лучше ли будет, впарить еще один JavaScript к линкам/коду который будет орать моему серверу - "Я на http://antichat.ru/index.php !". Но тогда могут вырезать ссылку и оставить только оратора =)

Иду доки курить, скрипты искать, голову мучеть...

^_WhitE_DeMoN_^ 27.08.2009 19:13

Цитата:

не могу придумать как найти нужную ссылку на всей странице ?
Загоняем страницу в переменную с file_get_contents()

Gifts 27.08.2009 19:24

^_WhitE_DeMoN_^ Решили конкурировать с сапой, но на пхп все сделать? :D
PHP код:

$input file_get_contents('Страниццо');
$array = array('<a href="http://ссылка1">http://ссылка1</a>''<a href="http://ссылка2">http://ссылка2</a>''вообще любой текст');
foreach(
$array as $one)
{
echo 
'Текст '.$one.(strpos($input,$one)!==false?' есть ':' отсутствует ').'на странице <br/>';



geforse 27.08.2009 19:26

Цитата:

Сообщение от ^_WhitE_DeMoN_^
Загоняем страницу в переменную с file_get_contents()

Как же это я не догадался :D

Я больше cURL люблю, чем file_get_contents()
Я имел ввиду что нужно написать в preg_match_all(), чтобы нашлась нужная ссылка

Быть может найти все ссылки -> Поместить в массив -> Циклом проверять каждый элемент массива на соответствие с нужной...

^_WhitE_DeMoN_^ 27.08.2009 20:06

@Gifts Большая конкуренция не получится =) Но надо же както выживать... Да и люди не любят back-link ставить, придется заставить =)
Спасибо за код, очень помогло !
@geforse С cURL-ом не знаком... Все равно...
Работаю над етим =)

+ Потом буду ставить, кто больше поможет... Спасибо всем !

Вот пока что накодил:
Код:

<?php 
$opts = array( 
  'http'=>array( 
    'method'=>"GET", 
    'header'=>"User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.0.7) Gecko/2009021910 Firefox/3.0.7\nReferer: http://для.красоты\n  "
  ) 
); 

$context = stream_context_create($opts); 
  $a = file_get_contents('http://ищем.сдесь', false,$context); 
if (preg_match("/<a href=\"http:\/\/искомый.линк/i", $a)) {
    echo "Линк найден.";
} else {
    echo "Линк не найден.";
}

?>



Время: 12:35