Форум АНТИЧАТ

Форум АНТИЧАТ (https://forum.antichat.xyz/index.php)
-   PHP, PERL, MySQL, JavaScript (https://forum.antichat.xyz/forumdisplay.php?f=37)
-   -   Определение поисковых ботов и OS и браузера пользователя.. (https://forum.antichat.xyz/showthread.php?t=101293)

Trieg 15.01.2009 07:59

Определение поисковых ботов и OS и браузера пользователя..
 
Решил сбацать скрипт для ведения статистики у себя на сайте..

всю инфу о боте\ос\браузере само собой собираюсь тащить из $_SERVER['HTTP_USER_AGENT']..

в общем интересует актуальная на данный момент инфа о браузерах и поисковых ботах.. тобеш кусок строки по которой можно определить бота\браузер

ЗЫ: список ботов и реализацию определения можно сделать паблик и закрепить в отдельной теме (список ботов\браузеров обновлять по мере возможностей.. имхо хочется чтоб инфа была как можно более актуальная).. хотя может я погорячится и оно людям нафиг не надо..

brasco2k 15.01.2009 09:38

CodeIgniter->load->agent();

BuG_4F 15.01.2009 09:50

Кури модуль онлайна от дле

Trieg 15.01.2009 10:09

Цитата:

CodeIgniter->load->agent();
Список браузеров и ос еще более менее.. а вот с ботами там совсем туго

Цитата:

Кури модуль онлайна от дле
смотрел.. опять же слишком вяло

Shaitan-Devil 15.01.2009 10:09

Информация о User Agent

Trieg 15.01.2009 10:11

Цитата:

Информация о User Agent
тоже видел.. в списке ботов нет даже рамблера..

BlackSun 15.01.2009 10:24

PHP код:

function SpiderDetect($user_agent)
{
    
$engines = array(
        array(
'Aport''Aport robot'),
        array(
'Google''Google'),
        array(
'msnbot''MSN'),
        array(
'Rambler''Rambler'),
        array(
'Yahoo''Yahoo'),
        array(
'AbachoBOT''AbachoBOT'),
        array(
'accoona''Accoona'),
        array(
'AcoiRobot''AcoiRobot'),
        array(
'ASPSeek''ASPSeek'),
        array(
'CrocCrawler''CrocCrawler'),
        array(
'Dumbot''Dumbot'),
        array(
'FAST-WebCrawler''FAST-WebCrawler'),
        array(
'GeonaBot''GeonaBot'),
        array(
'Gigabot''Gigabot'),
        array(
'Lycos''Lycos spider'),
        array(
'MSRBOT''MSRBOT'),
        array(
'Scooter''Altavista robot'),
        array(
'AltaVista''Altavista robot'),
        array(
'WebAlta''WebAlta'),
        array(
'IDBot''ID-Search Bot'),
        array(
'eStyle''eStyle Bot'),
        array(
'Mail.Ru''Mail.Ru Bot'),
        array(
'Scrubby''Scrubby robot'),
        array(
'Yandex''Yandex'),
        array(
'YaDirectBot''Yandex Direct')
    );

    foreach (
$engines as $engine)
    {
        if (
strstr($user_agent$engine[0]))
        {
            return(
$engine[1]);
        }
    }

    return 
False;
}    
    
    
$user_agent getenv("HTTP_USER_AGENT");
    
$spider SpiderDetect($user_agent); 


slesh 15.01.2009 10:29

А ты пробуй палить по IP т.е. получи имя компа по его IP. И там в логах уже сможешь найти то, домены принадлежащие или близкие к доменам поисковиков.


Время: 13:51