PDA

Просмотр полной версии : Определение поисковых ботов и OS и браузера пользователя..


Trieg
15.01.2009, 07:59
Решил сбацать скрипт для ведения статистики у себя на сайте..

всю инфу о боте\ос\браузере само собой собираюсь тащить из $_SERVER['HTTP_USER_AGENT']..

в общем интересует актуальная на данный момент инфа о браузерах и поисковых ботах.. тобеш кусок строки по которой можно определить бота\браузер

ЗЫ: список ботов и реализацию определения можно сделать паблик и закрепить в отдельной теме (список ботов\браузеров обновлять по мере возможностей.. имхо хочется чтоб инфа была как можно более актуальная).. хотя может я погорячится и оно людям нафиг не надо..

brasco2k
15.01.2009, 09:38
CodeIgniter->load->agent();

BuG_4F
15.01.2009, 09:50
Кури модуль онлайна от дле

Trieg
15.01.2009, 10:09
CodeIgniter->load->agent();
Список браузеров и ос еще более менее.. а вот с ботами там совсем туго

Кури модуль онлайна от дле
смотрел.. опять же слишком вяло

Shaitan-Devil
15.01.2009, 10:09
Информация о User Agent (http://ru.wikipedia.org/wiki/User_Agent)

Trieg
15.01.2009, 10:11
Информация о User Agent

тоже видел.. в списке ботов нет даже рамблера..

BlackSun
15.01.2009, 10:24
function SpiderDetect($user_agent)
{
$engines = array(
array('Aport', 'Aport robot'),
array('Google', 'Google'),
array('msnbot', 'MSN'),
array('Rambler', 'Rambler'),
array('Yahoo', 'Yahoo'),
array('AbachoBOT', 'AbachoBOT'),
array('accoona', 'Accoona'),
array('AcoiRobot', 'AcoiRobot'),
array('ASPSeek', 'ASPSeek'),
array('CrocCrawler', 'CrocCrawler'),
array('Dumbot', 'Dumbot'),
array('FAST-WebCrawler', 'FAST-WebCrawler'),
array('GeonaBot', 'GeonaBot'),
array('Gigabot', 'Gigabot'),
array('Lycos', 'Lycos spider'),
array('MSRBOT', 'MSRBOT'),
array('Scooter', 'Altavista robot'),
array('AltaVista', 'Altavista robot'),
array('WebAlta', 'WebAlta'),
array('IDBot', 'ID-Search Bot'),
array('eStyle', 'eStyle Bot'),
array('Mail.Ru', 'Mail.Ru Bot'),
array('Scrubby', 'Scrubby robot'),
array('Yandex', 'Yandex'),
array('YaDirectBot', 'Yandex Direct')
);

foreach ($engines as $engine)
{
if (strstr($user_agent, $engine[0]))
{
return($engine[1]);
}
}

return False;
}

$user_agent = getenv("HTTP_USER_AGENT");
$spider = SpiderDetect($user_agent);

slesh
15.01.2009, 10:29
А ты пробуй палить по IP т.е. получи имя компа по его IP. И там в логах уже сможешь найти то, домены принадлежащие или близкие к доменам поисковиков.