ANTICHAT.XYZ    VIDEO.ANTICHAT.XYZ    НОВЫЕ СООБЩЕНИЯ    ФОРУМ  
Баннер 1   Баннер 2
Antichat снова доступен.
Форум Antichat (Античат) возвращается и снова открыт для пользователей. Здесь обсуждаются безопасность, программирование, технологии и многое другое. Сообщество снова собирается вместе.
Новый адрес: forum.antichat.xyz
Вернуться   Форум АНТИЧАТ > SЕО/Финансовые задачи/Социальные сети > SЕО - тонкости, методы раскрутки
   
Ответ
 
Опции темы Поиск в этой теме Опции просмотра

Чем пропарсить выдачу Google?
  #1  
Старый 14.02.2009, 15:23
Аватар для /Montana
/Montana
Познающий
Регистрация: 26.10.2007
Сообщений: 83
Провел на форуме:
335555

Репутация: 45
По умолчанию Чем пропарсить выдачу Google?

Чем пропарсить выдачу Google? Нужно выдрать URL'ы, по определённым запросам, немного штук 200-300. Есть ли готовые решения, желательно скрипт.
 
Ответить с цитированием

  #2  
Старый 14.02.2009, 15:59
Аватар для CrazyStudentS_Mi}{
CrazyStudentS_Mi}{
Постоянный
Регистрация: 04.07.2007
Сообщений: 827
Провел на форуме:
2504528

Репутация: 882


По умолчанию

hrefer



если скрипт то вот

http://www.google.com/ie?q=&num=100&hl=ru&start=0&sa=N&filter=0 это поиск


это потом тыкаем ссылки извлечь

java script:all=document.links.length;mass='<b>Всег о ссылок на странице:\u0020'+all+'</b><br><br>\n';for(i=0;i<all;i++){mass+=document.li nks[i]+'<br>\n';}newwind=window.open('about:blank','resu lt','width=600,top=100,left=100,scrollbars=1');new wind.document.write(mass);

Последний раз редактировалось CrazyStudentS_Mi}{; 14.02.2009 в 16:04..
 
Ответить с цитированием

  #3  
Старый 15.02.2009, 09:26
Аватар для devton
devton
Участник форума
Регистрация: 26.10.2007
Сообщений: 283
Провел на форуме:
2605910

Репутация: 212
По умолчанию

http://webdos.freezoka.com/files/htmllerz.zip
 
Ответить с цитированием

  #4  
Старый 15.02.2009, 18:26
Аватар для Chode
Chode
Участник форума
Регистрация: 20.07.2008
Сообщений: 177
Провел на форуме:
625939

Репутация: 54
Отправить сообщение для Chode с помощью ICQ Отправить сообщение для Chode с помощью AIM
По умолчанию

AGGRESS Parser
 
Ответить с цитированием

  #5  
Старый 16.02.2009, 10:58
Аватар для Doktor_radosti
Doktor_radosti
Познающий
Регистрация: 27.11.2007
Сообщений: 97
Провел на форуме:
540764

Репутация: 57
Отправить сообщение для Doktor_radosti с помощью ICQ
По умолчанию

Рабочий allsubmitter, зануленная Аура (там правда больше 1000 за один подход не спарсишь).
 
Ответить с цитированием

  #6  
Старый 20.02.2009, 15:29
Аватар для M4g
M4g
Участник форума
Регистрация: 08.05.2007
Сообщений: 164
Провел на форуме:
466673

Репутация: 784
Отправить сообщение для M4g с помощью ICQ
По умолчанию

Пожалуйста, пример парсера для пхпбб (смотрите код, чтобы оптимизировать под иной движок)
PHP код:
<?php

/*Google parser v.0.1 by M4g, icq 884888*/

$log_file 'log.dat';
$zapros 'powered by phpbb';

set_time_limit (0);
//ignore_user_abort(true);

function setcookies($headers)
    {
        
$headers=explode("\r\n",$headers);
        for(
$x=0$x<count($headers); $x++)
        {
        if(
preg_match('/^set-cookie:[\s]+([^=]+)=([^;]+)/i'$headers[$x],$match))
        return    array(
$match[1] => urldecode($match[2]));
        }
    }

    
function 
parse_serp($engine$query,$page=0)
    {
    global 
$cookies;
    switch (
strtolower($engine))
        {
        case 
'google':
        
$page!=$page=100*$page '';
        
$result='';
        
$site='www.google.com';
        
path='/ie?hl=en&num=100&start='.$page.'&lr=&q='.urlencode(trim($query));
        
$fp = @fsockopen($site80$errno$errstr30);    
            
$out "GET $path HTTP/1.1\r\n";
            
$out .= "Host: $site\r\n";
           
$out .= "Content-type: application/x-www-form-urlencoded\r\n";
              
$out .= "Connection: Close\r\n";
            
$out .= "User-Agent: Opera/9.60 (Windows NT 5.1; U; ru) Presto/2.1.1\r\n";

        if ( 
count($cookies) > 
            {
                    
$cookie_str 'Cookie: ';
                    foreach ( 
$cookies as $cookieKey => $cookieVal ) {
                    
$cookie_str .= $cookieKey."=".urlencode($cookieVal)."; ";
            }
        
$out .= substr($cookie_str,0,-2)."\r\n";
        }
            
$out .= "Referer: http://www.google.com/ie\r\n\r\n";

     @
fwrite($fp$out);
     while (!@
feof($fp)) 
        {
        
$result .= @fread($fp1024);
        }
    
$cookies=setcookies($result);
    
flush();
    print 
$query."<br/>\n";

    
$pattern '/<a title="(.+)" href=(.+)>(.+)<\/a>/isU';
    if(
preg_match_all($pattern$result$matches))
        {
                for (
$i=0$i<count($matches[0]); $i++)
                        {
                        
$link $matches[2][$i];
                    
$link=trim($link);
                            
$serp[] = $link;
                            }
                        }
        break;
                
                
        }
        return 
$serp;
    }



for(
$page=0;$page<11;$page++)
    {
    
$result parse_serp('google',$zapros,$page);
    
$different=array();
    for(
$i=0;$i<count($result);$i++)
        {
        
preg_match("/(.+)\/(viewtopic|login|\s)(.+)/i",$result[$i],$arra[$i]);
        
$different[]=$arra[$i][1];
        }
    
$different=array_unique($different);
    for(
$i=0;$i<count($different);$i++)
        {
        if(!empty(
$different[$i]))
            {
            
$fp fopen($log_file,"a");
            
flock ($fpLOCK_EX);
            
fputs($fp,"\n".$different[$i]);
            
flock ($fpLOCK_UN);
            
fclose($fp);    
            }
        }
    
sleep(rand(13,19));
    if(
count($result)<100) break;
    }

?>
 
Ответить с цитированием
Ответ



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Новичкам о дорвеях троль909 Статьи 21 03.05.2010 01:11
Полная обзорная статья о Google PR [ANGEL] Статьи 6 16.02.2009 18:31
Google готовит свою ОС? Alexandr II Мировые новости 22 16.12.2008 22:31
Google и копипейст dinar_007 Мировые новости 1 15.02.2007 12:13



Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
 


Быстрый переход




ANTICHAT.XYZ