ANTICHAT.XYZ    VIDEO.ANTICHAT.XYZ    НОВЫЕ СООБЩЕНИЯ    ФОРУМ  
Баннер 1   Баннер 2
Antichat снова доступен.
Форум Antichat (Античат) возвращается и снова открыт для пользователей. Здесь обсуждаются безопасность, программирование, технологии и многое другое. Сообщество снова собирается вместе.
Новый адрес: forum.antichat.xyz
Вернуться   Форум АНТИЧАТ > Программирование > PHP, PERL, MySQL, JavaScript
   
Ответ
 
Опции темы Поиск в этой теме Опции просмотра

Помогите реализовать парсер результатов ГУГЛА
  #1  
Старый 03.05.2010, 20:50
Аватар для scorpic393
scorpic393
Banned
Регистрация: 05.02.2010
Сообщений: 70
Провел на форуме:
177258

Репутация: 5
По умолчанию Помогите реализовать парсер результатов ГУГЛА

Помогите плииизз реализовать парсер результатов ГУГЛА,
т.е. я посылаю ему inurl:"blablabla" , он мне выдаёт результаты, допустем 10, по дефлоту.

и я из этих результатов должен получить список УРЛов, на сайты с моим поисковым запросом, подскажите плиз и посоветуйсте алгоритм написание на PHP такого
 
Ответить с цитированием

  #2  
Старый 03.05.2010, 20:54
Аватар для WNZRS
WNZRS
Участник форума
Регистрация: 03.09.2009
Сообщений: 179
Провел на форуме:
1014907

Репутация: 90
Отправить сообщение для WNZRS с помощью ICQ
По умолчанию

ищи по форуму, было много всяких вариантов
 
Ответить с цитированием

  #3  
Старый 03.05.2010, 21:39
Аватар для BABBLS
BABBLS
Новичок
Регистрация: 02.09.2007
Сообщений: 4
Провел на форуме:
16098

Репутация: 0
По умолчанию

зачем изобретать что то еще... если уже готовые скрипты есть?
типа скрипт одабейс
 
Ответить с цитированием

  #4  
Старый 04.05.2010, 00:33
Аватар для m0Hze
m0Hze
Он хакер.
Регистрация: 01.11.2008
Сообщений: 1,756
Провел на форуме:
6462214

Репутация: 3171


По умолчанию

Цитата:
Сообщение от BABBLS  
зачем изобретать что то еще... если уже готовые скрипты есть?
типа скрипт одабейс
Кагбе, я в шоке. 150$ за 100-1500 строчек говяного кода?
Даю наводку ТС.
PHP код:
 $page file_get_contents('http://www.google.com/ie?q=' urlencode($query) .
        
'&num='.$countPage.'&hl=ru&start=' $pageNum '00&sa=N');
    
preg_match_all('#title="(.*)" href=(.*)>#isU'$page$match); 
 
Ответить с цитированием

  #5  
Старый 04.05.2010, 10:03
Аватар для devton
devton
Участник форума
Регистрация: 26.10.2007
Сообщений: 283
Провел на форуме:
2605910

Репутация: 212
По умолчанию

да помогут тебе этот и этот линки
 
Ответить с цитированием

  #6  
Старый 04.05.2010, 13:53
Аватар для eLWAux
eLWAux
Members of Antichat - Level 5
Регистрация: 15.06.2008
Сообщений: 941
Провел на форуме:
5111568

Репутация: 2399


Отправить сообщение для eLWAux с помощью ICQ
По умолчанию

модуль из одного довольно большого парсинг-движка:
PHP код:
     // itspoma, 12.04.2010
         
     
class google
     
{
         public 
$pages 0;
         public 
$try 0;
             
         function 
parse($q$page 0) {
                global 
$config;
                     
                
$count_inpage rand(41,59);
                
$offset $page*$count_inpage;
                
$google_page curl('http://www.google.com/search?hl=ru&q='.urlencode($q).'&start='.$offset.'&num='.$count_inpage.'&');
                
debug($google_page'google_page'.($page+1));
                     
                if (
stristr($google_page'>Sorry...<'))
                {
                    
sleep(10);
                    
$page += rand(1,4);
                    
$this->try++;
                    if (
$this->try <= 3) {
                        return 
$this->parse($q.' '$page);
                    }
                    return array();
                }
                     
                
$links = array();
                
$temp_links = array();
                
preg_match_all('/<h3 class=r><a href="(.+?)"/is'$google_page$temp_links);
                
ar_push_ar($links$temp_links[1]);
                     
                
preg_match_all('/<a href="\/url\?q=(.+?)[&|"]+/is'$google_page$temp_links);
                
ar_push_ar($links$temp_links[1]);
                     
                if (
$config['debug'] == True)
                    echo 
'<b><font color=red>page '.($page+1).'</b></font> '.count($links).'<br/>';
                     
                if (
stristr($google_page,'&amp;start='.(($page+1)*$count_inpage))) {
                     if (
$this->pages-&& $page >= $this->pages-1) {
                         return 
$links;
                     }
                     
$temp_links $this->parse($q$page+1);
                     
ar_push_ar($links$temp_links);
                }
                     
                return 
$links;
         }
     }

    
// ф-ция для добавления масива в другой масив
    
function ar_push_ar(&$a,$b)
    {
             foreach(
$b as $el)
             {
                 
array_push($a$el);
             }
    } 
юзать:
PHP код:
$g = new google();
$g->pages 3;
$links $g->parse('antichat');
var_dump$links ); 
 
Ответить с цитированием

  #7  
Старый 04.05.2010, 15:31
Аватар для scorpic393
scorpic393
Banned
Регистрация: 05.02.2010
Сообщений: 70
Провел на форуме:
177258

Репутация: 5
По умолчанию

moHze, elWaux, спасибо большое!
 
Ответить с цитированием

  #8  
Старый 04.05.2010, 23:03
Аватар для olishort
olishort
Участник форума
Регистрация: 13.04.2009
Сообщений: 121
Провел на форуме:
436858

Репутация: 33
По умолчанию

через пару запросов от гугла капча придет, либа бан. юзай прокси
 
Ответить с цитированием

  #9  
Старый 04.05.2010, 23:49
Аватар для phpdreamer
phpdreamer
Постоянный
Регистрация: 26.07.2009
Сообщений: 321
Провел на форуме:
444589

Репутация: 123
Отправить сообщение для phpdreamer с помощью ICQ
По умолчанию

Цитата:
Сообщение от olishort  
через пару запросов от гугла капча придет, либа бан. юзай прокси

наверно Вас в гугле так и забанили...
 
Ответить с цитированием
Ответ



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Помогите реализовать блок схему GroodeR С/С++, C#, Delphi, .NET, Asm 1 11.03.2010 23:39
Помогите. Сайт выпадает из индекса гугла, что делать? Vlad&slav Белые методы раскрутки 7 11.02.2010 17:32
Помогите реализовать Scripter PHP, PERL, MySQL, JavaScript 2 09.12.2009 02:35
Помогите реализовать на Java!!! SEOGari PHP, PERL, MySQL, JavaScript 14 05.10.2009 00:44
Посоветуйте парсер гугла diznt Болталка 13 22.05.2009 22:16



Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
 


Быстрый переход




ANTICHAT.XYZ