Форум АНТИЧАТ

Форум АНТИЧАТ (https://forum.antichat.xyz/index.php)
-   С/С++, C#, Delphi, .NET, Asm (https://forum.antichat.xyz/forumdisplay.php?f=24)
-   -   goog (https://forum.antichat.xyz/showthread.php?t=44511)

Robin_Hood 15.07.2007 18:12

goog
 
Небольшая програмка на С, парсит линки гугла по запросам и пишет в файл
Пример использования:
goog.exe [запрос][количество линков][стартовая страница]
Example: goog.exe test 100 0
Example: goog.exe allinurl:res.php 20 0

http://gfs-team.ru/?act=downloads&id=192

сурсы внутри

Jes 16.07.2007 18:09

hmm , а mailto: прокатит? ;)

Robin_Hood 31.07.2007 01:03

ну дык выдаст линку на сайт. я не понял вопроса

LEE_ROY 31.07.2007 01:27

/me тоже писал подобный боян, только с GUI... src included. :), http://webfile.ru/1483471

slesh 31.07.2007 01:33

для домашнего использования - вешь ормальная, а вот для глабвльных действий трафа жалко. Поэтому я юзаю php скрипт который парсит google

W!z@rD 31.07.2007 01:46

Цитата:

Сообщение от Jes
hmm , а mailto: прокатит? ;)

мдя... mail-grabber??? :D

Robin_Hood 31.07.2007 02:00

не, в принципе если чуть чуть одифрцировать, а именно брать сайт, с него брать все линки, качать страницы и парсить на мыла(http://gfs-team.ru/?act=articles&pact=37) то можно сделать чтото подобное

slesh 31.07.2007 02:20

2 Robin_Hood дык тоже самое можно делать для создания дорвеев.
ТОка там придется брать не мыла, а саму страницу.
но всеже на домашних компах не рафионально это делать.

LEE_ROY 31.07.2007 02:26

да нормально все на хоум тачках, сейчас траф у многих анлим - раз, и два - если ты не нуб в сео, то лавэ на траф будет полюбому, и ты и я об этом знаем ;)

Robin_Hood 31.07.2007 02:27

дык я и не говорю про домашние

Underwit 31.07.2007 03:03

В allsubmitter есть функция парсинга линков.
вот статья по теме http://somedate.net/board/showthread.php?t=31

KEZ 31.07.2007 09:24

Код:

function searchgoogle( $search, $start )
{
        GLOBAL $google_host, $gfrom, $gto;

        $start = intval( $start );
        $ret = "";

        $u = "http://$google_host/search?q=".urlencode( $search )."&num=100&start=$start";
        $f = @fopen( $u, "r" );
        if (!$f)
        {
                // Google connection failed
                return 0;
        }

        $data = "";
        while (!feof( $f ))
                $data .= fread( $f, 1024 );
        fclose( $f );

        preg_match_all( "/<p class=g><a class=l href=\"(.*)\">/U", $data, $links, PREG_SET_ORDER );
        foreach( $links as $l )
                $ret .= $l[1]."\r\n";

        if (!preg_match_all( "/ <b>([0-9]*)<\/b> - <b>([0-9]*)<\/b> /U", $data, $fromto, PREG_SET_ORDER ))
        {
                sleep( 2 );
                return 0;
        }
        $results_from = intval( $fromto[0][1] );
        $results_to = intval( $fromto[0][2] );
        if ($results_from && $results_to && ($results_to - $results_from == 99))
        {
                if ($gfrom && $gto)
                        sleep( rand( $gfrom, $gto ) );
                else
                        sleep( 5, 15 );
                $ret .= searchgoogle( $search, $results_from+99 );
        }
        return $ret;
}

print searchgoogle( "skachat berkovu porno dom2" );


Robin_Hood 31.07.2007 11:10

preg_match_all( "/<p class=g><a class=l href=\"(.*)\">/U", $data, $links, PREG_SET_ORDER );
дык так гораздо проще + нету фильтрации на мусор который выдает гугл, линки на его сервиисы.

slesh 31.07.2007 12:25

Цитата:

print searchgoogle( "skachat berkovu porno dom2" );
Теперь я сно чем народ в гугле занимается ;)
Сори за оффтоп.
А вот мне по вкусу вот такой вот код:
preg_match_all("|<a\s[^>]*?href\s*=\s*[\'\"]?(http://[^\s\'\">]+)[\s\'\"]?[^>]*?>(.+?)</a>|si", $content, $matches);

Robin_Hood 31.07.2007 13:51

а мне понятней моя функция=)


Время: 10:28