PDA

Просмотр полной версии : goog


Robin_Hood
15.07.2007, 18:12
Небольшая програмка на С, парсит линки гугла по запросам и пишет в файл
Пример использования:
goog.exe [запрос][количество линков][стартовая страница]
Example: goog.exe test 100 0
Example: goog.exe allinurl:res.php 20 0

http://gfs-team.ru/?act=downloads&id=192

сурсы внутри

Jes
16.07.2007, 18:09
hmm , а mailto: прокатит? ;)

Robin_Hood
31.07.2007, 01:03
ну дык выдаст линку на сайт. я не понял вопроса

LEE_ROY
31.07.2007, 01:27
/me тоже писал подобный боян, только с GUI... src included. :), http://webfile.ru/1483471

slesh
31.07.2007, 01:33
для домашнего использования - вешь ормальная, а вот для глабвльных действий трафа жалко. Поэтому я юзаю php скрипт который парсит google

W!z@rD
31.07.2007, 01:46
hmm , а mailto: прокатит? ;)
мдя... mail-grabber??? :D

Robin_Hood
31.07.2007, 02:00
не, в принципе если чуть чуть одифрцировать, а именно брать сайт, с него брать все линки, качать страницы и парсить на мыла(http://gfs-team.ru/?act=articles&pact=37) то можно сделать чтото подобное

slesh
31.07.2007, 02:20
2 Robin_Hood дык тоже самое можно делать для создания дорвеев.
ТОка там придется брать не мыла, а саму страницу.
но всеже на домашних компах не рафионально это делать.

LEE_ROY
31.07.2007, 02:26
да нормально все на хоум тачках, сейчас траф у многих анлим - раз, и два - если ты не нуб в сео, то лавэ на траф будет полюбому, и ты и я об этом знаем ;)

Robin_Hood
31.07.2007, 02:27
дык я и не говорю про домашние

Underwit
31.07.2007, 03:03
В allsubmitter есть функция парсинга линков.
вот статья по теме http://somedate.net/board/showthread.php?t=31

KEZ
31.07.2007, 09:24
function searchgoogle( $search, $start )
{
GLOBAL $google_host, $gfrom, $gto;

$start = intval( $start );
$ret = "";

$u = "http://$google_host/search?q=".urlencode( $search )."&num=100&start=$start";
$f = @fopen( $u, "r" );
if (!$f)
{
// Google connection failed
return 0;
}

$data = "";
while (!feof( $f ))
$data .= fread( $f, 1024 );
fclose( $f );

preg_match_all( "/<p class=g><a class=l href=\"(.*)\">/U", $data, $links, PREG_SET_ORDER );
foreach( $links as $l )
$ret .= $l[1]."\r\n";

if (!preg_match_all( "/ <b>([0-9]*)<\/b> - <b>([0-9]*)<\/b> /U", $data, $fromto, PREG_SET_ORDER ))
{
sleep( 2 );
return 0;
}
$results_from = intval( $fromto[0][1] );
$results_to = intval( $fromto[0][2] );
if ($results_from && $results_to && ($results_to - $results_from == 99))
{
if ($gfrom && $gto)
sleep( rand( $gfrom, $gto ) );
else
sleep( 5, 15 );
$ret .= searchgoogle( $search, $results_from+99 );
}
return $ret;
}

print searchgoogle( "skachat berkovu porno dom2" );

Robin_Hood
31.07.2007, 11:10
preg_match_all( "/<p class=g><a class=l href=\"(.*)\">/U", $data, $links, PREG_SET_ORDER );
дык так гораздо проще + нету фильтрации на мусор который выдает гугл, линки на его сервиисы.

slesh
31.07.2007, 12:25
print searchgoogle( "skachat berkovu porno dom2" );

Теперь я сно чем народ в гугле занимается ;)
Сори за оффтоп.
А вот мне по вкусу вот такой вот код:
preg_match_all("|<a\s[^>]*?href\s*=\s*[\'\"]?(http://[^\s\'\">]+)[\s\'\"]?[^>]*?>(.+?)</a>|si", $content, $matches);

Robin_Hood
31.07.2007, 13:51
а мне понятней моя функция=)