ANTICHAT — форум по информационной безопасности, OSINT и технологиям
ANTICHAT — русскоязычное сообщество по безопасности, OSINT и программированию.
Форум ранее работал на доменах antichat.ru, antichat.com и antichat.club,
и теперь снова доступен на новом адресе —
forum.antichat.xyz.
Форум восстановлен и продолжает развитие: доступны архивные темы, добавляются новые обсуждения и материалы.
⚠️ Старые аккаунты восстановить невозможно — необходимо зарегистрироваться заново.
|
Результаты опроса: Какие функции для парсинга данных используете вы?
|
|
Функции pos, delete, copy...
|
  
|
10 |
47.62% |
|
Компонент TRegExp
|
  
|
6 |
28.57% |
|
Компонент Андрея Сорокина - TRegExpr
|
  
|
1 |
4.76% |
|
Другой вариант (напишите какой)
|
  
|
4 |
19.05% |

16.09.2009, 18:36
|
|
Постоянный
Регистрация: 13.12.2008
Сообщений: 354
Провел на форуме: 1747641
Репутация:
175
|
|
Но, если честно, писать парсеры, боты и т. д. на Delphi и других языках, - вовсе не бредовая идея. Если умеешь, конечно. Меня интересует, какие функции вы чаще всего используете для этой работы?
|
|
|

16.09.2009, 22:08
|
|
Участник форума
Регистрация: 27.08.2009
Сообщений: 131
Провел на форуме: 475164
Репутация:
33
|
|
В разных языках разные функции. Вы про какой спрашиваете? )
|
|
|

16.09.2009, 23:05
|
|
Постоянный
Регистрация: 20.03.2009
Сообщений: 564
Провел на форуме: 991929
Репутация:
395
|
|
2 Chrome~, вот такие функции использую я
PERL
Код:
while($s=<$socket>)
{
$olds=$next;
$all=0;
if($s=~/\<td align=\"left\" valign=\"top\" class=\"decorBodyCell\"\>/){$on=1;next;}
if($s=~/\<\/td\>/){$on=0;next;}
if($s=~/\<a href=\"\.\.\/\"\>(.*)\<\/a\>\ \;\ \;\<a href=\"(.*)\">Вперед/){$all=1;$next=$2;next;}
if($s=~/\<\/p\>\<\/center\>/){next;}
if($s=~/\<p\>(<big>){3}\<strong\>(.*)\<\/strong\>(\<\/big\>){3}\<\/p\>/){$name_stat=$2;next;}
if($s=~/\<p\>\<big\>\<strong\>(.*)\<\/strong\>\<\/big\>\<\/p\>/){$autor_stat=$1;next;}
if($s=~/\<p\>\<strong\>(.*)\<\/strong\><\/p\>/){next;}
if($s=~/\<p\>\<img/){next;}
if($s=~/\<p class=\"textBody\">\<br\>/){next;}
if($s=~/\<hr/){next;}
if($s=~/\s\s\s\<\/p\>/){next;}
if($s=~/\<p\>\((.*)\)\<\/p\>/)
{
$mail_autor=$1;
if(!$mail_autor=~/[a-z_0-9-]@([a-z_0-9-]+\.)/){$mail_autor='';}
next;
}
#if($olds eq $next){last;}
if($on==1){$statya.=$s;}
}
$statya.="|||"; # obozn page
}
JS
Код:
r = str.match(/(?:operate|operatewall)\s*\x28\s*\d+\s*,\s*(\d+)\s*,\s*(\d+)\s*,\s*[\x22\x27](\w+)[\x22\x27]/i);
С
Код:
if((re=pcre_compile ((char *) pattern, PCRE_CASELESS|PCRE_MULTILINE, &error, &erroffset, NULL))==NULL){
printf("Error: %s\nSymbol N%i\nPattern:%s\n",error,erroffset,pattern);
getchar();
exit(1);
}
else
{
if((pairs=pcre_exec(re,NULL,str,4,0,PCRE_NOTEMPTY,vector,vecsize))<0){ printf("Error! num: %i\n",pairs);} ....
PHP
Код:
$id=preg_replace("/\D/","",$_POST['id']);
тупая тема...
|
|
|

17.09.2009, 23:38
|
|
Новичок
Регистрация: 26.08.2009
Сообщений: 19
Провел на форуме: 977507
Репутация:
33
|
|
Вот модуль с процедурами для облегчения парсинга страниц:
Скачать.
|
|
|
|
|
Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
|
|
|
|