
25.07.2009, 20:11
|
|
Участник форума
Регистрация: 14.12.2008
Сообщений: 140
С нами:
9161606
Репутация:
14
|
|
млин, почему-то не помогло...
вот текст который парсер должен выдернуть
<p style="margin:0 0 0.5em 0;"><b>Media from <a href="/title/tt0412142/" onclick="(new Image()).src='/rg/find-media-title/media_strip/images/b.gif?link=/title/tt0412142/';">"House M.D."</a> (2004)</b></p>
но мне нужно именно там где ссылка, а он нифига...
|
|
|

25.07.2009, 20:17
|
|
Постоянный
Регистрация: 06.02.2008
Сообщений: 494
С нами:
9610769
Репутация:
380
|
|
PHP код:
<?php
$text=<<<HTML
<p style="margin:0 0 0.5em 0;"><b>Media from <a href="/title/tt0412142/" onclick="(new Image()).src='/rg/find-media-title/media_strip/images/b.gif?link=/title/tt0412142/';">"House M.D."</a> (2004)</b></p>';
HTML;
preg_match_all('#<a href="(/title/.*)"#isU',$text,$match); print_r($match);
Последний раз редактировалось PaCo; 25.07.2009 в 20:20..
|
|
|

25.07.2009, 20:27
|
|
Участник форума
Регистрация: 14.12.2008
Сообщений: 140
С нами:
9161606
Репутация:
14
|
|
Всё, переделал я свой скрипт и улучшил немного и заработало и все вашы регулярки объеденил...)
Последний раз редактировалось alwex; 25.07.2009 в 20:33..
|
|
|

29.07.2009, 07:57
|
|
Познавший АНТИЧАТ
Регистрация: 16.04.2006
Сообщений: 1,488
С нами:
10562786
Репутация:
537
|
|
есть мыло на страничке
enquiries@themanchestercollege.ac.uk
первый раз парсил все имейлы, у которых в конце одна зона
PHP код:
preg_match_all('/([0-9A-Za-z\_\-]*)\@([0-9A-Za-z\-\_]*)\.([a-zA-Z]{2,5})/i', $return, $matches);
второй раз имейлы с двумя зонами
PHP код:
preg_match_all('/([0-9A-Za-z\_\-]*)\@([0-9A-Za-z\-\_]*)\.([a-zA-Z]{2,5})\.([a-zA-Z]{2,5})/i', $return, $matches2)
и соответственно получил один и тот же имейл
PHP код:
[0] => enquiries@themanchestercollege.ac
[1] => enquiries@themanchestercollege.ac.uk
как вытащить одной регуляркой все имейлы с одной и двумя зонами в конце?
|
|
|

29.07.2009, 08:49
|
|
Reservists Of Antichat - Level 6
Регистрация: 25.04.2008
Сообщений: 827
С нами:
9497186
Репутация:
1304
|
|
Дикс
PHP код:
preg_match_all('/(*)\@(+)(\.{2,5})+/i', $return, $matches);
|
|
|

29.07.2009, 13:23
|
|
Динозавр
Регистрация: 10.01.2008
Сообщений: 2,841
С нами:
9649706
Репутация:
3338
|
|
PHP код:
<pre>
<?php
$text = 'Лабуда, anti_chat@yandex.ru, разный текст
Лабуда, enquiries@themanchester-college.ac, разный текст текста=)enqu578iries@themanchestercollege.ac.uk Приведите Лабуда, разный текст , разный текст пример текста=) Типо такого...';
preg_match_all('/[\w\-]+@[\w\-]+.\w+.\w+/', $text, $out);
print_r($out);
?>
</pre>
Последний раз редактировалось Pashkela; 29.07.2009 в 13:35..
|
|
|

30.07.2009, 01:31
|
|
Участник форума
Регистрация: 07.08.2008
Сообщений: 281
С нами:
9347610
Репутация:
165
|
|
Здравствуйте, помогите пожалуйсто регулярку составить.
Есть такое вот HTML код
Код:
<head><title>13183-Купля/Продажа/Заработок в сети</title></head>
<body bgcolor="#239651" link="#006f11" vlink="#469453" text="#000000">
<form method="post" action="/?p=1&f=5&w=htm">
<table align="center" border="0" cellspacing="1" cellpadding="5" width="100%">
<tr><td align="center" bgcolor="#005522"><font color="#ffffff"><b>13183-Купля/Продажа/Заработок в сети</b></font></td></tr>
<tr><td bgcolor="#a2edc0">
<a href="/?p=0&w=htm"><font color="#006f11">Форумы</font></a><br/>
<a href="/?p=1&f=5&w=htm&o=t"><font color="#006f11">Популярные темы</font></a><br/>
</td></tr>
<tr><td bgcolor="#c5ffdc">
30/07 00:04]<b>Slimi</b><br/><b><a href="/?p=3&f=5&t=3274158&w=htm&pg=4">продам!</a></b>(11)<br/> <br/>
29/07 23:20#<b>][akep</b><br/><b><a href="/?p=3&f=5&t=3274156&w=htm&pg=4">Продам или обменяю сайт</a></b>(4)<br/> <br/>
29/07 23:21#<b>cranz</b><br/><b><a href="/?p=3&f=5&t=3274142&w=htm&pg=4">Куплю сайт</a></b>(1)<br/> <br/>
29/07 23:01]<b>lbast_ru</b><br/><b><a href="/?p=3&f=5&t=3274128&w=htm&pg=4">Продам перса</a></b>(0)<br/> <br/>
29/07 23:40]<b>mrus.org</b><br/><b><a href="/?p=3&f=5&t=3274127&w=htm&pg=4">Кто денег на щет кинет ???</a></b>(32)<br/> <br/>
29/07 23:06]<b>SimBeerSk</b><br/><b><a href="/?p=3&f=5&t=3274126&w=htm&pg=4">Продам кредиты</a></b>(5)<br/> <br/>
29/07 23:05]<b>yar__94</b><br/><b><a href="/?p=3&f=5&t=3274121&w=htm&pg=4">куплю сайты на вен или кмx</a></b>(5)<br/> <br/>
</td></tr>
Как можно отфильтровать только ники
Код:
SimBeerSk
cranz
][akep
|
|
|

30.07.2009, 02:26
|
|
Динозавр
Регистрация: 10.01.2008
Сообщений: 2,841
С нами:
9649706
Репутация:
3338
|
|
PHP код:
<pre>
<?php
@ini_set("display_errors","1");
$a = '
<head><title>13183-Купля/Продажа/Заработок в сети</title></head>
<body bgcolor="#239651" link="#006f11" vlink="#469453" text="#000000">
<form method="post" action="/?p=1&f=5&w=htm">
<table align="center" border="0" cellspacing="1" cellpadding="5" width="100%">
<tr><td align="center" bgcolor="#005522"><font color="#ffffff"><b>13183-Купля/Продажа/Заработок в сети</b></font></td></tr>
<tr><td bgcolor="#a2edc0">
<a href="/?p=0&w=htm"><font color="#006f11">Форумы</font></a><br/>
<a href="/?p=1&f=5&w=htm&o=t"><font color="#006f11">Популярные темы</font></a><br/>
</td></tr>
<tr><td bgcolor="#c5ffdc">
30/07 00:04]<b>Slimi</b><br/><b><a href="/?p=3&f=5&t=3274158&w=htm&pg=4">продам!</a></b>(11)<br/> <br/>
29/07 23:20#<b>][akep</b><br/><b><a href="/?p=3&f=5&t=3274156&w=htm&pg=4">Продам или обменяю сайт</a></b>(4)<br/> <br/>
29/07 23:21#<b>cranz</b><br/><b><a href="/?p=3&f=5&t=3274142&w=htm&pg=4">Куплю сайт</a></b>(1)<br/> <br/>
29/07 23:01]<b>lbast_ru</b><br/><b><a href="/?p=3&f=5&t=3274128&w=htm&pg=4">Продам перса</a></b>(0)<br/> <br/>
29/07 23:40]<b>mrus.org</b><br/><b><a href="/?p=3&f=5&t=3274127&w=htm&pg=4">Кто денег на щет кинет ???</a></b>(32)<br/> <br/>
29/07 23:06]<b>SimBeerSk</b><br/><b><a href="/?p=3&f=5&t=3274126&w=htm&pg=4">Продам кредиты</a></b>(5)<br/> <br/>
29/07 23:05]<b>yar__94</b><br/><b><a href="/?p=3&f=5&t=3274121&w=htm&pg=4">куплю сайты на вен или кмx</a></b>(5)<br/> <br/>
</td></tr>';
preg_match_all('|<b>(.*)</b><br/><b><a href|',$a, $res);
print_r($res[1]);
?>
</pre>
|
|
|

30.07.2009, 18:19
|
|
Участник форума
Регистрация: 07.08.2008
Сообщений: 281
С нами:
9347610
Репутация:
165
|
|
Код:
Array
(
[0] => banana jam
[1] => =777=
[2] => Amwe y
[3] => savruslan
[4] => wikk
[5] => HaM
[6] => Prezident
)
Возможно ли как нибуть просто имена оставить?
Последний раз редактировалось SeNaP; 30.07.2009 в 18:22..
|
|
|

30.07.2009, 18:23
|
|
Динозавр
Регистрация: 10.01.2008
Сообщений: 2,841
С нами:
9649706
Репутация:
3338
|
|
Забавный вопрос, а у тебя там что, ссылки в комплекте что ли?
ЗЫЖ Расшифруй что тебе надо, вроде у тебя и так массив из имен
Можно переменным присваивать значение элемента массива, можно просто сразу массив имплодить и писать в файл - правда, вопрос непонятен
Последний раз редактировалось Pashkela; 30.07.2009 в 18:25..
|
|
|
|
 |
|
|
Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
|
|
|
|