![]() |
Регулярное выражение + конец строки [BOOST]
Мужики подскажите плиз , ато что-то в тупик зашел.
Курлом получаю страницу и с нее нужно спарсить некоторые данные Кусок страницы Код:
<tr><td colspan="5" class="statdate">2010-06-12</td></tr>Этоесть конец строкиДопустим есть регулярка Код:
<tr><td colspan=\"5\" class=\"statdate\">([0-9//-])</td></tr>Что впихнуть сюда?<tr><td> </td><td>([a-z]+)</td><td>([0-9]+)</td><td>([0-9]+)</td><td>([0-9//.]+) р.</td></tr> |
(\r\n)*
нормально парсит конец строки. проверяй в hex редакторе, точно там нужные байты? А на счет одного запроса - не обязательно. Часто писали что лучше делать целевые регулярки, чем комбайн. |
Буст не желает парсить таким образом.
Одним запросом в моем случае удобнее, а несколькими много лишнего кода, ну буду парсить пораздельности =/ |
почему лишний. делаешь для каждого типа текста свой метод парса. в итоге в главном меотде будет типа parseTags(...); parseEndLines(...); parsData(...); return result;
|
Да и так прийдется делать отдельные парсеры для данных.
Ща сижу думаю алгоритм как это все красиво потом в табличку запихнуть =) З.Ы. Лучше бы я все это на перле или php написал . Брррр.. нельзя писать под градусом. Криво но зато работает =)) PHP код:
|
| Время: 21:34 |