С помощью idHttp и CookieManager я авторизуюсь на сайте N, затем запросом http.get("N.ru/нужная страница"); загружаю исходный код запрашиваемой HTML'ки. С этим все отлично.
Вопрос: подскажите пожалуйста в каком направлении копать на пути парсинга загруженной HTML страницы,
без TWebBrowser. В частности как получать данные из таблиц с
id и
class например
Код HTML:
<table id="mess">
<tr id="qwerty">
<td class="main">...</td>
</tr>
</table>
То бишь, надо выдернуть данные (текст) из содержащих эти классы/айди тегов.
Насколько я понял,нужный парсинг лежит в огороде DOM, а парсить путем Pos("") не особо хочется
По DOM'у, в исходниках везде идет представление WebBrowser.Document как IHTMLDocument2, но можно и без WebBrowser.Document, для этого надо что-то перегонять в IHTMLDocument2, а вот что - без понятия
