![]() |
"Выдрать" конкретную часть сайта на C#
Доброго времени суток!
Есть у меня такая задача, нужно "выдрать"/достать/извлечь конкретную область сайта(в моем случае это сайт deviantart). Что я имею ввиду по словами "выдрать"/достать/извлечь конкретную область сайт? Т.е. необходимо чтобы любая часть/блок сайта, допустим блок с фотографиями, отображался у меня в WebBrowser. И чтобы там были именно только фотографии конкретного блока и ничего больше. Либо допустим, только блок с комментариями. Пример: 1. http://www.postimage.org/image.php?v=PqqZfqJ 2. http://www.postimage.org/image.php?v=TsMkyRA Вот 1. это сайт, главная страница, а 2., то что нужно достать... Использовать пытаюсь Data Extracting SDK. И вот так: Код:
HtmlProcessor proc = new HtmlProcessor(new UriHtmlProcessor("http://www.deviantart.com/").DocumentSource); Возможно кто-то работал уже с данной SDK. Посоветуйте пожалуйста как это сделать? Потому что уже не знаю как и что. Запустался. Либо может каким-то стандартными путями... Заранее благодарю. |
Стандартные пути:
IndexOf, Remove, ... + Regex |
Цитата:
А можно маленький пример? |
string URL = "http://google.ru";
HttpWebRequest request = (HttpWebRequest)WebRequest.Create(URL); request.Timeout = 999999999; string data = new StreamReader(request.GetResponse().GetResponseStre am()).ReadToEnd(); |
Чтоб не создавать ещё 1 тему, не кто не подскажет как со string переменной можно убрать все дубли (повторные слова)?
P.S ТС сорри за оффтоп. |
Цитата:
Не уже ли я настолько далекий... :( |
Цитата:
Цитата:
Код:
string newString = string.Join(" ", oldString.Split(new char[1] { ' ' }).Distinct().Select(s => s.ToString()).ToArray())+"\nthat's why i love c# :)"; |
Цитата:
|
да, правильно. с его помощью ты можешь искат
регулярные выражения и выбирать тебе нужные. |
Цитата:
Спасибо. |
| Время: 19:56 |