ANTICHAT — форум по информационной безопасности, OSINT и технологиям
ANTICHAT — русскоязычное сообщество по безопасности, OSINT и программированию.
Форум ранее работал на доменах antichat.ru, antichat.com и antichat.club,
и теперь снова доступен на новом адресе —
forum.antichat.xyz.
Форум восстановлен и продолжает развитие: доступны архивные темы, добавляются новые обсуждения и материалы.
⚠️ Старые аккаунты восстановить невозможно — необходимо зарегистрироваться заново.
 |
|
"Выдрать" конкретную часть сайта на C# |

19.05.2010, 15:52
|
|
Участник форума
Регистрация: 06.11.2008
Сообщений: 208
Провел на форуме: 261838
Репутация:
9
|
|
"Выдрать" конкретную часть сайта на C#
Доброго времени суток!
Есть у меня такая задача, нужно "выдрать"/достать/извлечь конкретную область сайта(в моем случае это сайт deviantart). Что я имею ввиду по словами "выдрать"/достать/извлечь конкретную область сайт?
Т.е. необходимо чтобы любая часть/блок сайта, допустим блок с фотографиями, отображался у меня в WebBrowser. И чтобы там были именно только фотографии конкретного блока и ничего больше. Либо допустим, только блок с комментариями.
Пример:
1.
2.
Вот 1. это сайт, главная страница, а 2., то что нужно достать...
Использовать пытаюсь Data Extracting SDK.
И вот так:
Код:
HtmlProcessor proc = new HtmlProcessor(new UriHtmlProcessor("http://www.deviantart.com/").DocumentSource);
var divs = proc.Body.GetDomElements("div").Where(div => div.Class == "tt.a");
foreach(var div in divs)
{
var images = div.GetDomElements("img");
}
Возможно кто-то работал уже с данной SDK. Посоветуйте пожалуйста как это сделать? Потому что уже не знаю как и что. Запустался.
Либо может каким-то стандартными путями...
Заранее благодарю.
Последний раз редактировалось F&D; 20.05.2010 в 19:36..
|
|
|

19.05.2010, 17:10
|
|
Reservists Of Antichat - Level 6
Регистрация: 12.02.2006
Сообщений: 891
Провел на форуме: 1892597
Репутация:
836
|
|
Стандартные пути:
IndexOf, Remove, ...
+ Regex
__________________
*********************************
*Я не волшебник ٩(๏̯͡๏)۶, только учусь...*
*********************************
Программы на заказ
Times to fly...
|
|
|

19.05.2010, 18:04
|
|
Участник форума
Регистрация: 06.11.2008
Сообщений: 208
Провел на форуме: 261838
Репутация:
9
|
|
Сообщение от W!z@rD
Стандартные пути:
IndexOf, Remove, ...
+ Regex
Спасибо.
А можно маленький пример?
|
|
|

19.05.2010, 18:21
|
|
Banned
Регистрация: 20.04.2010
Сообщений: 33
Провел на форуме: 407913
Репутация:
26
|
|
string URL = "http://google.ru";
HttpWebRequest request = (HttpWebRequest)WebRequest.Create(URL);
request.Timeout = 999999999;
string data = new StreamReader(request.GetResponse().GetResponseStre am()).ReadToEnd();
|
|
|

19.05.2010, 18:29
|
|
Banned
Регистрация: 20.04.2010
Сообщений: 33
Провел на форуме: 407913
Репутация:
26
|
|
Чтоб не создавать ещё 1 тему, не кто не подскажет как со string переменной можно убрать все дубли (повторные слова)?
P.S ТС сорри за оффтоп.
|
|
|

20.05.2010, 19:37
|
|
Участник форума
Регистрация: 06.11.2008
Сообщений: 208
Провел на форуме: 261838
Репутация:
9
|
|
Сообщение от assume[C3]
string URL = "http://google.ru";
HttpWebRequest request = (HttpWebRequest)WebRequest.Create(URL);
request.Timeout = 999999999;
string data = new StreamReader(request.GetResponse().GetResponseStre am()).ReadToEnd();
Что-то не совсем понятно.
Не уже ли я настолько далекий... 
|
|
|

20.05.2010, 20:01
|
|
Постоянный
Регистрация: 09.06.2005
Сообщений: 531
Провел на форуме: 3516666
Репутация:
439
|
|
Сообщение от F&D
Что-то не совсем понятно.
Не уже ли я настолько далекий... 
в этом примере он паказал, как получить исходник страницы. его ты и можешь пропарсить regex.
Сообщение от assume[C3]
Чтоб не создавать ещё 1 тему, не кто не подскажет как со string переменной можно убрать все дубли (повторные слова)?.
Код:
string newString = string.Join(" ", oldString.Split(new char[1] { ' ' }).Distinct().Select(s => s.ToString()).ToArray())+"\nthat's why i love c# :)";
Последний раз редактировалось BrainDeaD; 20.05.2010 в 20:55..
|
|
|

20.05.2010, 20:56
|
|
Участник форума
Регистрация: 06.11.2008
Сообщений: 208
Провел на форуме: 261838
Репутация:
9
|
|
Сообщение от BrainDeaD
в этом примере он паказал, как получить исходник страницы. его ты и можешь пропарсить regex.
Я правильно понял - это оно?!
|
|
|

20.05.2010, 21:00
|
|
Постоянный
Регистрация: 09.06.2005
Сообщений: 531
Провел на форуме: 3516666
Репутация:
439
|
|
да, правильно. с его помощью ты можешь искат
регулярные выражения и выбирать тебе нужные.
|
|
|

20.05.2010, 21:15
|
|
Участник форума
Регистрация: 06.11.2008
Сообщений: 208
Провел на форуме: 261838
Репутация:
9
|
|
Сообщение от BrainDeaD
да, правильно. с его помощью ты можешь искат
регулярные выражения и выбирать тебе нужные.
Ну что ж.. попробую.
Спасибо.
|
|
|
|
 |
|
|
Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
|
|
|
|