ANTICHAT.XYZ    VIDEO.ANTICHAT.XYZ    НОВЫЕ СООБЩЕНИЯ    ФОРУМ  
Баннер 1   Баннер 2

ANTICHAT — форум по информационной безопасности, OSINT и технологиям

ANTICHAT — русскоязычное сообщество по безопасности, OSINT и программированию. Форум ранее работал на доменах antichat.ru, antichat.com и antichat.club, и теперь снова доступен на новом адресе — forum.antichat.xyz.
Форум восстановлен и продолжает развитие: доступны архивные темы, добавляются новые обсуждения и материалы.
⚠️ Старые аккаунты восстановить невозможно — необходимо зарегистрироваться заново.
Вернуться   Форум АНТИЧАТ > Программирование > С/С++, C#, Delphi, .NET, Asm
   
Ответ
 
Опции темы Поиск в этой теме Опции просмотра

"Выдрать" конкретную часть сайта на C#
  #1  
Старый 19.05.2010, 15:52
F&D
Участник форума
Регистрация: 06.11.2008
Сообщений: 208
Провел на форуме:
261838

Репутация: 9
По умолчанию "Выдрать" конкретную часть сайта на C#

Доброго времени суток!
Есть у меня такая задача, нужно "выдрать"/достать/извлечь конкретную область сайта(в моем случае это сайт deviantart). Что я имею ввиду по словами "выдрать"/достать/извлечь конкретную область сайт?
Т.е. необходимо чтобы любая часть/блок сайта, допустим блок с фотографиями, отображался у меня в WebBrowser. И чтобы там были именно только фотографии конкретного блока и ничего больше. Либо допустим, только блок с комментариями.

Пример:
1.


2.


Вот 1. это сайт, главная страница, а 2., то что нужно достать...


Использовать пытаюсь Data Extracting SDK.
И вот так:
Код:
HtmlProcessor proc = new HtmlProcessor(new UriHtmlProcessor("http://www.deviantart.com/").DocumentSource);    
var divs = proc.Body.GetDomElements("div").Where(div => div.Class == "tt.a");     
foreach(var div in divs) 
{        
    var images = div.GetDomElements("img"); 
}

Возможно кто-то работал уже с данной SDK. Посоветуйте пожалуйста как это сделать? Потому что уже не знаю как и что. Запустался.

Либо может каким-то стандартными путями...

Заранее благодарю.

Последний раз редактировалось F&D; 20.05.2010 в 19:36..
 
Ответить с цитированием

  #2  
Старый 19.05.2010, 17:10
W!z@rD
Reservists Of Antichat - Level 6
Регистрация: 12.02.2006
Сообщений: 891
Провел на форуме:
1892597

Репутация: 836


Отправить сообщение для W!z@rD с помощью ICQ
По умолчанию

Стандартные пути:
IndexOf, Remove, ...
+ Regex
__________________
*********************************
*Я не волшебник ٩(๏̯͡๏)۶, только учусь...*
*********************************
Программы на заказ
Times to fly...
 
Ответить с цитированием

  #3  
Старый 19.05.2010, 18:04
F&D
Участник форума
Регистрация: 06.11.2008
Сообщений: 208
Провел на форуме:
261838

Репутация: 9
По умолчанию

Цитата:
Сообщение от W!z@rD  
Стандартные пути:
IndexOf, Remove, ...
+ Regex
Спасибо.
А можно маленький пример?
 
Ответить с цитированием

  #4  
Старый 19.05.2010, 18:21
assume[C3]
Banned
Регистрация: 20.04.2010
Сообщений: 33
Провел на форуме:
407913

Репутация: 26
По умолчанию

string URL = "http://google.ru";
HttpWebRequest request = (HttpWebRequest)WebRequest.Create(URL);
request.Timeout = 999999999;
string data = new StreamReader(request.GetResponse().GetResponseStre am()).ReadToEnd();
 
Ответить с цитированием

  #5  
Старый 19.05.2010, 18:29
assume[C3]
Banned
Регистрация: 20.04.2010
Сообщений: 33
Провел на форуме:
407913

Репутация: 26
По умолчанию

Чтоб не создавать ещё 1 тему, не кто не подскажет как со string переменной можно убрать все дубли (повторные слова)?

P.S ТС сорри за оффтоп.
 
Ответить с цитированием

  #6  
Старый 20.05.2010, 19:37
F&D
Участник форума
Регистрация: 06.11.2008
Сообщений: 208
Провел на форуме:
261838

Репутация: 9
По умолчанию

Цитата:
Сообщение от assume[C3]  
string URL = "http://google.ru";
HttpWebRequest request = (HttpWebRequest)WebRequest.Create(URL);
request.Timeout = 999999999;
string data = new StreamReader(request.GetResponse().GetResponseStre am()).ReadToEnd();
Что-то не совсем понятно.
Не уже ли я настолько далекий...
 
Ответить с цитированием

  #7  
Старый 20.05.2010, 20:01
BrainDeaD
Постоянный
Регистрация: 09.06.2005
Сообщений: 531
Провел на форуме:
3516666

Репутация: 439


По умолчанию

Цитата:
Сообщение от F&D  
Что-то не совсем понятно.
Не уже ли я настолько далекий...
в этом примере он паказал, как получить исходник страницы. его ты и можешь пропарсить regex.



Цитата:
Сообщение от assume[C3]  
Чтоб не создавать ещё 1 тему, не кто не подскажет как со string переменной можно убрать все дубли (повторные слова)?.
Код:
string newString = string.Join(" ", oldString.Split(new char[1] { ' ' }).Distinct().Select(s => s.ToString()).ToArray())+"\nthat's why i love c# :)";

Последний раз редактировалось BrainDeaD; 20.05.2010 в 20:55..
 
Ответить с цитированием

  #8  
Старый 20.05.2010, 20:56
F&D
Участник форума
Регистрация: 06.11.2008
Сообщений: 208
Провел на форуме:
261838

Репутация: 9
По умолчанию

Цитата:
Сообщение от BrainDeaD  
в этом примере он паказал, как получить исходник страницы. его ты и можешь пропарсить regex.
Я правильно понял - это оно?!
 
Ответить с цитированием

  #9  
Старый 20.05.2010, 21:00
BrainDeaD
Постоянный
Регистрация: 09.06.2005
Сообщений: 531
Провел на форуме:
3516666

Репутация: 439


По умолчанию

да, правильно. с его помощью ты можешь искат
регулярные выражения и выбирать тебе нужные.
 
Ответить с цитированием

  #10  
Старый 20.05.2010, 21:15
F&D
Участник форума
Регистрация: 06.11.2008
Сообщений: 208
Провел на форуме:
261838

Репутация: 9
По умолчанию

Цитата:
Сообщение от BrainDeaD  
да, правильно. с его помощью ты можешь искат
регулярные выражения и выбирать тебе нужные.
Ну что ж.. попробую.
Спасибо.
 
Ответить с цитированием
Ответ



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Большой архив статей по раскрутке и оптимизации сайтов _-Ramos-_ Статьи 12 13.06.2010 23:56
Шпаргалки для сертификатов по Битрикс Liar PHP, PERL, MySQL, JavaScript 7 30.05.2009 10:13
часть заказов одного сайта по взлому почты) lmns Болталка 2 18.04.2009 20:34
Раскрутка сайта heks Статьи 15 15.02.2009 19:51



Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
 


Быстрый переход




ANTICHAT.XYZ