PDA

Просмотр полной версии : Парсинг внутренних ссылок


programming
21.02.2010, 14:17
Задача: спарсить с любого сайта абсолютно все внутренние ссылки(ведущие на другие страницы этого же сайта), при чём сделать это максимально быстрым способом. Поэтому регулярки не подходят. Склоняюсь к DOM, но точно не знаю как парсить таким способом. То есть без использования различных дополнительных библиотек.. Быть может будут и готовые решения?

wildshaman
21.02.2010, 14:22
Спарсить с определенной страницы или же рекурсивно пройтись по всем отпарсенным ссылкам и дальше парсить?
если с одной, почему регулярки не подходят?

programming
21.02.2010, 15:09
Пойти дальше и парсить все внутренние ссылки с уже спарсенных ссылок..

b3
21.02.2010, 16:44
Тема закрыта, последнее замечание, вопросы задаются в прикрепленные топики.