![]() |
Парсинг внутренних ссылок
Задача: спарсить с любого сайта абсолютно все внутренние ссылки(ведущие на другие страницы этого же сайта), при чём сделать это максимально быстрым способом. Поэтому регулярки не подходят. Склоняюсь к DOM, но точно не знаю как парсить таким способом. То есть без использования различных дополнительных библиотек.. Быть может будут и готовые решения?
|
Спарсить с определенной страницы или же рекурсивно пройтись по всем отпарсенным ссылкам и дальше парсить?
если с одной, почему регулярки не подходят? |
Пойти дальше и парсить все внутренние ссылки с уже спарсенных ссылок..
|
Тема закрыта, последнее замечание, вопросы задаются в прикрепленные топики.
|
| Время: 10:48 |