Форум АНТИЧАТ

Форум АНТИЧАТ (https://forum.antichat.xyz/index.php)
-   PHP, PERL, MySQL, JavaScript (https://forum.antichat.xyz/forumdisplay.php?f=37)
-   -   Парсинг внутренних ссылок (https://forum.antichat.xyz/showthread.php?t=180677)

programming 21.02.2010 14:17

Парсинг внутренних ссылок
 
Задача: спарсить с любого сайта абсолютно все внутренние ссылки(ведущие на другие страницы этого же сайта), при чём сделать это максимально быстрым способом. Поэтому регулярки не подходят. Склоняюсь к DOM, но точно не знаю как парсить таким способом. То есть без использования различных дополнительных библиотек.. Быть может будут и готовые решения?

wildshaman 21.02.2010 14:22

Спарсить с определенной страницы или же рекурсивно пройтись по всем отпарсенным ссылкам и дальше парсить?
если с одной, почему регулярки не подходят?

programming 21.02.2010 15:09

Пойти дальше и парсить все внутренние ссылки с уже спарсенных ссылок..

b3 21.02.2010 16:44

Тема закрыта, последнее замечание, вопросы задаются в прикрепленные топики.


Время: 10:48