
21.02.2010, 22:29
|
|
Постоянный
Регистрация: 16.04.2008
Сообщений: 889
С нами:
9510146
Репутация:
1550
|
|
Сообщение от programming
Задача: спарсить с любого сайта абсолютно все внутренние ссылки(ведущие на другие страницы этого же сайта), при чём сделать это максимально быстрым способом. Поэтому регулярки не подходят. Склоняюсь к DOM, но точно не знаю как парсить таким способом. То есть без использования различных дополнительных библиотек.. Быть может будут и готовые решения?
Со всего сайта рекурсивно или 't с одной страницы?
Чем не устраивают регулярки?
|
|
|