![]() |
ВОПРОСЫ по books.google.com
Сразу к делу. Имеется вот такая книга http://books.google.com/books?id=FlxlMVsnIB8C&printsec=frontcover&hl=uk#PP P1,M1 .
Задача: нужно с помощью каких-то скриптов(если такие имеются, или хотя бы теорию как его можно сделать) "вытащить" этот pdf или картинки(страницы). Заранее благодарен за помощь. |
Там не нужны скрипты...
pdf ты не вытащишь, реально оставить только jpg Спарсить картинки не проблема даже ручками. В твоем случае у тебя это http://books.google.com/books?id=FlxlMVsnIB8C&pg=PP1&img=1&zoom=3&hl=uk&si g=ACfU3U1xUt_O1SNwGi4pwWs_VFZEfs6Nrw Я взяла это из исходного текста страницы в любой враузер, затем сохранить как гипертекст с рисунками- и вуаля- в папочке будут только страницы. А еще лучше- поставь ФФ с плагинами сохранения мультимедийного контента. те заточены вытаскивать все. |
Там все-равно ограничение на кол-во страниц, всю книжку так не спарсишь
|
| Время: 06:32 |