PDA

Просмотр полной версии : ВОПРОСЫ по books.google.com


burcev
21.01.2009, 13:01
Сразу к делу. Имеется вот такая книга http://books.google.com/books?id=FlxlMVsnIB8C&printsec=frontcover&hl=uk#PPP1,M1 .
Задача: нужно с помощью каких-то скриптов(если такие имеются, или хотя бы теорию как его можно сделать) "вытащить" этот pdf или картинки(страницы).

Заранее благодарен за помощь.

lisa99
22.01.2009, 10:55
Там не нужны скрипты...
pdf ты не вытащишь, реально оставить только jpg
Спарсить картинки не проблема даже ручками.

В твоем случае у тебя это
http://books.google.com/books?id=FlxlMVsnIB8C&pg=PP1&img=1&zoom=3&hl=uk&sig=ACfU3U1xUt_O1SNwGi4pwWs_VFZEfs6Nrw

Я взяла это из исходного текста страницы

в любой враузер, затем сохранить как гипертекст с рисунками- и вуаля- в папочке будут только страницы.

А еще лучше- поставь ФФ с плагинами сохранения мультимедийного контента. те заточены вытаскивать все.

Pashkela
22.01.2009, 15:11
Там все-равно ограничение на кол-во страниц, всю книжку так не спарсишь