Форум АНТИЧАТ

Форум АНТИЧАТ (https://forum.antichat.xyz/index.php)
-   PHP, PERL, MySQL, JavaScript (https://forum.antichat.xyz/forumdisplay.php?f=37)
-   -   ВОПРОСЫ по books.google.com (https://forum.antichat.xyz/showthread.php?t=102367)

burcev 21.01.2009 13:01

ВОПРОСЫ по books.google.com
 
Сразу к делу. Имеется вот такая книга http://books.google.com/books?id=FlxlMVsnIB8C&printsec=frontcover&hl=uk#PP P1,M1 .
Задача: нужно с помощью каких-то скриптов(если такие имеются, или хотя бы теорию как его можно сделать) "вытащить" этот pdf или картинки(страницы).

Заранее благодарен за помощь.

lisa99 22.01.2009 10:55

Там не нужны скрипты...
pdf ты не вытащишь, реально оставить только jpg
Спарсить картинки не проблема даже ручками.

В твоем случае у тебя это
http://books.google.com/books?id=FlxlMVsnIB8C&pg=PP1&img=1&zoom=3&hl=uk&si g=ACfU3U1xUt_O1SNwGi4pwWs_VFZEfs6Nrw

Я взяла это из исходного текста страницы

в любой враузер, затем сохранить как гипертекст с рисунками- и вуаля- в папочке будут только страницы.

А еще лучше- поставь ФФ с плагинами сохранения мультимедийного контента. те заточены вытаскивать все.

Pashkela 22.01.2009 15:11

Там все-равно ограничение на кол-во страниц, всю книжку так не спарсишь


Время: 06:32