Linux.org.ua

Всячина => Загальне => Гілку створено: yurchor від 2010-04-26 20:58:56

Тема: Книжки Google
Автор: yurchor від 2010-04-26 20:58:56
Доброї пори доби!

Чи не знає хтось надійного і помірно законного способу видобування сторінок книг з Google Books? Opera чомусь відмовляється зберігати png (може то щось інше?) у кеші.

Дякую за відповіді.
Тема: Re: Книжки Google
Автор: piktor від 2010-04-26 21:28:06
Я видер, Firefox+NoScript. Багато так не потягнете, але сторінок з п'ять-десять (наскільки терпіння вистачить) вийде.
Отже, вимикаємо жабоскрипт, відкриваємо потрібну сторінку. Якщо спробувати зберегти через контекстне меню - отримаємо cleardot.gif розміром 1х1 піксель.
Відкриваємо код сторінки, шукаємо цей cleardot.gif, ось що знаходимо:
(https://linux.org.ua/proxy.php?request=http%3A%2F%2Fs19.radikal.ru%2Fi192%2F1004%2Fff%2F77f059a3da25t.jpg&hash=2acea721ca546d8521e4d53872db828d) (http://radikal.ru/F/s19.radikal.ru/i192/1004/ff/77f059a3da25.png.html)
Тобто, зображення сторінки, що ми бачимо, прописано фоновим через стилі. Копіюємо URL і отримуємо сторінку.
Тема: Re: Книжки Google
Автор: modeus від 2010-04-26 21:28:57
Доброї пори доби!
Opera чомусь відмовляється зберігати png (може то щось інше?) у кеші.

Не зовсім зрозумів, що Ви маєте на увазі. Православний Firefox зберігає png.
Тема: Re: Книжки Google
Автор: piktor від 2010-04-26 21:31:54
Не зовсім зрозумів, що Ви маєте на увазі. Православний Firefox зберігає png.
В Гуглбуксі трішки накрутили, просто так воно не зберігається - дивіться код на скріншоті.
Тема: Re: Книжки Google
Автор: yurchor від 2010-04-26 21:34:14
Доброї пори доби!
Opera чомусь відмовляється зберігати png (може то щось інше?) у кеші.

Не зовсім зрозумів, що Ви маєте на увазі. Православний Firefox зберігає png.
Я єретик. Більше того, я перекладач вождів єретиків.  :P

Втім, православні програми теж не зберігають сторінки. Якби все було так просто, я б не просив поради.  ;)
Тема: Re: Книжки Google
Автор: piktor від 2010-04-26 21:37:46
Еммм. То вам допоміг мій рецепт?
Edit:
Може повернутися за Python і написати грабилку гугльбуксів...  :)
Тема: Re: Книжки Google
Автор: yurchor від 2010-04-26 21:41:48
Я видер, Firefox+NoScript. Багато так не потягнете, але сторінок з п'ять-десять (наскільки терпіння вистачить) вийде.
Отже, вимикаємо жабоскрипт, відкриваємо потрібну сторінку. Якщо спробувати зберегти через контекстне меню - отримаємо cleardot.gif розміром 1х1 піксель.
Відкриваємо код сторінки, шукаємо цей cleardot.gif, ось що знаходимо:
Тобто, зображення сторінки, що ми бачимо, прописано фоновим через стилі. Копіюємо URL і отримуємо сторінку.

М-м-м, ловить лише першу сторінку. Незалежно від того яку зараз переглядаєш. Маніпуляції з img= не проходять. Доведеться щось придумувати.
Edit:
Там далі йде таблиця ідентифікаторів. Придумати б, як її обробити.
Тема: Re: Книжки Google
Автор: noddeat від 2010-04-26 21:44:19
Print Screen?
Тема: Re: Книжки Google
Автор: piktor від 2010-04-26 21:47:40
Шкода, ЛОУ на дозволяє публікувати фрагменти того коду, обзиває мене брудним зламником. Але щойно з тієї-ж книги я зловив іншу довільну сторінку.
Опишіть детально ваші дії зі знімками, бажано.
Тема: Re: Книжки Google
Автор: yurchor від 2010-04-26 21:49:55
Print Screen?
Дякую. Дешево, сердито і ті самі 96 точок на дюйм. /me пішов шукати монітора з екраном, що обертається на 90 градусів.

На роботі колега пропонував переписати вручну (ручкою тобто). ::)
Тема: Re: Книжки Google
Автор: piktor від 2010-04-26 21:51:42
Print Screen?
Сторінка більша за екран, якщо маштабувати - нічого не розберете.
У <div>, куди входить той cleardot.gif є такий рядок:
{ background-image:url("http://books.google.com.ua/books?id=...Це фоновий малюнок цього div, власне, шукана сторінка, а щоб не злямзили - прикривають розтягнутим до відповідних розмірів cleardot.gif.
Тема: Re: Книжки Google
Автор: noddeat від 2010-04-26 21:54:02
Цитата
Сторінка більша за екран, якщо маштабувати - нічого не розберете.
А вона масштабується? У мене 21-дюймовий монітор, на повному екрані вся сторінка в нього влазить, якість та сама вийде. Звісно, метод неідеальний, але швидкий :)
Тема: Re: Книжки Google
Автор: yurchor від 2010-04-26 21:55:00
Дії:

1) Переходжу за цією адресою (http://books.google.com.ua/books?id=vLpeuRcPFFMC&printsec=frontcover&dq=cherepanov+methods+of+fracture+mechanics&source=bl&ots=ljfsbEeIfY&sig=NvoJJzy4-p_jUBZ5g2Hrs-ih-mQ&hl=uk&ei=OLjVS_K9DY_7OYDj3agO&sa=X&oi=book_result&ct=result&resnum=1&ved=0CAoQ6AEwAA#v=onepage&q&f=false).

2) Гортаю до потрібної мені сторінки.

3) Відкриваю код сторінки.

4) Бачу щось таке:{ background-image:url("http://books.google.com.ua/books?id=vLpeuRcPFFMC&pg=PP1&img=1&zoom=3&hl=uk&sig=ACfU3U1zTTfGdvkqvx2OvVD88nP3n6BMKA");
Нижче таблиця:_OC_Run({"page":[{"pid":"PP1","flags":32,"order":0,"h":895},{"pid":"PP8","order":7,"h":902},{"pid":"PP11","order":10},{"pid":"PP12","order":11,"h":896},{"pid":"PP13","order":12,"h":906},{"pid":"PP14","order":13,"h":902},{"pid":"PP15","order":14,"h":905},{"pid":"PP16","order":15,"h":902},{"pid":"PP17","order":16,"h":902},{"pid":"PA1","order":18,"title":"1","h":903},{"pid":"PA2","order":19,"title":"2"},{"pid":"PA3","order":20,"title":"3","h":906},{"pid":"PA4","order":21,"title":"4"},{"pid":"PA5","order":22,"title":"5","h":903},{"pid":"PA6","order":23,"title":"6"},{"pid":"PA7","order":24,"title":"7","h":906},{"pid":"PA8","order":25,"title":"8","h":896},{"pid":"PA9","order":26,"title":"9","h":901},{"pid":"PA10","order":27,"title":"10","h":898},{"pid":"PA11","order":28,"title":"11","h":901},{"pid":"PA12","order":29,"title":"12"},{"pid":"PA13","order":30,"title":"13","h":900},{"pid":"PA14","order":31,"title":"14","h":897},{"pid":"PA15","order":32,"title":"15","h":901},{"pid":"PA16","order":33,"title":"16","h":898},{"pid":"PA17","order":34,"title":"17","h":897},{"pid":"PA18","order":35,"title":"18","h":900},{"pid":"PA19","order":36,"title":"19","h":901},{"pid":"PA20","order":37,"title":"20"},{"pid":"PA21","order":38,"title":"21","h":898},{"pid":"PA22","order":39,"title":"22","h":897},{"pid":"PA23","order":40,"title":"23"}
5) Адреса зображення тла відкриває jpg з обкладинкою.  :'(
Тема: Re: Книжки Google
Автор: piktor від 2010-04-26 21:56:40
А вона масштабується?
З увімненим жабоскриптом - є відповідні кнопушки.
І в мене 15" ноут, тим більше співідношення 16х10 - висота екрану всього 800 пікселів.
Тема: Re: Книжки Google
Автор: piktor від 2010-04-26 22:01:02
Дії:
....
А я казав вимкнути жабоскрипт? А ви не послухали.
Тема: Re: Книжки Google
Автор: Campana від 2010-04-26 22:16:03
Подужайте таки правовірний Фаєрфокс (йа Шабнігуррат!). Бо для нього рецепт у стилі LORу виглядає непристойно просто:
Тема: Re: Книжки Google
Автор: yurchor від 2010-04-26 22:21:53
Дії:
....
А я казав вимкнути жабоскрипт? А ви не послухали.
Угу, не послухав і не дарма. У вказаний вами спосіб можна добратися до кінця першої глави. А далі — дзуськи! А мені потрібна друга глава, а саме її кінець. Але все одно спасибі.
Тема: Re: Книжки Google
Автор: yurchor від 2010-04-26 22:24:28
Подужайте таки правовірний Фаєрфокс (йа Шабнігуррат!). Бо для нього рецепт у стилі LORу виглядає непристойно просто:
  • переглядаючи книжку у гуглів, натрапляємо на цікаву сторінку,
  • тиснемо Ctrl+I,
  • переходимо у вкладку "Мультимедіа",
  • вибираємо потрібне зображення зі списку,
  • зберігаємо,
  • ...
  • PROFIT!!!
О! Дякую. Те, що треба.
Тема: Re: Книжки Google
Автор: yurchor від 2010-04-26 22:28:55
А взагалі, дурню спитав. Треба було просто полазити у кеші Squid. ;)
Тема: Re: Книжки Google
Автор: piktor від 2010-04-26 22:33:27
В даній вами книзі доступного всього-то 30 сторінок, все інше не показує і з жабоскриптом і без нього.
Edit:
Ага, вони дають подивитися 30 будь-яких сторінок і все.
Тема: Re: Книжки Google
Автор: yurchor від 2010-04-26 22:36:47
В даній вами книзі доступного всього-то 30 сторінок, все інше не показує і з жабоскриптом і без нього.
Ви не повірите... Тільки-но видобув потрібні сторінки. Достатньо просто терти куки. ;)
Тема: Re: Книжки Google
Автор: piktor від 2010-04-26 22:38:44
Ви не повірите... Тільки-но видобув потрібні сторінки. Достатньо просто терти куки. ;)
Пробував, не дало за тридцяту ніякі. Хоча, я там залогінений на ЙаГуглі наразі.
Тема: Re: Книжки Google
Автор: Campana від 2010-04-26 22:43:57
Хоча, я там залогінений на ЙаГуглі наразі.
...і тому Старший Брат усе бачить.
Тема: Re: Книжки Google
Автор: noddeat від 2010-04-26 22:46:28
Подужайте таки правовірний Фаєрфокс (йа Шабнігуррат!). Бо для нього рецепт у стилі LORу виглядає непристойно просто:
  • переглядаючи книжку у гуглів, натрапляємо на цікаву сторінку,
  • тиснемо Ctrl+I,
  • переходимо у вкладку "Мультимедіа",
  • вибираємо потрібне зображення зі списку,
  • зберігаємо,
  • ...
  • PROFIT!!!
хм... православно, справді.
Тема: Re: Книжки Google
Автор: Djalin від 2010-05-18 10:44:17
Подужайте таки правовірний Фаєрфокс (йа Шабнігуррат!). Бо для нього рецепт у стилі LORу виглядає непристойно просто:
  • переглядаючи книжку у гуглів, натрапляємо на цікаву сторінку,
  • тиснемо Ctrl+I,
  • переходимо у вкладку "Мультимедіа",
  • вибираємо потрібне зображення зі списку,
  • зберігаємо,
  • ...
  • PROFIT!!!
у
SeaMonkey
теж працює щойно перевірив
Тема: Re: Книжки Google
Автор: Campana від 2010-05-18 20:29:26
у
SeaMonkey
теж працює щойно перевірив
Було б дивно, якби відгалудження і сторонні збірки Мозілли втрачали щось у функціоналі.