Blob Img Batch Save

Posted by Afio on April 8, 2020

背景

近期浏览某网站 PDF 电子书时,想保存到本地日后随时翻阅。右键审查元素后发现是 blob二进制存储方式,正规途径应该是通过 JS 脚本依次处理为 blob url->blob->base64,无奈十年前 JS就已经从入门到放弃了。只好研究出以下傻瓜式自动保存方式。

工具准备

  • Chrome 浏览器
  • Copy All Urls 插件 ( 下载地址
  • 按键精灵
  • 任意文本编辑器

1、图片链接获取

打开相应电子书点击阅读按钮进入 PdfReader 阅读模式后,可一直向下滑动浏览完毕电子书(或直接打开按键精灵设置 Num↓ 按键循环 N 次)。

然后在 Chrome 浏览器下复制并打开 chrome://blob-internals/ 页面,下拉到最底部可以看到连续的全部的图片资源地址:blob:https://***********

2、链接格式处理

打开任意一个文本编辑器,将连续的图片资源地址复制进去,并将 blob 全部替换为 <br/>blob,然后将文件存为 .HTML 后缀格式。

之后点击文件或直接拖拽到 Chrome 浏览器后,就可以获取到分行的图片地址。

3、批量打开图片

上面获取到了分行的图片地址,全部复制后,在 Chrome 浏览器中点击 Copy All Urls 插件的 Paste 按钮后,稍等片刻插件会将每一个图片批量全部打开。

4、自动全部保存

打开按键精灵,可按下图参考配置自动化脚本。这个脚本的本质其实就是把人工的「右键图片,选择保存图片,然后关闭标签页」的自动化执行。

patch_save_screenshot

备注:

1. 在 PdfReader 阅读模式下阅读完电子书后,保持当前标签页打开状态且不动,以保持图片链接资源不过期;

2. 最后一步按键精灵自动保存脚本中涉及坐标的定位,请以当前浏览器窗口为准重新获取对应位置。另外若有额外安装 Clear Downloads 自动清理下载插件可先关闭掉,因为 Chrome 浏览器下下载提示条会影响窗口坐标,需保持浏览器主体固定不变动。

3. 该保存方式适合 PDF 每页均为扫描图片类 PDF;

4. 头图来自《吉金耀采—院藏历代铜器》P30 蟠龙龙盘;

5. 以上仅供学习交流,严禁用于商业用途,如有下载相应资源请自觉于下载后24小时内删除。如家里有矿,请直接沟通正版实体书。