lzrtwilight 发表于 2020-8-19 12:04

怎么批量转存HTML文件

有上千个html格式的文件,里面是文字+图片的新闻,图片都是网络链接,我想完全转为本地的,我只会一个个打开右键另存为-网页-全部,请问有没有更快的方法

董卓 发表于 2020-8-19 12:08

这时候就需要python侠了

五年前的前端程序猿表示只会用casperjs

处男鉴黄师 发表于 2020-8-19 12:13

冰箱研会长 发表于 2020-8-19 12:19

能不能把上千个HTML放到一个Linux的代理目录下面, 然后用httrack对代理目录爬一遍?

有口皆悲 发表于 2020-8-19 12:22

TheDoctor 发表于 2020-8-19 12:34

处男鉴黄师 发表于 2020-8-19 12:13
你可以整个当作图片存下来,chrome点开F12的开发者工具,ctr+shift+p输入capture full size screenshot
纳 ...

这个截图效果其实也不好……有更好的吗?

zoJL 发表于 2020-8-19 13:00

如果是在一个主域名下面,非私有,可以试试httrack

系统杀手 发表于 2020-8-19 19:38

本帖最后由 系统杀手 于 2020-8-19 19:39 编辑

这时候没人提按键精灵直接录鼠标动作了么?

1.复制所有文件到一个目录
2.打开第一个文件
3.另存为网页并确定
4. 关闭浏览器
5. 删除第一个文件

动作2-5循环1000次就行了。

宅男的爱 发表于 2020-8-19 19:50

系统杀手 发表于 2020-8-19 19:38
这时候没人提按键精灵直接录鼠标动作了么?

1.复制所有文件到一个目录


图片请求时间不一致,会导致存下来时间不一致,键鼠脚本没办法同步

ekdc11 发表于 2020-8-19 20:10

SingleFile 支持多标签保存为 html 的
为了稳定100一组搞10次

糊状物 发表于 2020-8-19 20:14

纯静态内容的话wget应该就可以了,wget有windows版。
有动态内容就看情况了,截图应该比较通用吧,可以用selenium之类的玩意来自动化截图,selenium支持好几种语言,哪个有基础就用哪个吧。
页: [1]
查看完整版本: 怎么批量转存HTML文件