找回密码
 立即注册
搜索
查看: 1150|回复: 10

[其他] 怎么批量转存HTML文件

[复制链接]
     
发表于 2020-8-19 12:04 | 显示全部楼层 |阅读模式
有上千个html格式的文件,里面是文字+图片的新闻,图片都是网络链接,我想完全转为本地的,我只会一个个打开右键另存为-网页-全部,请问有没有更快的方法
回复

使用道具 举报

     
发表于 2020-8-19 12:08 | 显示全部楼层
这时候就需要python侠了

五年前的前端程序猿表示只会用casperjs
回复

使用道具 举报

头像被屏蔽
     
发表于 2020-8-19 12:13 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2020-8-19 12:19 | 显示全部楼层
能不能把上千个HTML放到一个Linux的代理目录下面, 然后用httrack对代理目录爬一遍?
回复

使用道具 举报

头像被屏蔽
     
发表于 2020-8-19 12:22 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2020-8-19 12:34 来自手机 | 显示全部楼层
处男鉴黄师 发表于 2020-8-19 12:13
你可以整个当作图片存下来,chrome点开F12的开发者工具,ctr+shift+p输入capture full size screenshot
纳 ...

这个截图效果其实也不好……有更好的吗?
回复

使用道具 举报

     
发表于 2020-8-19 13:00 | 显示全部楼层
如果是在一个主域名下面,非私有,可以试试httrack
回复

使用道具 举报

     
发表于 2020-8-19 19:38 | 显示全部楼层
本帖最后由 系统杀手 于 2020-8-19 19:39 编辑

这时候没人提按键精灵直接录鼠标动作了么?

1.复制所有文件到一个目录
2.打开第一个文件
3.另存为网页并确定
4. 关闭浏览器
5. 删除第一个文件

动作2-5循环1000次就行了。
回复

使用道具 举报

     
发表于 2020-8-19 19:50 | 显示全部楼层
系统杀手 发表于 2020-8-19 19:38
这时候没人提按键精灵直接录鼠标动作了么?

1.复制所有文件到一个目录

图片请求时间不一致,会导致存下来时间不一致,键鼠脚本没办法同步
回复

使用道具 举报

发表于 2020-8-19 20:10 | 显示全部楼层
SingleFile 支持多标签保存为 html 的
为了稳定100一组搞10次
回复

使用道具 举报

     
发表于 2020-8-19 20:14 | 显示全部楼层
纯静态内容的话wget应该就可以了,wget有windows版。
有动态内容就看情况了,截图应该比较通用吧,可以用selenium之类的玩意来自动化截图,selenium支持好几种语言,哪个有基础就用哪个吧。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2024-11-14 22:50 , Processed in 0.026082 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表