怎么批量转存HTML文件
有上千个html格式的文件,里面是文字+图片的新闻,图片都是网络链接,我想完全转为本地的,我只会一个个打开右键另存为-网页-全部,请问有没有更快的方法这时候就需要python侠了
五年前的前端程序猿表示只会用casperjs 能不能把上千个HTML放到一个Linux的代理目录下面, 然后用httrack对代理目录爬一遍?
处男鉴黄师 发表于 2020-8-19 12:13
你可以整个当作图片存下来,chrome点开F12的开发者工具,ctr+shift+p输入capture full size screenshot
纳 ...
这个截图效果其实也不好……有更好的吗? 如果是在一个主域名下面,非私有,可以试试httrack 本帖最后由 系统杀手 于 2020-8-19 19:39 编辑
这时候没人提按键精灵直接录鼠标动作了么?
1.复制所有文件到一个目录
2.打开第一个文件
3.另存为网页并确定
4. 关闭浏览器
5. 删除第一个文件
动作2-5循环1000次就行了。 系统杀手 发表于 2020-8-19 19:38
这时候没人提按键精灵直接录鼠标动作了么?
1.复制所有文件到一个目录
图片请求时间不一致,会导致存下来时间不一致,键鼠脚本没办法同步 SingleFile 支持多标签保存为 html 的
为了稳定100一组搞10次 纯静态内容的话wget应该就可以了,wget有windows版。
有动态内容就看情况了,截图应该比较通用吧,可以用selenium之类的玩意来自动化截图,selenium支持好几种语言,哪个有基础就用哪个吧。
页:
[1]