找回密码
 立即注册
搜索
查看: 4577|回复: 21

[软件] 视频自动生成字幕现在什么软件效果最好?

[复制链接]
     
发表于 2024-2-23 19:43 | 显示全部楼层 |阅读模式
之前一直用的是剪映,已经基本上够用了,但是有时候还是不太准,而且就为了生成字幕开个剪映有点浪费,有没有识别效果更好的?

回复

使用道具 举报

     
发表于 2024-2-23 19:49 | 显示全部楼层
人脑+记事本
核对一遍
回复

使用道具 举报

     
发表于 2024-2-23 19:49 | 显示全部楼层
本帖最后由 noahhhh 于 2024-2-23 19:50 编辑

只有 whisper 了,不过我没折腾过不知道哪个壳好用,macOS 上看着挺多的(付费)
回复

使用道具 举报

     
发表于 2024-2-23 20:06 来自手机 | 显示全部楼层
whisper,直接用 openai 的 api,现在网上两块钱三块钱的官方 api key 够转换好几小时,自动生成 srt

显卡好的就上大号模型本地跑,否则还是建议在线
回复

使用道具 举报

     
 楼主| 发表于 2024-2-24 13:17 | 显示全部楼层
JetBrains 发表于 2024-2-23 20:06
whisper,直接用 openai 的 api,现在网上两块钱三块钱的官方 api key 够转换好几小时,自动生成 srt

显卡 ...

本地试了下whisper medium,感觉准确度还不如剪映
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-2-24 16:50 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-2-24 20:26 来自手机 | 显示全部楼层
现在就是剪映识别最好用,特别是时间轴
回复

使用道具 举报

     
发表于 2024-2-25 03:05 来自手机 | 显示全部楼层
出字幕剪映已经最优选择了。whisper开销大暂且不说,最佳效果也就和剪映半斤八两,甚至还会蹦繁体字出来
回复

使用道具 举报

     
 楼主| 发表于 2024-2-26 01:17 | 显示全部楼层
win8 发表于 2024-2-25 03:05
出字幕剪映已经最优选择了。whisper开销大暂且不说,最佳效果也就和剪映半斤八两,甚至还会蹦繁体字出来 ...

剪映这么强的吗,之前还以为会有专门的识别软件能效果好一些
回复

使用道具 举报

     
发表于 2024-2-26 09:11 | 显示全部楼层
剪映跑一遍,自己简单校对一遍,也没什么麻烦的吧,你去折腾其他的不也是还要自己校对吗
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-2-26 09:58 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-2-26 10:19 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-2-26 10:41 | 显示全部楼层
whisper还真不如剪映
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-2-26 10:44 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-2-26 10:46 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-2-26 10:50 | 显示全部楼层

外语直接上whisper呗,whisper可以识别的语言比剪映更多,而且whisper是纯本地的
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-2-26 11:38 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-2-26 11:45 | 显示全部楼层
酷乐 发表于 2024-2-26 11:38
试了一下,medium识别效果真的不如capcut啊,large又太花时间了……

不过有个怪事是,选英语不勾翻译,输 ...

不用官方,可以用whisper.cpp上GPU加速
https://github.com/ggerganov/whisper.cpp

Windows上还有个whisper.cpp的GUI
https://github.com/Const-me/Whisper

评分

参与人数 1战斗力 +2 收起 理由
酷乐 + 2 谢谢

查看全部评分

回复

使用道具 举报

     
发表于 2024-2-26 13:32 | 显示全部楼层
whisper要试怎么也得用large吧,medium也就英语还行,汉语、日语large和medium差距很大。
至于速度,有whisper faster项目,直接快了好几倍,内存也减少到6G左右。
回复

使用道具 举报

     
 楼主| 发表于 2024-2-26 23:22 | 显示全部楼层
echoIII 发表于 2024-2-26 13:32
whisper要试怎么也得用large吧,medium也就英语还行,汉语、日语large和medium差距很大。
至于速度,有whis ...

faster是会降低精度吗,感觉faster的large v3还不如普通的medium
回复

使用道具 举报

     
发表于 2024-2-27 10:11 | 显示全部楼层
本帖最后由 echoIII 于 2024-2-27 10:12 编辑
ArtemisI 发表于 2024-2-26 23:22
faster是会降低精度吗,感觉faster的large v3还不如普通的medium

不会降精度,不过有反映说v3相比v2会增大hallucination。
另外我没怎么处理过汉语,不知道与剪映相比如何。英语的话,目前没有比Whisper更好的。汉语语音比较简单,准确识别出音来各个软件应该都能做到,主要差距在于多音字识别上,可能Whisper不具备优势。
回复

使用道具 举报

     
 楼主| 发表于 2024-3-3 02:24 | 显示全部楼层
发现whisper有个问题是他句子之间的空白如果不是特别长的话两句话就会直接连在一起,导致字幕会提前出现或者延后消失
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2024-11-27 14:27 , Processed in 0.140144 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表