半肾
精华
|
战斗力 鹅
|
回帖 0
注册时间 2014-11-27
|
本帖最后由 诚司 于 2024-7-16 19:50 编辑
AI跑出来结果了,小老师CV应该是没有换,向量匹配分数是0.6左右,阿里的示例分数是0.67,阈值一般会是0.3左右
模型用的阿里的CAM++
CAM++说话人确认-中文-通用-200k-Spkrs · 模型库 (modelscope.cn)
- from modelscope.pipelines import pipeline
- sv_pipeline = pipeline(
- task='speaker-verification',
- model='damo/speech_campplus_sv_zh-cn_16k-common',
- model_revision='v1.0.0'
- )
- #speaker1_a_wav = 'https://modelscope.cn/api/v1/models/damo/speech_campplus_sv_zh-cn_16k-common/repo?Revision=master&FilePath=examples/speaker1_a_cn_16k.wav'
- #speaker1_b_wav = 'https://modelscope.cn/api/v1/models/damo/speech_campplus_sv_zh-cn_16k-common/repo?Revision=master&FilePath=examples/speaker1_b_cn_16k.wav'
- #speaker2_a_wav = 'https://modelscope.cn/api/v1/models/damo/speech_campplus_sv_zh-cn_16k-common/repo?Revision=master&FilePath=examples/speaker2_a_cn_16k.wav'
- # 相同说话人语音
- #result = sv_pipeline([speaker1_a_wav, speaker1_b_wav])
- #print(result)
- ## 不同说话人语音
- #result = sv_pipeline([speaker1_a_wav, speaker2_a_wav])
- #print(result)
- #speaker1_a_wav = 'https://modelscope.cn/api/v1/models/damo/speech_campplus_sv_zh-cn_16k-common/repo?Revision=master&FilePath=examples/speaker1_a_cn_16k.wav'
- #speaker1_b_wav = 'https://modelscope.cn/api/v1/models/damo/speech_campplus_sv_zh-cn_16k-common/repo?Revision=master&FilePath=examples/speaker1_b_cn_16k.wav'
- wav1 = '/home/cam/output_1.wav'
- wav2 = '/home/cam/output_2.wav'
- result = sv_pipeline([wav1, wav2])
- print(result)
复制代码 语音用的【Project Snow】嗨~分析员,快看芙提雅为你准备了什么( ✿>◡❛) (bilibili.com)
还有麻辣相伴 | 芙提雅篇:丢失的筷子 (bilibili.com)
分别截取了5到9秒左右的语音
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
评分
-
查看全部评分
|