midearth
发表于 2024-3-3 09:23
今天你提了吗
发表于 2024-3-3 09:36
飞书妙记
moyuzhijia
发表于 2024-3-3 09:38
有很多支持会议记录的工具
白左
发表于 2024-3-3 12:23
win8
发表于 2024-3-3 13:17
研究过,目前是能识别多说话人,但是不能完全识别
Gazzz
发表于 2024-3-3 14:30
免费的试一下IBM Watson和Google Cloud,之前试过还过得去
如果是针对汉语的可以试试讯飞和企鹅,不过企鹅的是商用的
一步到位做音频分离的我印象里现在还没有,不过既然你都提了基本都是轮流说话,没有重叠的情况下,ASR过后拿结果的时间段去调ffmpeg或者gstreamer去切不就好了
页:
[1]