阿里通义百聆推出语音模型新版本

钛媒体App 12月15日消息,阿里通义宣布开源Fun-CosyVoice3-0.5B,该版本提供了zero-shot音色克隆能力,只需要提供一段3秒以上的参考音频,即可复刻其音色并合成新语音,并且支持本地部署和二次开发。此外,通义推出轻量化版本Fun-ASR-Nano模型,总参数量压缩到0.8B,推理成本更低,现已开源,支持本地部署与定制化微调。(广角观察)

本文内容仅供参考,不构成投资建议,请谨慎对待。

评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
投资日历
更多