百度CTO王海峰:语音能力日均调用量过100亿

【钛媒体瞬眼播报】钛媒体11月28日消息,百度大脑宣布语音能力引擎日均调用量已经超过100亿次,应用规模业界第一,为开发者提供了覆盖云、端、芯的全栈全场景语音开放能力,推动智能语音技术在各行业落地应用。

在当天举行的百度大脑语音能力引擎论坛上,百度大脑语音引擎全新发布和升级了14大产品内容,包括基于百度鸿鹄语音芯片的4款硬件模组、开发板及3大场景解决方案,升级了语音自训练平台、呼叫中心语音解决方案等。

现场,百度语音首席架构师贾磊正式提出基于复数CNN网络的语音增强和语音识别一体化端到端建模技术,该方法抛弃了数字信号处理学科和语音识别学科的各种先验假设,消除学科间壁垒,直接端到端进行一体化建模。相较于传统基于数字信号处理的麦克阵列算法, 错误率降低超过30%。目前该方法已经被集成到百度最新发布的百度鸿鹄芯片中。
 
针对智能硬件设备,百度大脑重磅发布基于百度鸿鹄语音芯片的4款硬件模组、开发板,以及智能家居、智能车载、智能IoT设备3大端到端软硬一体远场语音交互场景解决方案,具备交互效果优异、软硬一体快速应用、广泛兼容集成门槛低等优点。同时,在语音识别领域,全面升级短语音识别、实时语音识别能力,发布音频文件转写能力,升级可零代码提升业务术语识别率的语音自训练平台,以及呼叫中心语音解决方案;在语音合成方面,全新发布6个在线语音合成精品音库和5个离线语音合成精品音库。丰富的语音能力,助力智能硬件、互联网、呼叫中心等领域智能化升级。

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

55
查看更多资讯

猜你喜欢

评论(0

Oh! no

您是否确认要删除该条评论吗?

分享到微信朋友圈