第一时间get全球最新科技知识与数据
下载钛媒体客户端

扫描下载App

百度地图推出语音定制功能,可以生成个人语音包 | 钛快讯

摘要: 语音定制功能推出后,用户只需要在手机录制20句话,经过20分钟左右的制作,就可以生成个人完整语音包。

图片来源@视觉中国

图片来源@视觉中国

钛媒体快讯 | 9月19日消息:百度地图事业部总经理李莹今日宣布,百度推出行业首个地图语音定制功能。据李莹介绍,语音定制功能推出后,用户只需要在手机录制20句话,经过20分钟左右的制作,就可以生成个人完整语音包。

如图,用户可从百度地图首页进入语音定制页面,可选择性别,还可以录制童声。录制的文本方面,用户也可以选择系统推荐文本,卡通文本和电影台词。特别是录制童声时,百度为低龄儿童设置了语句更短、可重复的儿童语句。录制完的语音包可以自己使用,也可通过微信或者百度地图分享给他人使用。

百度地图语音定制模块图示

百度地图语音定制模块图示

据悉,用户定制的语音包使用场景比较广泛,在手机地图的任何场景中都可使用,比如景区智能语音导览、智能语音交互等全部场景使用。用户可免费使用自己或家人的语音包在景区游览。

李莹也特别强调,在整个流程中百度地图遵循了业界最标准、最成熟的安全规范,采取了非常安全的保护措施,会最大程度的保障每个用户的安全隐私。“百度地图对于语音定制服务的权限获取将仅用作语音包录制,不做他用。百度地图未经用户的授权同意,不会将用户的语音包共享给任何人。”

李莹在演讲中介绍道,如果做一个通用大库的语音包,大概需要录制的语音量是上万句,制作周期近半年。如果做个人定制的,如某一个明星的语音包,需要在大库基础之上录制1000到2000句语音,要在专业的录音棚里面录制大概两周时间,而真正把这个语音包用语音技术生成出来需要两个月的时间。

新的语音定制功能大大缩减了此前语音录制的成本。百度语音首席架构师贾磊介绍了语音定制功能背后的技术:

“百度地图语音定制功能基于百度独创的说话人韵律迁移技术Meitron,其特点主要体现在发音人音色转换,多情感朗读和韵律风格迁移三个方面,从而让个性化语音合成的定制门槛大大降低。”

云端深度学习语音合成技术可形成不同风格的声音

云端深度学习语音合成技术可形成不同风格的声音

贾磊介绍道,以前语音合成大多数都是新闻播音腔,而现在百度的语音合成可以有多重风格和声线。在现场原声与合成声音的比对测试中,两种声音几乎分辨不出差别。

当前,在数据生产方面,百度地图80%数据采集环节已实现AI化,拥有3000万的POI空间图谱、700万的用户兴趣图谱,共同组成了百度地图POI高精知识图谱。

(本文首发钛媒体,作者/芦依)

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

本文系钛媒体原创,未经授权不得使用,如需获取转载授权,请点击这里
分享到:

第一时间获取TMT行业新鲜资讯和深度商业分析,请在微信公众账号中搜索「钛媒体」或者「taimeiti」,或用手机扫描左方二维码,即可获得钛媒体每日精华内容推送和最优搜索体验,并参与编辑活动。

芦依
芦依

关注内容产业、创投科技、出海;有意者请加微信lotusLUYI,交流请注明事由。

评论(3

  • hJVKgN hJVKgN
    回复
    1

    又出新主意了!

    2019-09-19 23:05 via android
  • 芦依 芦依   回复  陶淘
    回复
    0

    和真人声音傻傻分不清楚😈

    2019-09-24 18:31 via android
    • 陶淘 哇!听起来好有趣(✪▽✪),不知道会不会机械
      2019-09-24 17:45 via android
      回复
      0
  • 陶淘 陶淘
    回复
    0

    哇!听起来好有趣(✪▽✪),不知道会不会机械

    2019-09-24 17:45 via android

Oh! no

您是否确认要删除该条评论吗?

分享到微信朋友圈