2024CTIS-文章详情页顶部

AI技术突破音频内容生产瓶颈,文字时代加速转向声音时代

个性化语音定制系统大幅度提高了存量内容的转化效率,有利于优质内容的高效生产、再生产以及声音知识的优化和传播。

图片来源@视觉中国

图片来源@视觉中国

2018年2月,中读的会员卡分销一夜之间在朋友圈刷屏,一日之内售卖5.4万份,也让这个《三联生活周刊》(以下简称《三联》)推出的知识平台第一次为大众所熟知。

然而,当知识分销后来被微信紧急叫停,一次性打包售卖10年杂志电子版的“大甩卖”,注定要回归到细水长流的知识付费。

传统媒体转型的最大痛点:文字内容“产品化”

虽然中读也曾经找过朗郎这样的明星IP来合作头部内容,但并不顺利。因为与得到、喜马拉雅这样的头部内容平台相比,20多年下来积累的优质内容及读者群体,才是中读相比其他平台最大的优势。

然而,把这些文字内容专为化知识付费产品,却注定要经历一个“内容产品化”的过程。10年电子版会员卡这种简单粗暴的方式,也要让位于更精细、更原生、更智能的产品设计。

“我们的文字内容是常态化生产的,但是音频内容没有达到这个目标,不管是小课还是专栏,都不能做大常态化生产。”中读创始人朱文轶曾经表示,让音频内容可以有规律性地持续生产是中读团队一直以来的追求,也是整个知识付费行业的“痛点”。

2018年,中信出版集团找到《三联》,将《我们为什么爱宋朝》、《宋朝那些人》两个“爆款”封面故事集结出版,这也是杂志将内容再次变现的传统方式。

然而,随着互联网碎片化内容获取变得愈发廉价与便捷,纸质书销量的连年下滑,对于杂志来说,“集结出版”这块原本脂肥膏厚的蛋糕优势不再。

“我们还可以做什么?”当中信出版的图书引发了一定反响后,《三联》总经理李鸿谷陷入了新的思考。

对于文字时代的“视觉超载”,他进行了深入的思考:

古登堡发明印刷机的时间是1439年,有个统计是,此后的1453到1503年,欧洲的印刷文本共800万册,等于之前欧洲全部手抄本的文字量。

而如今,随着信息进入互联网深度传播时代,全球每年创造的信息量更是不计其数。《三联》的执行主编每日至少要通过pad或手机、电脑读5万字的文本,这些容易产生视觉疲劳和“视觉超载”。

AI音频技术,突破了声音内容的生产瓶颈

鉴于此,《三联》开始考虑扩大此前于2017年开始试水的音频课程,将宋朝故事发展成了音频内容《我们为什么爱宋朝——宋朝美学十讲》。继按专栏集结成书之后,存量内容又有了更易消费和传播的呈现方式。

只是接下来,在大规模“文字音频化”的过程中,原作者的时间成本与专业声优的制作成本,成为了其盘活亿级内容资源的瓶颈。

在中读开设音频节目的《三联》资深主笔袁越,谈到了自己录制时的使用感受:

我花15年写了80多万字的《生命八卦》专栏文章。如果在录音棚里把它们一遍又一遍朗读出来,会累死。如果用普通音频软件来读,又很容易读成催眠曲。

随着AI语音技术的持续发展,中读终于找到了音频内容常态化生产的“最优解”。

8月21日至8月25日,北京国际图书博览会(BIBF)期间,中读举办了以“声音里的知识和AI”为主题的知识大会。在大会上,中读介绍了自己谋求转型的新经验,在2017年年入局付费音频领域后,又发布了首个AI语音定制专栏。

为此,《三联》采用的新方式,是携手微软,将个性化语音定制技术运用到有声内容生产中,AI音频在经过训练后被赋予文章原作者的声音,让听众感觉到“如闻其声”。

传统的有声内容主要依靠名人、主讲人或者声优亲自上阵录制,往往需要耗时几个月,成本巨大。声音录制也受限于人员、时间、环境等因素,无法实现产能最大化,求知者接收优质内容的时间也会随之延迟。

个性化语音定制系统则彻底突破了生产瓶颈,只需少量训练数据量就可以训练出一个逼真自然的人工智能声音,大幅度提高了存量内容的转化效率,有利于优质内容的高效生产、再生产以及声音知识的优化和传播。

文字内容的音频化也不仅是一个文字转换为声音的过程,更是与用户关系的进一步拉近,毕竟性格各异的声音比千字一面的文字更有亲切感,更容易打造作者的独特人设。

不仅如此,相比于文字内容结集出版,音频课程的规模化生产可以更自由、灵活地对文字内容进行结构化梳理,无论是大课、小课都可以灵活定制。除了亿级的存量内容,《三联》每期15—20万字的内容将成为源源不断的内容库。文字内容与音频课程的同步、互动,也将激发出更大的想象空间,可以称得上是内容领域的O2O。

破壁语种障碍,多语言音频内容助力文化出海

AI技术也使“生产出形式多样的衍生内容产品”成为可能。“让课程主讲人开口说他不会说的语言,从英语、法语甚至是当地方言,实现多语种及多种说话风格的输出”是中读进行的另一项大胆尝试。

本次大会上,中读除了展示首个AI音频产品《土摩托·生命八卦》外,还展示了最新推出的《宋朝美学十讲》的英文版本。

当《三联》与中读的高知用户走向海外,常常会遇到向外国人传递中国传统文化的反向需求。此时,AI技术便可生成有一定语调和节奏感的他国语言版中国故事,便于拥有对外汉语传播交流需求的人群向外输出。

不仅如此,这种中英文内容的切换,对在国内生活的海外留学生和专家学者来说,也拓展了学习汉语和汉文化的途径和内容。

在“中读”《土摩托·生命八卦》知识音频栏目下,钛媒体发现,有受众指出了音频仍像“机读”、断句和读音错误等技术bug。诚然,当AI音频初推之际,技术的不足会影响用户体验;不过,技术会随着发展而进步,AI音频普及之后可能带来的知识产业变革,却是不容忽视的行业新风向。

在AI语音技术的加持之下,能够转换语种的合成音频产品,对于《三联》来说,不但盘活了存量内容资源、拓展了用户的碎片化使用场景,还破壁了语言限制、将用户肖像扩大到了截然不同的新群体中。

同时,AI音频的普及,还使原本生产一次性内容的文字工作者变成了IP供应商,极速提升了产品二次变现的效率,可以很大程度地改善传统写作者的生存状态。

本文系作者 陶淘 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

快报

更多

2024-05-25 22:54

国家数据局副局长夏冰:目前正在研究设立数字经济专业本科生教学指导委员会

2024-05-25 22:33

瑞士宝盛集团和EFG就收购展开的谈判据悉已停止

2024-05-25 22:26

端午假期首日火车票今日开售,部分城市间中短途出行需求旺盛

2024-05-25 22:13

Meta据悉与Character.ai就合作进行讨论

2024-05-25 21:51

神剑股份:偏苯三酸酐(TMA)涨价目前对业绩影响较小

2024-05-25 21:46

津巴布韦总统批准发放星链服务许可证

2024-05-25 21:36

吉普和Ram经销商据悉向Stellantis抱怨汽车滞销

2024-05-25 21:05

日本央行行长植田和男:不会对日本长期利率的日常波动发表评论

2024-05-25 20:45

人社部公示29个新工种

2024-05-25 20:07

李泽钜回应频频打折卖楼

2024-05-25 20:03

5月25日新闻联播速览20条

2024-05-25 19:28

国家医保局:支持将符合条件的村卫生室纳入医保定点

2024-05-25 19:28

6月1日起,在沈阳租房、务工、就学等即可落户

2024-05-25 19:27

美国财长耶伦:不希望经通胀调整后的利息支付与GDP之比超过2%

2024-05-25 19:13

深圳:在广东转让本人名下车辆并在深圳新购新能源车或符合国六排放标准的燃油车,给予补贴最高8000元

2024-05-25 18:57

江西赣州一公交车冲下负一层露天平台,致9人受伤

2024-05-25 18:51

水利部:南方地区将有一次强降雨过程

2024-05-25 18:51

美股结算T+1即将启动

2024-05-25 18:32

中国和尼泊尔传统边贸点恢复开放

2024-05-25 18:21

中央网信办龙凯:将推进互联网、大数据、人工智能、5G等新兴技术与绿色低碳产业深度融合

扫描下载App