喜马拉雅 PC端文章详情页顶部23-26

语音识别是移动互联网的下个入口

随着可穿戴设备的火热,可穿戴设备的输入也成为一个问题。智能手表和眼镜使用额外的S-pen一类的辅助工具也并不现实,在当前的条件下看,只有靠语音输入来挑大梁了,但语音输入的实现需要很复杂的技术能力。

这几天,可穿戴设备突然一下热起来了,国内厂商一口气发布了好几款智能手表,有映趣科技的inWatch,土曼科技的TWatch、盛大果壳电子的GeakWatch等,当然,最重头的还是三星在德国举行的发布会上,发布了智能手表Galexy Gear。

智能手表不是新发明的,有很多早就在市面上流行的产品,如索尼的SmatWatch等,就连做芯片的高通也发布了一款智能手表。大家早就看出,这里面是有前景的,是未来的一大趋势,只是如果巨头不出手,这个市场就很难被激活。

智能手表到底是用来做什么的?在当前技术条件下,还只能发短信,拍个照,记录笔记,充当健身辅助设备,在手机的支持下实现通话等,或许未来还可以在NFC的支持下完成近场支付等功能。智能手表的未来,一定不是满足用户的娱乐需求,而是着眼于普通人日常生活领域的诸多实际需求,这是由其自身特点所决定的。但我更关心的是,智能手表靠什么输入文字,传送信息。

智能手表屏幕较小,使用额外的S-pen一类的辅助工具也并不现实,在当前条件下看,唯有依靠语音输入了。语音输入看上去是个不大的基础应用,实现起来却需要非常复杂的技术能力,已经涉及到人工智能AI的范畴,而且这个技术已经进化了几十年,似乎还没得以大规模商用,可见其开发难度。

13年前我曾买过一张IBM的Viavoice光盘,装到电脑上后对着电脑练了一下午,希望其能快速熟悉我的个人口音,哪怕能有90%的识别率,也能为我繁重的文案工作减轻不少负担。这次试验最终还是失败了,却并不令人沮丧,至少领略了世界前沿的语音识别技术,理解到识别自然语言对于计算机而言有多么难了。在当时,Viavoice是世界最尖端的语音识别技术。

Gear中内置了三星自己的S-Voice,另外也和百度合作,将百度语音助手预装了进去。看来百度与三星的关系相当不一般,前有百度云,后有语音助手,对看重安卓更甚iOS的百度,支持力度相当大。不过,还是有理由相信,百度语音助手的技术实力已达到三星所期望的程度,预装其语音产品,可以给智能手表带来更好的用户体验。语音有可能是智能手表的唯一输入方式,在这方面无法做到准确,易用,快捷,是很难让用户买单的,会成为其发展瓶颈。

在周日的下午下载了百度语音助手,进行了一番测试。我发现,普通话方面的语音识别准确率,已经到了令人惊喜的地步。除了一些停顿和转折,机器在识别上仍有一定困难外,基础字词很少会出现错误,只要对自己的普通话有一定自信,基本都能做到99%以上的识别率。

普通话:这是一个新闻头条中的第一句话

之后我还对百度语音助手进行了上海话和英文的测试,发现效果并不理想,用上海话说了一串上海市井小吃的名字,基本无法识别,但在将上海的区县名称挨个念出来后,发现还是有一定的识别率。至于英文,则是基本无法识别。看来,这一版语音助手,仍是以普通话识别为基础的,还没有考虑到更多需求。

英文:To be ornot to be,that is a question

上海话:黄浦区、杨浦区、普陀区、静安区、长宁区、闵行区

上海话:白斩鸡、生煎馒头、素材包、酒酿圆子、红烧烤麸、阳春面、大排面

我不知道这是否代表中文普通话语音识别的最高水平了,其他一些语音识别工具,如搜狗和科大讯飞等产品,是不是也能做到差不多的识别效果。这一次的测试,与13年前的那次从感觉上完全不一样。Viavoice是一种学习型的语音识别软件,你需要适时地对识别结果进行调整,以方便机器下一次识别,积累下来的识别数据要妥善保护,要是因为一次重装系统而导致丢失的话,一切都得重来。从商用角度来看,这还做不到多好的商用体验,而如今的语音识别技术,从体验上明显已能让人看到曙光。

甚至可以认为,只有在语音识别技术取得革命性突破之后,可穿戴设备真正的爆发之日才会到来。设想你可以与智能手表和眼镜实现人机对话,戴着眼镜时不必再傻傻地说句OK

Glass才能开启摄像,只需用生活中最自然的语言即可完成指令发送,之后再由机器将任务完成情况用语音反馈给你,到那时,屏幕的作用将弱化,移动互联网的新入口将诞生。

过去一年,百度在硅谷建立了IDL实验室,进行深度学习方面的研究,在利用软硬件模拟人脑方面试图获得更多成果。而这些工作,在过去印象中总是由IBM,贝尔实验室等大机构所做的,出了能商用的成果,大家去买授权好了,像百度这样的广告公司也来搞这个,着实令人感慨万分。

不过,这些耗费甚巨却见不到短期产出的基础研究项目,使得百度在语音识别技术方面有了相当不错的进步,还没有达到商用化的地步,最起码也已可以进行积极布局,积累用户了。

未来随着手持设备的小型化,甚至穿戴化,各种智能眼镜,手表等层出不穷,谁能在语音输入方面取得领先优势,谁就能掌握了用户的一个基础需求,谁也就能在这个由鼠标键盘、触屏和语音所组成的互联网世界里,占据一个重要入口。

 

【第一时间了解互联网最新观点,请打开微信点击-朋友们--添加朋友--搜号码输入Gejia021,或用微信扫描下方二维码】

本文系作者 葛甲 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持

喜马拉雅文章页评论上方

发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
  • 竟然称百度为广告公司,口气忑大了吧

    回复 2013.09.11 · via pc

快报

更多

2024-04-25 23:02

大商所、郑商所夜盘收盘,棉纱跌超1%

2024-04-25 22:58

市场消息:马斯克将于下周一接受传讯,参与推特此前的裁员和解谈判一案

2024-04-25 22:55

transcosmos集团基于AIGC大模型构建全网舆情监控体系

2024-04-25 22:54

宋城演艺:一季度净利润2.52亿元,同比增长317.33%

2024-04-25 22:51

“美国头号房企”铁狮门正式进军上海高端长租公寓市场

2024-04-25 22:46

《上古世纪:战争》即将进军全球游戏市场

2024-04-25 22:44

本田汽车将在加拿大修建110亿美元规模的电动汽车中心

2024-04-25 22:37

字节跳动:没有任何出售TikTok的计划

2024-04-25 22:37

韩国SK Networks设立人工智能实验室PhnyX Lab

2024-04-25 22:36

现货黄金短线走高8美元,现报2331.5美元/盎司

2024-04-25 22:35

中钢协姜维:当前钢企库存处于历史同期高位,尽快降库存是行业保效益的首要任务

2024-04-25 22:32

美国至4月19日当周EIA天然气库存增加920亿立方英尺

2024-04-25 22:30

三一集团参与新西兰普伦蒂湾的道路建设项目

2024-04-25 22:28

敷尔佳:一季度净利润1.52亿元,同比下降4.77%

2024-04-25 22:27

美股内地教育概念股普涨,新东方、好未来涨超4%

2024-04-25 22:20

美国3月成屋签约销售指数环比增长3.4%,预期0.8%

2024-04-25 22:19

惠而浦跌9%,第一季度净销售额、经调整每股盈利均下滑

2024-04-25 22:18

传祺华为合作官宣落地,2025发布全新车型

2024-04-25 22:13

深圳:大力培育发展新质生产力,强化科技创新和产业创新深度融合

2024-04-25 22:12

IBM一度跌近10%,第一季度咨询业务表现疲软

1

扫描下载App