喜马拉雅 PC端文章详情页顶部23-26

百度发布“百度大脑3.0”,业内首提“多模态深度语义理解” | 钛快讯

“多模态深度语义理解”是指对文字、声音、图片、视频等多模态的数据和信息进行深层次多维度的语义理解,包括数据语义、知识语义、视觉语义、语音语义一体化和自然语言语义等多方面的语义理解技术。

钛媒体快讯 | 7月4日消息:Baidu Create 2018 AI开发者大会现场,百度创始人、董事长兼CEO李彦宏播放了一段电话录音,一位即将参加开发者大会的嘉宾与百度AI客服进行了几轮对话之后,提出了这样的问题。随后答案揭晓,录音中的这位客服并不是人,而是AI。

被误认为真人的AI客服是今年百度展示的AI能力之一,它的背后是百度大脑的自然语言理解和语音识别与合成技术。会上,百度大脑3.0发布。“百度大脑3.0的核心是‘多模态深度语义理解’”,百度高级副总裁、AI技术平台体系总负责人王海峰表示,“百度大脑3.0已经对外开放了110多项领先的AI能力。

“百度从成立的那一天起,就开始了人工智能技术的研发与应用,”王海峰表示,8年前,基于多年的技术积累,百度开始全面布局AI,并在2016年9月正式发布“百度大脑”。

如今,百度大脑的能力不断提升,从1.0进阶到3.0。王海峰介绍,百度大脑1.0完成基础能力搭建和核心技术初步开放,2.0形成了完整的技术体系,开放60多项AI核心能力,3.0的核心是“多模态深度语义理解”,同时开放110多项AI能力。

“多模态深度语义理解”是指对文字、声音、图片、视频等多模态的数据和信息进行深层次多维度的语义理解,包括数据语义、知识语义、视觉语义、语音语义一体化和自然语言语义等多方面的语义理解技术。王海峰表示,“多模态深度语义理解不仅能让机器听清、看清,更能深入理解它背后的含义,深度地理解真实世界,进而更好地支撑各种应用。”

王海峰介绍,数据语义化技术可以将大千世界中多元、异构和多模态的三元空间大数据,形成包含千亿节点、万亿关系的庞大数据语义网络,从中总结规律、提炼知识、发现价值,助力经济和社会发展。

比如在新能源充电桩智能运维中,结合百度的大数据、深度学习等技术进行设备监测、故障诊断等,可以显著提升效率,节约成本。而多元语义知识方面,百度已经构建了包含数亿实体、数千亿级事实的庞大知识图谱。

除了基础的由实体、属性、关系构成的实体图谱,百度还针对不同的应用场景和知识形态,构建了关注点图谱、事件图谱、多媒体图谱、行业知识图谱等多种图谱。所有这些知识,构成了百度大脑的基础。

视觉语义化可以让机器从看清到看懂视频,并提炼出结构化语义知识。视觉语义化技术应用于世界杯视频解析,能够全面识别视频中的球员、裁判、球、以及球门、球场线等人、物和场景,可以捕捉射门、进球、角球、任意球、换人等事件。基于这些语义化知识,既可以完成机器人自动解说,也可以进行精彩片段集锦、以及各种数据统计分析等。

而在实际生活的超市购物场景中,百度的视觉语义化技术通过识别人物、动作、物品并关联时间序列,将数字化的视频转化为结构化的语义知识,既能实现顾客在无人超市购物的完整体验,还可以帮助商店经营者分析和优化商店经营。

语音语义一体化和自然语言理解技术能让机器准确识别并理解人说的话,实现更自然的人机对话。王海峰现场对着百度地图说出了一长串绕口令般的导航需求,百度地图语音智能助手完美识别并给出最佳路线,李彦宏开场播放的智能客服给参会者打电话的片段,其背后也是这些领先的AI技术在支撑。

王海峰介绍,百度高噪声环境Hand-free语音识别准确率已提升了10个百分点;语音语义一体化技术使得远场语音识别准确率提升了10个百分点;在语音合成方面,WaveNet+拼接的情感语音合成技术,使得流畅度和自然度也大幅提升。

王海峰以对话理解和阅读理解为例,为大家介绍了领先的百度自然语言理解技术。百度的对话理解技术已经积累多年,通过研发最新的深层注意力匹配模型,比已知的最好结果又提升了4.1%。在阅读理解技术上,百度大脑已经阅读了千亿量级的文章,相当于6万个中国国家图书馆的藏书,并由此积累了亿级实体、千亿事实的知识。

“通过持续获取和积累知识,百度大脑的理解能力不断升级,智能水平显著提升,进而能够更好地服务用户。”王海峰说到。

百度大脑3.0提出“多模态深度语义理解”,PaddlePaddle是其技术突破背后的基础。PaddlePaddle是百度完全自主研发的深度学习框架,是中国人自己的深度学习框架。王海峰正式公布PaddlePaddle3.0,包括完整的核心框架,以及AI Studio、AutoDL、EasyDL等可以让开发者平等便捷获取顶尖AI能力的平台。

王海峰介绍,PaddlePaddle3.0核心框架对服务器版本以及移动端版本进行了全面优化,可以适用于更广泛的开发需求。而三大平台的发布则让开发者可以更平等便捷地获取顶尖AI能力。

其中,AutoDL能更高效自动搜索神经网络结构,开发者无需特殊硬件设备可以快速得到高质量模型;EasyDL可以帮助开发者零算法基础训练业务定制模型,操作可视化,无需懂深度学习;AI studio具有云端集成、简单易用、运行高效和资源免费的特点,是集成“数据、算法、算力”的PaddlePaddle实训平台,一站式满足使用者学习、技术进阶、学术研究需求。

此外,百度大脑3.0首次将芯片纳入技术体系,它使百度大脑具备了更完备的软硬一体化能力,带动百度大脑算力爆发式增长。百度自主研发的中国第一款云端全功能AI芯片“昆仑”也在会上首次亮相。“昆仑”针对语音、自然语言处理、图像等进行了专门优化,在同等性能下成本降低10倍,同时具有很高的易用性。“AI芯片将与百度自主研发的PaddlePaddle深度学习框架深度结合,推动AI行业生态快速发展。”王海峰表示。

随着百度大脑持续不断地开放,让越来越多的行业和企业变得越来越智能。如今,百度大脑每天调用次数超过4千亿次,调用的人中既有AI工程师,也有零“AI”基础的初入门者,还有来自各行各业希望用AI创新业务、为业务转型升级的企业。

“授人以鱼不如授人以渔。我们研发最顶尖的AI技术,我们也致力于开放最顶尖的AI技术。”王海峰表示。截止目前,百度已对外开放110多项领先的AI场景化能力与解决方案,并通过开放EasyDL等定制化平台、软硬一体的AI能力,降低AI应用门槛,帮助开发者和企业应用AI实现业务创新与升级。(钛媒体编辑苏建勋综合整理)

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

快报

更多

07:15

必和必拓据称正在考虑对英美资源集团进行收购

07:12

Meta第一季度净利润飙升117%,股价却大跌超15%

07:02

美股收评:三大指数涨跌不一,特斯拉大涨超12%市值重返5000亿美元上方

2024-04-24 23:01

大商所、郑商所夜盘收盘,纯碱涨超3%

2024-04-24 22:58

卢卡申科当选为白俄罗斯第七届全国人民大会主席

2024-04-24 22:57

江西省气象台发布冰雹橙色预警信号

2024-04-24 22:54

中拉航天合作论坛通过《武汉宣言》

2024-04-24 22:47

现货铝价格刷新22个月新高,原料铝企业订单旺盛满负荷生产

2024-04-24 22:46

比特币回落至65000美元/枚下方,日内跌1.92%

2024-04-24 22:45

标普500指数转跌,纳斯达克100指数涨幅收窄至0.5%

2024-04-24 22:45

特斯拉股价一度飙升16%,分析师称业绩没有担心那么糟

2024-04-24 22:39

王厚琼新任前海开源基金副总经理

2024-04-24 22:38

美油、布油短线均走高0.5美元,现分别报83.17美元/桶和87.54美元/桶

2024-04-24 22:37

中信博:第一季度归母净利润1.54亿元,同比增长297.18%

2024-04-24 22:35

新东方美股盘中一度跌超18%,创2月份以来盘中新低,现跌超11%

2024-04-24 22:34

美国至4月19日当周EIA战略石油储备库存 79.3万桶,前值64.8万桶

2024-04-24 22:31

半导体板块继续走强:聪链集团涨超5%,恩智浦涨超4%

2024-04-24 22:24

驻日本使馆发言人就福岛第一核电站发生设备供电系统部分停止事故答记者问

2024-04-24 22:22

德州德城出台房地产新政,2024年一年级上学暂不做户籍要求

2024-04-24 22:18

美国国债10年期至30年期收益率持续攀升

扫描下载App