Watson 五年简史:它为何成为 IBM 抢占未来的重要据点?

摘要: Watson 在医疗行业的缓慢成长无法满足人们对于人工智能给人类健康带来巨大提升的期望。事实上,医疗领域的人工智能几乎与个人计算机一起出现在上世纪的 70 年代,但现在来看,所谓人工智能驱动的个性化治疗,还有很长一段路要走。

2012 年,IBM 的人工智能软件 Watson 正处在名声最显赫的时期。正是在前一年,Watson 一举击败两位人类选手,获得智力挑战赛 Jeopardy 的冠军,比赛中,Watson 展示超强的自然语言处理能力,令人惊叹。借助这个节目的流行,Watson 俨然成为当时人工智能的代言人。

2012 年 11 月,IBM 为Watson 找来一个小伙伴,成立于上世纪 20年代 的克利夫兰诊所将帮助 Watson 接受医疗方面的「训练」。通过大量医疗数据的训练,Watson 可以做出大量「医疗假设」,IBM和医疗诊所希望 Watson 帮助临床医生和医学院的学生更精确地诊断,并且提供更好的医疗方案。彼时,科技媒体 Singularity 以「话务员医生 Watson」形容 Watson 的新 Title 。

从底层技术上来说,Watson 从一开始到现在都是由 DeepQA 驱动。简而言之,DeepQA 是一套集分析、推理与提供答案的复杂软件架构,这套架构能够读取数百万文本数据,再通过自然语言处理技术产生答案,最后根据问题的情景作出回答。正是这套架构支撑了 Watson的发展。2012年的时候,Watson 可以在每秒钟完成 80亿次计算

当时,根据彭博社的报道称,IBM 曾计划将 Watson 变成商业领域的「超级 Siri」,而最终的呈现形式则是搭配 IBM 的硬件产品,换句话说,IBM 当时还在希望以 Watson 促进自己的硬件生意。不过,故事发展到现在,IBM 最终放弃了这个计划,并把 Watson 改造成认知商业计算平台。

尽管 IBM 并未借助 Watson 卖出更多硬件,但 Watson 的形状还是发生了很大的变化:从一个有 10 台冰箱那么大的「大块头」,变成四个披萨盒子大小的「小不点」。而且,用户也可以通过平板电脑、智能手机与 Watson 连接。相比于初代产品, 2012 年的 Watson 在性能上有 240% 的确提升,并且能够处理 28 种不同类型的数据,远远超过上代的 5 种。

2013 年,Watson 的 API 开源,现在则集成到了 IBM 的 Bluemix里,开发者可以通过这个平台,借助 Watson 的「技能」构建一系列人工智能的应用。

而对于 Watson 最重要的一步则是 2014 年,当时, IBM 投资 10 亿美金成立了 IBM Watson 业务集团,这家公司拥有超过 2000 名员工,将全面运作 Watson 的研究和商业化事宜。这也成为 Watson 快速成长的开始,并且帮助 IBM 将认知计算带入主流科技媒体的口头禅里。

时间很快到了 2016 年,Watson 在诸多领域有了自己的根据地,比如财务顾问、自动客服代表等等,然而我们还是有必要再去看看四年前 Watson 第一份职业——医生助理——到底干的如何?

现在,Watson 已经将医疗方面的工作交给了 Watson 健康部门。这从另一个侧面也展示出 Watson 自 2012 年以来在医疗领域的良好态势。2012 年以来,Watson 与克利夫兰诊所合作的进展并不多。直到 2014 年,克利夫兰诊所医疗创新峰会上,IBM 宣布肿瘤专家已经开始使用 Watson 去分析基因数据和医疗数据之间的关系,以更好的形成个性化的治疗方案。

去年五月,根据 BI 的一篇报道,Watson 很可能已经能够让肿瘤专家「上传肿瘤病人的 DNA 指纹图到系统里,Watson 根据这个数据,快速甄别出哪一个基因可能引发突变,从而确定针对这些可能突变的药物。」

另一个案例,东京大学的研究者利用 Watson 成功治愈了一个 60 岁的白血病患者,其做法就是将该病人的基因数据与数以万计的医疗文献做对比,形成针对该患者的定制医疗方案。另据 36kr 的报道,21家本土医院计划使用经由纪念斯隆-凯特琳癌症中心(Memorial Sloan Kettering Cancer Center)训练的IBM Watson肿瘤解决方案(IBM Watson for Oncology),帮助医生为病人提供更好的个性化肿瘤治疗方案。

尽管上述进展喜人,但在整个医疗行业,类似这样的做法还非常少。去年,iEEE 记者 Brandon Keim 在一篇文章里分析了几个原因,比如 Watson 需要适应医院特殊的工作环境,这要花费不少的时间去真对医疗环境下的特定任务和工作场景训练 Watson。

但这个训练过程非常漫长和艰苦。首先,要有一大批计算机科学家和医生、药剂师收集一个参考数据库,并加入病例学习,然后询问上千个问题。事实上,Watson 并不会自我学习,他给出的错误答案会被研究者们评估,再手动调整 Watson 的算法,保证最后输出的答案是有价值的。

医疗领域的信息更新速度非常快,同时不同信息之间可能存在冲突,这也让 Watson 在快速回答问题之前必须更快地评估各类信息的价值,区分不同情况,作出更精确的判断。

Watson 在医疗行业的缓慢成长无法满足人们对于人工智能给人类健康带来巨大提升的期望。事实上,医疗领域的人工智能几乎与个人计算机一起出现在上世纪的 70 年代,但现在来看,所谓人工智能驱动的个性化治疗,还有很长一段路要走。

对目前的 Watson 来说,他必须紧跟当下人工智能发展的步伐。2012 以来,深度学习成为人工智能领域最热门的算法,尤其是深度学习可以实现「自我学习」——非监督学习。比如,Google的 AlphaGo 对于围棋的学习就是深度学习成果的展现,通过自我学习,AlphaGo 成长速度惊人,如今已是世界顶尖的围棋「选手」。

2015 年 6 月,《麻省理工科技评论》报道称,IBM 计划为 Watson 加入深度学习的技术,比如翻译、语音文本的互转等等。如今的 Watson 依然是个「大杂烩」,早期是自然语言处理与大规模数据集的分析,又加入了深度学习。

另一方面,IBM 在人工智能基础研究的突破也将对Watson 的未来产生积极影响。2016 年 8 月初,IBM 苏黎世研究中心制成了世界上第一个人造纳米尺度随机相变神经元。这个由 500个该神经元组成的阵列,能够以模拟人类大脑的工作方式进行信号处理。这是IBM 在「人造大脑」研究方面的巨大进展。IBM 表示,他们的人工神经元技术和目前发展中的另外一种人工神经元器件——忆阻器互为补充。

如今,整个科技产业都在转型人工智能,今年以来,由于聊天机器人和虚拟助理最火,无论是 Google、FB,还是微软、苹果以及阿里,都纷纷在资金和战略层面加快布局,Watson 作为 IBM 抢占未来的重要据点,以及向认知计算转型的核心产品,未来还将继续扮演着重要角色。

更多新闻资讯,关注钛媒体微信号:钛媒体(ID:taimeiti)

本文系作者 赵赛坡 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
分享到:

第一时间获取TMT行业新鲜资讯和深度商业分析,请在微信公众账号中搜索「钛媒体」或者「taimeiti」,或用手机扫描左方二维码,即可获得钛媒体每日精华内容推送和最优搜索体验,并参与编辑活动。

赵赛坡
赵赛坡

数字人的数字化观察

评论(1

  • 天远 天远 2016-08-29 08:17 via android

    蓝色巨人也是很猛的

    0
    0
    回复

Oh! no

您是否确认要删除该条评论吗?

分享到微信朋友圈