商汤科技徐冰:数据不是AI的核心,无人驾驶近年量产可能性低

摘要: 国外有一种说法,一个深度学习的博士现在毕业可以拿到100万美元的工资,这个事情真的不夸张,你可以看他的薪水加上股票,现在你要挖深度学习的人非常难,要付出很大的价钱。

钛媒体注:近日,中国光大集团旗下的光大控股举行成立20周年庆祝酒会,多位政商界人士参与出席并发表主旨演讲。钛媒体特别整理了来自两家知名科技公司——商汤科技和大疆科技的两位发言者的演讲内容,分享其在各自领域的行业观察。

商汤科技是一家专注于计算机视觉和深度学习的AI企业。在今年7月宣布完成4.1亿美元B轮融资,创下全球人工智能领域单轮融资最高纪录,同时也成为了全球融资额最高的人工智能公司。

商汤科技联合创始人徐冰在演讲中提到了对于行业的几点观察,值得划重点:

深度学习领域没有细分行业。徐冰提到,目前有很多人认为在一个细分行业内积累数据闭环,以此可以产生行业壁垒。但在他看来,这一想法很难实现,“因为数据其实并不是核心壁垒,现在获取数据的成本非常低,市场上有数据没算法的企业实在太多了。”

无人驾驶在3—5年之内量产的可能性比较低。徐冰认为,无人驾驶是未来的方向但还无法量产。据他透露,目前商汤已经有大量的研发投入放在这个领域,其合作的车厂提供了大量的数据和研发的经费,一起合作做无人驾驶,在这个方面目前商汤已经产生盈利。

成熟的技术在产业层面带来的经济效益是远远超出想象的。以遥感图象解析产业为例,徐冰表示北京市的高清卫星地图,一个人要标注一个月才能标完,一台电脑9个小时就可以全部标完。对于遥感图象公司来说,如果有5000人在标注数据,一年可能有至少5—10个亿的工资上的支出,但有了算法以后,其工作产量可以提升10倍,或者他可以把5000人省到只有50人,公司的利润率可以从15%提升到70%。

此外,徐冰还提到如今深度学习领域的人才稀缺,“国外有一种说法,一个深度学习的博士现在毕业可以拿到100万美元的工资,这个事情真的不夸张,你可以看他的薪水加上股票,现在你要挖深度学习的人非常难,要付出很大的价钱。”

以下是徐冰全部发言,略经钛媒体编辑:

大家下午好!我是技术出身的,所以我们讲AI或者讲我们现在用在很多产业里面,包括怎么做演示,我们的方式不太一样。

好在我们是做计算机视觉的,我们做的东西都是大家看得见、摸得着的,这也是我当时读这个方向博士的原因。我为什么没有做语音识别,或者说自然语言处理,因为更多的计算机视觉我们看到的都是照片、视频,做出来的这样一些检测、视频,发生的真实场景里的信息,我们真正能把它处理、识别,这个事情还是蛮有意思的。这也是我们真正开始做一家企业,从学术界出身,到真正的这样一个商业的环境里面,我本人现在也转行了,从计算机视觉或者说深度学习方向的博士,现在专门负责公司的资本运作,我们上一轮一共融了4.1亿美元,当时这个场景还历历在目。

我们应该是第一家营收方面开始大幅增长的在AI领域的中国的企业,中午有一位嘉宾讲科技相关的公司应该怎么发掘它,我觉得讲得非常好,不完全是天使、VC、PE这样分类,就是从潜伏期到爆发期。我们潜伏期的时候没有人知道,等我们刚刚爆发就引来了很多的投资,我们原来想募2亿美元,因为我们今年基本上也没有什么亏损,结果我们签了7亿美元的意向,最后我们被迫无奈,做了一些遴选,选择了我们认为最有品牌、战略意义,包括在未来对我们的业务有帮助的投资机构,最后拿到4亿美元的钱。

我们觉得可能两三年内都不需要融资了,结果我今天又在这里,当然也不是说找大家来融资,我们其实现阶段因为有大的战略的投资人过来,逼迫我们提前启动C轮,所以我们11月份就会有新一轮的融资,估值也会有进一步的增长,当然我们的业务收入也会有大量的增长。

前面讲的都是废话,我发现今天是一个路演,这是我没想到的,我本来准备的材料是想给大家讲讲人工智能这个东西,我没有太想讲公司的东西,我把公司的很多东西都拿掉了,结果我发现前两场都是路演,所以我必须讲讲跟投资相关的话题。

产业的事情,背景不需要我多讲,大家都知道现在是AI的时代到来了,机器开始有能力向人去学习一些能力和经验,包括我们做语音或者是自然语言处理,都是大量的数据拿过来,进行人和机器的对话,包括我们做人脸识别,是把大量的照片拿过来,做结构化分析,最后掌握一个识别的能力,掌握一个对话的能力。

现在最有名的事情就是AlphaGo围棋的事情,基本上AlphaGo之后所有人都知道深度学习的技术成熟度到哪儿了。我们2014年出来做这家企业,IDG就投了我们,我们A轮估值2亿美金,IDG给了2000万美金,我们的创始人汤博士出了1000万美金。

当时我们做的时候没有人懂深度学习,但我们实际上还是心气比较高的团队,我们认为我们在国内基本上是唯一一个在深度学习方向有积累、有原创技术的团队,物以稀为贵,所以我们也希望最后这个技术创造的价值能反映在我们的估值上,所以我们早期融资也不是特别顺,直到现在我们把业务打开,包括现在各大投行都认为AI可以带来企业盈利能力的大幅增长,简单来说就是原来人做的事情,很多机械性的、逻辑性的事情都是由机器来做了。

中国是第一个全球范围内把人工智能作为国家战略的国家,各个地方的政府都倾全力发展人工智能产业。现阶段我们在拿政府的支持这一块也非常多,我们明年可能大方面会跟政府层面形成很多的合力和合作。

大家讲人工智能1956年就被提出来,但是基本上前50年是只有学术界的人在玩,工业界、投资界没有人玩,因为这个不落地,这就是我上午讲的技不如人的时代。

现在深度学习的时代到来,技术提升非常快,原来是一年提升一个点就很了不起了,现在一年提升十几个点,所以经过这几年的发展,我们看到众多的产品,包括各大企业巨量的投入,最早做的就是微软、谷歌、facebook,他们都有自己的专利。

中午的演讲嘉宾也讲到,专利是一个核心问题,我们好在是专注的只是把深度学习放到计算机视觉的领域,解决视觉识别方面的问题,我们也是2011年开始做的。2011、2012、2013年全球深度学习用在视觉领域,一共发了29篇论文,有14篇论文是我们团队发的,占了一半以上,最早把机器人脸识别的能力做得超过人的能力是我们做出来的,我们都在学术界顶级刊物上发表了论文。

也是因为我们发表了一些论文的原因,世界上也有一些小公司实现我们的论文,来做一些创业,在国内可以见到很多,但在全球范围内,我们在上周跟高通宣布全球人工智能产业的合作,高通的芯片结合我们的算法,在AI领域唯一的合作伙伴就是我们。我们为什么被高通认可,是因为我们有专利,这些是支撑我们长期发展的主要方面。

现在我们在营收方面、客户、技术团队、融资规模方面全部都是国内几百家人工智能公司里面的行业第一。我们也应该是国内最大的做深度学习的团队,有18个教授、150个博士。

国外有一种说法,一个深度学习的博士现在毕业可以拿到100万美元的工资,这个事情真的不夸张,你可以看他的薪水加上股票,现在你要挖深度学习的人非常难,要付出很大的价钱。真正有一批人做深度学习是2013年开始的,第一批掌握深度学习的博士毕业也就是去年、前年,我们在底层的人才上做了系统性的垄断。

以一张图来介绍商汤,我们是扎扎实实地建了这么一个做深度学习的最大的华人团队,都是最顶尖的专家。我们在基础的建设上投入很多,建超算,保证足够的算力,建我们的操作系统。最后我们在基础设施层面有共用之后我们做各种各样的应用层的研发,人脸识别、图象识别、自动驾驶,以非常低的成本可以把算法做到极致,在行业很少有人能超越我们这方面的水平。我们现在仅仅两年的商业化,2016年开始做商业化,服务了14个行业,400家大型的客户。

我们在这方面的竞争对手是谷歌和facebook,包括有一些做平台做得比较好的,比如说亚马逊,在视觉领域我们是独一家,原创的技术和IP。语音层面在国内最好的应该是科大讯飞,第一名拿到了50%以上的市场份额,剩下的小公司分其它的市场份额。我们在自动驾驶领域也有比较大的合作,还有IOT和芯片的结合,和云的结合,还有机器人的领域,我们服务了非常多的机器人的公司,运用我们的算法,比如说人脸等等。

太偏技术的东西我也不想讲了,时间也比较有限。这是我们的超算,我们建了8个超算,投了数亿元的人民币,这是要保证我们的算力。数据是做AI算法的燃料,我们现在有非常庞大的数据容量,超过100亿的图象和视频数据的积累,这三个结合在一起才产生了这么多的化学反应,催生了非常好的算法。按全球的原创来说,我们在论文发表上,深度学习出现之后,去年、前年这两年我们排世界第三,第一名是微软,第二名是CMU,BAT三家加起来都没有我们多,谷歌和facebook都在我们后面。

我们在每个行业都有一些具体的案例,比如说上午我讲的抓人,帮助公安大幅提升了破案效率,我们在深圳文博会,当时部署在现场抓有前科的人员,一共抓了25个人。当时我们在广州的一个街道布上人脸识别的摄像头,第一天就抓了5个人。现在的公安很多是技术出身,也都很专业,很多是机器学习的名校毕业的硕士,广州现在跟我们成立了一个联合实验室,现在在广州这边,今年上半年抓了357个人。

这也是很火的一个在互联网上有很多传播的视频,我们做视频结构化,就是把整个城市的人、车、非机动车三项核心大家关注的物体检测、追踪下来,识别它的属性,比如说是个男人、女人,有没有戴帽子,就没有带包,你穿什么颜色的衣服,一个人有30几项属性,综合90%多的准确率,我们把这些视频内容结构化成一个文本,方便检索,这个东西是服务于智慧城市、服务于交通的,有很多的应用。

这个当时被传上网,我们有lab的演示,我们公司楼边就有这样一个摄像头在结构化旁边的街道上的数据,有一天有人去参观,说我现在在街上走,头上都是顶着标签的,是现在中国的天网工程的放大招,这也是我们公司做的比较火的产品。包括在上海曾经发生过踩踏事件,我们在那个地方统计人数,做预警等等。

通过深度学习,教会了计算机去做这样一些技能,比如说识别人脸是一项技能,结构化视频是一项技能,数人数也是一项技能。

很多人觉得我们是一家人脸识别公司,其实不是,人脸识别占据我们公司技术规模的5%不到,大概就是5%的技术人员在做人脸识别,大部分人在搭一个深度学习的平台,能够让我们以很低的成本去做注入人脸识别的技术,这是商汤的核心价值所在。

为什么我们在短短的三年内成长得这么迅速,在各个领域里面都有我们的技术渗透进去,比如说金融,做身份认证,这里面不光是人脸,还有文字识别、活体判断,因为有人用照片、视频去攻击你的身份认证的这样一套系统,当你的技术应用到产业里面的时候,各种各样的问题会出现,所以你要第一时间拿到市场的反馈,去改进你的算法,这就是产学研打通,我们从研究的角度有数百人的博士、教授的规模,到工程产品,到最后的商业化,到最后我们出的任何一项帮助行业提高的算法,都可以有比别人领先的速度。数据一旦准备好了,在两到三个月内,商汤可以迭代出来行业内最好的算法。

所以我经常说深度学习这个领域没有细分行业。很多人强调说我坐在一个细分行业里面,我积累下来数据闭环,是不是可以产生壁垒,我觉得很难,因为数据其实并不是核心壁垒,现在获取数据的成本非常低,现在市场上有数据没算法的企业实在太多了,这些企业非常愿意把数据共享出来,跟我们进行算法的合作,享受算法的提升带来它的产品的提升。

无人驾驶方面也是一样,这是未来超过专家的一个东西,它并不是现在就可以量产的,无人驾驶在3—5年之内量产的可能性还是比较低的。但是我们现在这个阶段已经有大量的研发投入放在上面,包括我们合作的车厂给到我们大量的数据和研发的经费,来一起合作做无人驾驶,我们在这个方面也是目前已经产生盈利的业务,在大部分的无人驾驶公司都还在烧投资人的钱的时候我们实现了盈利。

这是我最后的一个案例,给大家分享一下为什么说AI这件事情不可怕。这是一个非常小的行业,但是它存在了很多年,这个行业就是分析我们放到天上的卫星拍下来的照片数据,比如说北京市,对整个城市进行分析。比如说汶川地震发生了,我要分析地震的损害程度,卫星要扫一圈,然后人要去做标注,这些都是很成熟的产业,叫做遥感图象解析产业,从教科书的定义就是人去做的,把楼房标注出来,把植被标注出来,现在这件事情完全可以算法做,并且做得比普通人的标注员做的精度还要高。

北京市的高清卫星地图,一个人要标注一个月才能标完,一台电脑9个小时就可以全部标完。这个是把路全都提取出来,现在高德地图有数千人每天在标注这些地图数据,把路标出来,因为哪个地方新修了路,哪个地方在修路,它要实时更新,这样地图才能有一个数据上的更新。包括把水、植被全都标注出来,包括我们在军事上做的一些项目,帮助把一些敏感区域的飞机做一个实时的监控,什么样的飞机降落了,什么的飞机起飞了。包括港口位置,什么样的船什么时候进港,要运输什么东西,这都是衍生出来的很多应用,这些以前全部是人去做,现在是机器去做。

现在在产业层面,一旦这样的技术成熟,带来的经济效益是远远超出大家想象的。比如说这样一个遥感图象公司,我有5000人在标注数据,一年可能有至少5—10个亿的工资上的支出,现在遥感行业的企业非常不赚钱,利润率可能就10%到15%,但我把这个算法给他以后,他的工作产量可以提升10倍,或者他可以把5000人省到只有50人,他的利润率可以从15%提升到70%,这是我们现在实实在在发生的AI行业带来的传统行业的升级。这是一个典型的案例。

很多做金融的人都知道,金融科技已经有这么一拨了,原来的交易大厅是很多人在做,现在基本上都是机器替代了。用我上午分享的一句话结束,以后大家就是一周工作三天,每天工作四小时,密集劳动的工作都由机器来做,这我们想实现的愿景,用人工智能来引领人类真正的进步,创造真正的价值。(本文首发钛媒体,整理/蔡鹏程)

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

本文系钛媒体原创,未经授权不得使用,如需获取转载授权,请点击这里
分享到:

第一时间获取TMT行业新鲜资讯和深度商业分析,请在微信公众账号中搜索「钛媒体」或者「taimeiti」,或用手机扫描左方二维码,即可获得钛媒体每日精华内容推送和最优搜索体验,并参与编辑活动。

蔡鹏程
蔡鹏程

钛媒体记者 邮箱:bzyy406@163.com

评论(4

  • Davidwind Davidwind 2017-11-04 08:31 via iphone

    规范化大数据+专业知识+技术算法,大数据需要积累,规范化需要很大投入. 专业知识就需要“细分”行业的各类人才. 我认为技术只能排到第三位,虽然说当前深度学习的人才技术门槛高,最好永远是极少数,但随着技术普及化,就像许多计算机技术一样,将来也会出现“AI码农”. 当前如果合作对象是政府背景或垄断背景当然数据是“被迫0成本”,如果进入市场化的细分领域,且不说政策法规风险,就是抓数据成本也很高,不仅需要资金投入而且需要时间积累. IBM花了10亿美金的Merge才拿到多少数据仅做了一二个病种可以“智能”读片。所以我认为AI的时代是产业真正合作的时代,就如同真正智能的人需要组织合作才能完成复杂的项目一样。

    1
    0
    回复
  • SummerR2016 SummerR2016 2017-11-03 00:24 via android

    不同意上面说的数据不是AI核心的说法,企业有垂直数据,难道就只能找商汤合作吗?企业不需要100多个博士,有一个足够懂业务和数据的自己的算法团队就能够利用现有的机器学习技术为企业创造价值,反观AI技术提供商的公司确要依赖业务企业提供的数据来形成自己的算法优化闭环,数据不是AI的核心,那什么是呢?希望有机会和商汤的这位同仁讨论😄

    0
    0
    回复
  • 墨镜西西ww6868 墨镜西西ww6868 2017-11-01 17:29 via weibo

    @Douxww

    0
    0
    回复
  • 钛p67cDj 钛p67cDj 2017-11-01 10:18 via pc

    深度学习或算法的学习专业属于哪个领域?

    1
    0
    回复

Oh! no

您是否确认要删除该条评论吗?

分享到微信朋友圈