非架构化的数据没有任何意义,B2B模式是由业务驱动而并非 IT

摘要: 数据量大是没有任何意义的,数据的模式本身是非常复杂,我们必须建成架构,把它的价值找出来,进而推动不是基于IT而是基于业务的分析。

Taste  Analytics CEO Derek Wang

Taste Analytics CEO Derek Wang

钛媒体注:前不久,曾经帮助美国政府追踪本拉登的大数据公司 Palantir 完成新一轮7亿美元融资,估值达到200亿美元,颇受资本和市场青睐。昨日,在2015钛媒体T-EDGE峰会舞台上,也来了一家诞生于硅谷的大数据厂商 Taste Analytics ,其CEO Derek Wang 分享了他对大数据的一些看法和观点。

毫无疑问大数据在这个时代越来越重要,人们也不想盲目的追求大数据,但 Derek Wang 认为不是每个人都知道大数据到底是什么。在他看来,单是数据量大是没有任何意义的,数据的模式本身是非常复杂,我们必须建成架构,把它的价值找出来,进而推动不是基于IT而是基于业务的分析。

如何把大数据辨伪存真是大数据厂商目前面临的最大问题,比如就数据本身来说,数据的来源和渠道很多,要确定它是不是完整,互相有没有冲突。也恰恰是由于数据来自于不同的渠道,所以我们需要走一体化的建模方式分析我们的数据,这样才能够使用户得到有价值的东西。

用机器学习模式的构建是一种解析大数据的方法,但是如果受限于机器所学到的或者受限一个模型,根本不能了解数据的意义,所以最好的方法是你拥有人工智能,也得到了计算机辅助,作为人就能够得到更好的协作,从而做出更好的决策。

Taste Analytics 正在这么做,目的是使得分析结果符合客户的商业需求。“你用不着把所有的数据都过一遍,因为我们已经有办法以及简便的方式给大家提供你所需要的数据,我们可以使用虚拟化,可以提出一些适当的问题”,Derek Wang这样解释道。最后,Derek Wang 得出的结论是:B2B这样的模式是由业务驱动的而并非由IT所驱动的。

以下为Derek Wang在钛媒体2015T-EDGE峰会上的演讲全文,经钛媒体编辑:

我的名字叫Derek Wang,我是Taste AnalyticsCEO,主要做分析工具的工作,我今天主要给大家介绍的是B2B平台的一些新的趋势,我们如何在数据当中获得更多的价值。

当我们来做大数据和分析的时候,人是最重要的,人是决策的核心,因为我们需要依赖人,因为人是汇集我们资源的渠道,人是我们决策者,我们最后所有的这些过程也是人来做的,所有的这些方案是人提供的,产品服务也是为了人所开发的,所以这个观念在这样一个时代,大数据的时代变得越来越重要,人们不想盲目的来追求大数据,就好像我们的中学生在谈性的时候一样,我们都知道这是传统的最著名的比喻,实际上我们想我们平台和大数据来能够产业化,对我们大企业也好,中小企业也好产生更多的价值。

所以,什么是大数据?当我们谈大数据的时候,我跟大家总讲这个,大数据好像中学生来谈性似的,所有人都在谈,但是没有人知道他到底是什么,因为我们现在有很大的压力,他就觉得我们都得做,因为人们觉得大数据很酷,所以有些人就觉得我们也在做,有些人羡慕别人在做,可是实际上这到底是什么大数据呢?

实际上并没有多少人理解,这是我们用中学生谈性这样一个例子来做比喻。一个核心问题我们如何能够分析数据如何做大数据,如何吸引到这些大数据,获得回报,就是基础的设施等等这些,就好象其他人来谈如何能够创造收入,如何和钉钉的模式收益是一样的,我们客户所遇到的问题,实际上我们有不同的数据,如何能够在其中提取出价值来,如何能够推动不是基于IT而是基于业务的分析呢。

实际上对于原始数据而言,很多人告诉你说,我们数据量非常大,这不是我们需要的,不是量大的问题,有些数据实际上是非常复杂的,如果仅仅是原始数据一堆的杂乱无章的信息而言,从这个角度来看,大数据实际上是没有意义的,我们必须建成架构,必须把它的价值找出来,所以从这个角度而言,我们就有这种有架构的数据,有这种没有架构的数据,甚至还有这种伴有架构伴有结构的数据,实际上数据的模式是非常复杂的。

除此之外,我们的数据本身来讲,他的效率还有问题,首先我们要知道的是你这些数据是不是真实的,你这些数据有没有问题,到底是真是假的,是不是完整的,有没有不确定性,有没有冲突,所以因为我们的数据获得的渠道很多,来源很多,这就是我们遇到的问题。

另外,我们还要谈到数据的同理化和社会化的问题,我们数据来自于不同的来源,所以我们需要走一体化的这样一种建模的方式对待我们的数据,分析我们的数据,这样他最后才能够使我们最终用户得到有价值的东西。

人们就说,我们是否要来进行机器学习模式的构建,这样的话就能够解决,实际上他只是看到的是人类的一面,忽略了整体的情况,大家看一下财富500强,他们主要侧重于数据的收集,一般能够来进行一些分析型模型的建立,他们其实是浪费了很多的时间,这样的做法非常的有限,因为对于机器学习的模块可能是非常僵硬的,而且很多是不能重建的,这样的话就不能来反映大量的数据他们的发展趋势是什么,大家可以问一个正确的问题,如果你是受限于机器所学到的或者受限一个模型,你根本不能了解数据的意义,所以我们在这里要来看一下,在整个的过程当中,我们得到的一个智能是什么呢?

他指的就是艺术或者是人类的智能,他们知道我们要花多少的资源,我们的目标是什么,我们要问什么样的问题,另外我们的计算模式得到的结果是什么,非常有建设性的方式给出来,之前卡斯特罗他所进行的是这样的,我们知道卡斯特罗他说了一些话,他知道任何的一个举措,如果我们只是比如说在下棋的过程当中,我们要预先知道之前的举措是什么,人工智能是指人们有的时候他们甚至是能够来在下棋的过程当中,他们可以赢得更好。

换句话说,如果人和计算机,人机进行竞赛,我们还是人人之间来进行竞赛的,所以就像我们这样的人,我们对于象棋不太了解,但是如果能有一位大师他们和机器进行竞赛的话,如果你拥有人工智能,而且也得到了计算机辅助的话,我们作为人就能够得到更好的协作,就能做出更好的决策。

而通过这么做也能够来强调一点,对于这样的智能,他能够帮助我们使用计算出来的模式,把它转化成我们采取的行动。我们现在所推动的是一些互动,希望能够来得到一些模式,我们希望能够形成在有关人类计算方面的关系,而且能够形成一些自然的现象,能够使得大家之后能够得出有益自己的决定。

我们在这儿要看一下对于线下的方面和线上如何平衡,我们业进行了一些在线方面的分析,之后人类是应该能够和你得到的任何分析结果进行互动的,所以大家应该把数据应用到你的参考当中,你们作为分析专家,你们希望能够得到一些意义。

这儿可以来看一下,是不是能够使得这样的分析结果符合你的商业的要求,你用不着把所有的数据都过一遍,因为我们已经有办法以及简便的方式给大家提供你所需要的数据,我们可以使用虚拟化,可以提出一些适当的问题,最后B2B这样的模式是由业务所驱动的而不是IT所驱动的。

而对于我们公司,我们希望能够在同样的这样的结果之上建立起来。我们给大家所提供的是你们用不着做出很大的努力来构建一些数据之间的相关性,在我们数据当中,我们可以给大家提供一些数据的相关,你可以把任何的数据插入到我们的系统当中,之后我们就可以来进行模式的构建,我们这里有一些模块化,通过这么做我们可以引起我们的合作伙伴插入他们的信息,之后也能够在这方面使用这样的学习。

我们在这儿提供的是一些插件,他是针对不同的用户的,是以用户为中心的,这样的话才能帮助不同的用户,不同的行业找到一些洞察,而且这样的事情是通过我们的计算的模式所提取出来的,所以大家可以看到,我们找到一个相应的话题,之后就可以实现出来。

我们是一个全球的企业,在德国、澳大利亚等等都有业务,所以我认为在未来的任何的B2B,我们确保对于业务的所有人他们都知道,其实在他们的背景当中,我们所做的分析是非常适合他们的背景,因为我们是以终端客户为中心的,我们为他们提供商业的分析,我们也想强调一下,在人类和计算机之间的互动,就能够使得我们有一种方法,能够来进行分析,并且能够更好的使用一些来自于分析端的数据,之后我们就可以放到云端,大家就可以看到可视的计算的过程,就好象我们之前的价格平台。

我们相信,通过这么做,我们就可以得到一个量变,而且得到质变,更多的用户使用这个平台,他用得越多收益越多,我们的大数据会更加的有益了,这就是我的发言,谢谢各位。大家看一下这是我们的微信公众号,如果大家感兴趣的话,可以扫描一下二维码,谢谢各位。(本文首发钛媒体,根据Derek Wang在2015钛媒体T-EDGE峰会上的演讲全文整理

本文系作者 宋长乐 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
分享到:

第一时间获取TMT行业新鲜资讯和深度商业分析,请在微信公众账号中搜索「钛媒体」或者「taimeiti」,或用手机扫描左方二维码,即可获得钛媒体每日精华内容推送和最优搜索体验,并参与编辑活动。

宋长乐
宋长乐

彼岸的歌,是同一支歌曲。

评论(3

  • -叶玮- -叶玮- 2015-12-14 17:21 via weibo

    转发微博

    0
    0
    回复
  • 袁辉泉 袁辉泉 2015-12-12 19:42 via android

    毛线

    1
    1
    回复
  • 威客安全 威客安全 2015-12-12 17:54 via weibo

    支持~!嘻嘻

    0
    0
    回复

Oh! no

您是否确认要删除该条评论吗?

分享到微信朋友圈