内存计算掘金社交网络

随着社交网络的发展及普及,其拥有的海量数据的商业价值也日益被广大企业所重视。内存计算是社交网络掘金海量数据的神兵利器。

社交网络的商业价值不仅体现在其庞大的用户群,更大程度上在于其社会关系网络用户群生产的海量数据。例如,Facebook全球坐拥6亿用户,实时接收各种用户自主提交的数据。这些用户所提交的数据,组成了一张张真实的表格,记录了用户的各种属性以及他们的关系网络。

社交网络数据具有非凡的商业价值

社交网络的数据为何如此被推崇?原因就在于社交网络让信息沟通的成本大大降低, 企业原本费尽心力也难以有效接触到的目标消费群,如今借助社交网络就可以轻松触及。可以说,哪个企业率先利用社交网络工具,就有可能在新形势下获得更多的商机,取得长久的竞争优势。

社交网络上庞杂的数据不仅包括使用者的个人信息、属性,还包括互动数据,如参与的投票和测试、分享和查询的内容等信息。这些依据兴趣细分的信息,渗透到了网民日常生活的方方面面。这些看似杂乱无章的信息其实正在悄悄地告诉企业——哪些用户可能是其潜在的目标用户群,这些群体有哪些特征。如果企业获得了这样的信息,便可以更精准地投放广告,销售自己的产品。

无论是Facebook,Zynga(社交游戏公司)、Color(移动互联网图片社交应用),还是刚刚成功上市的LinkedIn,无一不是看准了社交的趋势,继而获得市场青睐。通过社交网络,这些企业对用户行为进行分析,揣摩用户心理,然后适时地为某个独特行为习惯的用户群提供有针对性的服务,进而帮助企业找到并聚焦这些用户。

这也是为什么图片社交网络Color的创始人Bill Nguyen 会这样定义自己:“我们是一家数据挖掘公司,而非照片分享网站。”他在创业之初就打定主意要好好利用智能手机上那些传感器所搜集到的数据,并且开发一整套算法技术。通过这些数据的计算,识别出用户和哪些人在同一个区域。通过这样的数据积累,Color试图计算出用户和他人的亲疏远近。就像在现实生活中,那个与用户总在不同场合出现的人必定是他的熟人一样。

在肯定了社交网络海量数据的价值之后,问题也随之出现。这些由用户随意填写和定义的信息和数据依旧处于一个散乱的状态,如何将这些数据有效地进行系统化处理并且变现,就显得尤为重要。一句在业界久为流传的话,道明了社交网络目前所面临的症结所在:“数据本身并不会产生价值,数据经过分析以后才会产生价值。”

拥有大量丰富的数据只是企业走向成功的第一步。如何让这些数据变成有效的、容易被抓取和利用的数据,才是企业实现社交网络商业价值中的关键环节。数据挖掘透过数据模型来分析社交网络上储存的大量数据,可以找出不同的客户或市场划分,分析出消费者喜好和行为,进而实现社交网络数据的商业价值。

举个例子,谷歌通过数据挖掘,大大增加了其广告投放的针对性,从本质上来说,就是通过对大量数据的挖掘,对用户消费模式或者行为模式产生了一种识别。把消费模式、行为模式识别出来之后,就能够方便、直接地制定相应的市场策略和方向选择。

实时——内存计算的杀手锏

由于经济环境的瞬息万变及社交网络数据量的不断增加,能够提供实时的信息反馈显得非常重要,这对传统的数据挖掘技术提出了新的要求及挑战。

譬如,过去做数据挖掘,受数据挖掘工具的性能限制,一般会先对数据做预处理,即根据预定的数据挖掘模型进行预处理,对可能要挖掘的数据切面,做过一些预处理之后,才能做数据展示。这就存在一定问题。如果预处理的数据是按照地区去处理或按照销售的产品种类去汇总,未来显示的信息也就只能按照这种方式去展示。如要选择按照其他汇总,则要重新花时间做预处理。换而言之,数据挖掘需要很多时间去做数据准备,把预处理的结果存储起来,才能给最终用户做快速展示,用空间换取时间。此外,建模过程也是非常耗时,为了获得最佳的预测模型,对于每个业务新问题,都要重新探索数据的相关性,进行算法参数的重新调整和配置,以得到优化的模型。

不难看出,传统的数据挖掘由于先期准备时间长,再加之对数据建模人员技术要求高,因此无法迅速处理当下瞬息万变的数据,难以应对为解决企业决策者对信息进行“实时”分析的强烈需求,更不用说去提供基于历史数据的“实时”预测来辅助决策。这时就需要一种新的方法和工具,要求能从快速变化、“实时”的数据中提取最直接的信息,并能提供任意数据切面的分析。同时,决策者可以快速模拟未来市场情景,快速制订最佳的行动方案以增加销售利润、解决客户问题、降低风险,帮助企业更深入的分析市场、交易和运营数据。

内存计算技术随之应运而生。

与传统的数据挖掘技术相比,内存计算则优势明显。内存计算充分发挥多核CPU的能力,可以对数据并行处理,并且内存读取的速度也很快,再加上数据按照优化的列存储方式存放在内存里面。依托于以上特点,内存计算可以对大规模海量数据做实时的分析运算,而不需要事先建模和数据预处理。例如,想要以任何维度去分析数据,实时就可以建立模型,完成分析处理,对上亿条数据可能仅需几秒钟就处理出来,处理速度非常快,故而可以快速尝试任意数据模型,对多种未来情景进行模拟。

内存计算的“实时”性除了体现在对既有数据的分析处理更加迅速之外,更大的价值体现在如何在既有数据的基础上做预测。因为历史数据只有一个真相,而对未来的预测可以有无限多的可能性。例如,根据现在社交网络上的数据,再加上一些假设条件,去做一个预测。但利用传统技术做预测,每一种可能性都需要大量的预处理时间,要对多种情景做出模拟,在时间上就不允许。内存计算“实时”的特性则能根据社交网络提供的海量数据,即时看到当前的客户行为模式,进而在既有的海量数据下做出模拟预测。使用者通过增加一些变量条件,展示可能会产生的情况,比较各种方案,从而采取相应的决策。例如,在市场活动中,用户人群的特点,消费倾向等数据一定,若要增加他们的满意度,是通过增加客户关系投入效果好,还是通过降低产品价格更有效?满意度的增加会带来什么程度的收益?这样的预测性探索性的问题,都是内存计算“实时”分析擅长的内容。可以说,内存计算解决了企业决策者和一线职员对信息进行“实时”分析的强烈需求,更提供基于历史数据的“实时”预测来辅助决策。

内存计算多方位的无限前景

虽然社交网络凭借其海量数据和社会关系网络被全球资本市场追捧,但不容回避的是,社交网络至今还没能找到一个合理、高效的方式将这些数据的商业价值变成企业收入,即没有很明确的盈利模式。不过,随着内存计算技术的发展,这或将为社交网络提供一个盈利的契机——内存计算可以快速地实时处理社交网络所掌握的信息,在未来社交网络公司可以把有价值的信息去售卖,或根据企业需求定制特定人群的信息产品。

当然,内存计算与谷歌这样的通用搜索还有很大不同。内存计算归属于一种商务智能、统计的范畴,即能够分析社交网络的海量数据,然后让海量数据从数据变成有价值的信息,方便社交网络把有价值的信息去售卖。完成了海量数据到价值信息的转换过程,也就为社交网络利用海量数据获取盈利铺平了道路。在这种转换过程中,社交网络通过对价值信息的转换和甄别,为自身经营创收的同时,也无形中完成了提升用户体验的过程。举个例子,如某社交网络通过内存计算,识别出来某一特定群体用户专门喜欢买奢侈品,就可以定期向他们推送和介绍奢侈品相关知识,提供各种形式的奢侈品信息。而这些信息对于他们来说,非但不是干扰,反而是他们所四处寻找的有价值的信息。无疑,内存计算提供的分析结果在其中起到了关键作用。

同时,未来内存计算可以与云计算进行更多有益的结合,让内存计算更容易发挥出应有的效用。因为内存计算往往需要很多的计算能力和计算资源,如果只是单凭一个或两个私人的企业去使用,不适合普遍化应用,也不经济。内存计算作为一个技术,可以被部署在“云”上面,让需要的用户去租用。社交网络作为一个很好的平台,除了提供交流和信息来源外,也部署在“云”上面。社交网络中的某些信息时刻都被处理和调用的需求产生,这时内存计算就提供了一个可供计算的引擎。

此外,内存计算也并非孤立存在。要想将内存计算与社交网络完好的结合,建立内存计算的生态系统十分必要。内存计算给社交网络提供了新盈利方式的同时,也连同社交网络的资源一起,建立起一个新型的生态系统。在这个生态系统中,有人专门负责运营社交网络,即拥有海量数据的一方;有人专门运营内存计算的资源,即处理海量数据的一方;而产生了价值信息之后,通过不同的方式去进行商业售卖,即进行信息代理售卖的一方。无疑,各方都会在这一过程中获得一定的盈利。普通用户则可以通过产生的信息,更方便地找到与他们志趣相投的人,或者更好地发展他们的个人网络,在社交网络上获得更好的体验。而这种用户体验,显然是内存计算和社交网络所组成的生态系统所提供的。

总之,随着社交网络的发展及普及,其拥有的海量数据的商业价值也日益被广大企业所重视,内存计算是社交网络掘金海量数据的神兵利器。同时在未来,内存计算能给社交网络带来两点改变——首先,能够帮助社交网络找到盈利模式;其次,内存计算和社交网络都部署在“云”上,能给社交网络提供计算的引擎。可以预测,内存计算未来将会在社交网络领域大放异彩。

(本文作者为SAP中国研究院总裁)

本文系作者 芮祥麟 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
  • 也就是说我们过去现在将来在网络上的一举一动都被记录,存储。然后被一些“别有用心”的人用来分析以谋取利益。

    回复 2011.08.31 · via pc
  • Data-mining

    回复 2014.01.20 · via pc
  • 关注云计算,关注内存计算!

    回复 2011.09.03 · via pc
  • 在社交网络上,用户的信息被打包出售,如何保障隐私数据不被恶意利用?

    回复 2011.08.31 · via pc
  • 不错的分析。

    回复 2011.08.31 · via pc
  • color已经不行了?不知道吗?

    回复 2011.08.30 · via pc

快报

更多

18:20

上交所:2024年启动沪市债券市场统一交易终端建设,进一步丰富科创板指数体系

18:19

登云股份:终止2023年度以简易程序向特定对象发行股票事项

18:18

上交所:本周对退市整理股票退市博天和严重异常波动股票进行重点监控

18:15

《上海证券交易所资产支持证券业务规则》发布

18:14

8只中证A50ETF联接基金获批,4月初将集中发行

18:11

渝农商行:原党委委员、副行长舒静被查

18:09

国家新闻出版署发布2024年3月份国产网络游戏审批信息,共107款游戏获批

18:07

深交所:本周对“*ST左江”等涨跌异常证券进行重点监控

18:07

深交所发布资产支持证券业务规则和三项配套指引

18:06

上海:2024年力争新增光伏装机60万千瓦以上,组织开展新一轮海上风电竞争配置

18:05

上海:加快引入市外绿电资源 2024年年内新购市外非化石能源电力40亿千瓦时

18:05

上海:2024年全市考核口径单位生产总值能耗、单位生产总值二氧化碳排放量下降3%

18:04

吉利控股集团旗下星驱科技与无锡5家企业签署超30亿元合作协议

18:04

央行:2月份,债券市场共发行各类债券47061.2亿元

18:03

上港集团:2023年净利同比下降23.34%,拟10派1.72元

18:02

51只个股发生大宗交易,中国神华溢价率0.03%居首

18:01

意大利3月CPI同比增长1.3%,预期增长1.40%

18:00

司法部:建立企业信用修复制度,推动解决僵尸企业有序退出市场

18:00

中国钢铁工业协会副会长骆铁军会见日本制铁中国总代表桂康久一行

17:58

民航局:限用类中型无人驾驶航空器系统型号合格审定指南将于近期正式发布

6

扫描下载App