2024CTIS-文章详情页顶部

【一周策划】Facebook和图谱搜索的前世今生

Facebook甚至曾在两年前放弃了图谱搜索。那这么酷的主意,怎么在葫芦里闷了两年才蹦出来?因为没有庞大的数据这块肥肉,个性化搜索就仅仅是个干枯的骨架。熬了两年,熬的是用户数据。

Facebook甚至曾在两年前放弃了图谱搜索。那这么酷的主意,怎么在葫芦里闷了两年又蹦出来?因为没有庞大的数据这块肥肉,个性化搜索就仅仅是个干枯的骨架。熬了两年,熬的是用户数据。

伊莱、若离wakari/钛媒编译】“新瓶装旧酒”,是Facebook前高管对戴夫·莫林(Dave Morin)对图谱搜索下的结论。他指出,个性化搜索是Facebook早就已经在运作的功能,不过是用了个新词重新包装后推出的。尽管扎克伯格在发布会上努力强调,图谱搜索有着划时代的意义,将会重新定义搜索,是社交和搜索的完美结合。但其实早有消息称,该搜索功能早在2005年就被提上议程。在戴夫任职的5年间(2006-2010),Facebook已经有这项称为“先进搜索”的功能。

那么为什么要关闭这项“划时代意义”的伟大搜索功能,等到两年后才推出呢?能更早引爆这个搜索界的炸弹不是更好吗?

不,时机还未成熟。搜索不同于其他功能,是需要巨大的数据支撑。2005年,Facebook才一岁,仅仅可怜的550万用户量。2006年,1200万。2010年,5亿。截此为止,Facebook用五年的时间才积攒了5亿用户。但是在2010到2012年,用户量爆发性的增长到了10亿。2年5亿,庞大的用户数据终于让图谱搜索有了展露拳脚的平台。

Facebook的软件工程师 麦克·柯蒂斯(Mike Curtiss)对此解释,数据节点和节点间是通过复杂的算法相互联系的,就好像搜索引擎中关键词的关系那样。这些节点发挥的作用与关键词相似,不过节点间存在一种数值结构,它将社交图谱的语义与节点联系在一起。

一上来就飚术语,让人云里雾里坐着飞机。 柯蒂斯随后解释道,Facebook希望人们能够搜寻两种事物,一是已经建立了联系的,二是并未与自己直接联系的。这就包括了限定条件的搜索,和非限定条件的搜索

 

限定条件搜索

 

假设柯蒂斯要去纽约市逗留几周时间,找到在那个城市居住的Facebook好友会对他有帮助。

图谱搜索会先从柯蒂斯好友的节点开始搜寻,然后跨越到这些朋友们的联系,查找那些边缘节点。一些人就会经“通过朋友”和“住地”纽约这两个边缘节点与柯蒂斯有了联系。

接着他将查询要求扩充为“我那些住在纽约并且喜欢看《唐顿庄园》(Downton Abbey)的朋友”。这种搜索更具体化,结果就被筛选至这位朋友必须符合三个限定条件:有朋友关系、住在纽约、喜欢《唐顿庄园》。

这些都不难理解,普通的语义搜索都还是可以做得到的,那图谱搜索独特在哪里呢?

原因来自于Unicorn。这是支持图谱搜索的主要搜索系统,是一款支持大众化搜索查询的标准化搜索引擎。其独特之处在于,它支持多步骤操作带来的跳跃式访问动作。

 

非限定条件搜索

 

“这是开始真正有趣之处,”柯蒂斯说,“说到这里,我已经向你展示了,社交图谱可以使用基本的搜索技术。它本身已经是个很棒的创意,但你可以做的还不止于此。”

“你会在我们刚做的查询中注意到,我们总是从开始查询的初始节点单一跳跃,”他说“通常有很多有趣的查询都需要一个以上的连续跳跃。”

柯蒂斯进一步拓展这个假设他去纽约的例子。假定柯蒂斯要去纽约找工作,那么,如果他能在自己的朋友圈里找到招人的公司,就更有利了。

“我们会采用的方式就是在Unicorn中进行搜索。先从我的节点开始,跨越到我朋友的边缘节点。根据那些节点,通过另一个我朋友在哪家公司工作的边缘节点跳跃到公司,结果就是我要找的公司。”

这就需要用到Unicorn的多级跳跃搜索了:在接受了一系列输入的结果后,再根据这些结果执行另一个查询任务。

这就是图谱搜索的魅力之处,能够将原本没有直接联系的事物联系在一起。除了对已知事物的搜索,图谱搜索可以实在地为用户的问题给出答案。

这么酷的主意,怎么在葫芦里闷了两年才蹦出来?

没有庞大的数据这块肥肉,个性化搜索就仅仅是个干枯的骨架。

柯蒂斯进一步解释,当我们对100个节点,作近似度查询的时候,会搜索到10000个相关的节点。然后通过对那些节点的相似性度做进一步搜索的时候,又会发现多达100万个输出节点。

当我们查询100个节点的边缘时,会检索到1万个输出节点,然后再查询那些节点的边缘节点,就会检索到100万个输出节点。

也就是说,如果我们想要找到适合自己的公司,要先找到和自己关联的朋友。然后再基于这些朋友,找到在纽约生活和工作过的。看上去是在做减法的搜索,实际上背后动用到的数据却是不断增加的。

此外,这种跳跃性的图谱搜索还仅是个初生儿。目前还难以应对Facebook多达10亿用户的搜索。目前只能在英语环境下,面对数百万Facebook用户的查询。Facebook团队目前还不打算公布正式面市的时间。

虽然承认图形搜索还有一段漫长的道路要走,但柯蒂斯说,自己的团队对于怎样完善这种搜索有一些“更高明的构想”,还说公司的首席执行官马克·扎克伯格已经表示,这是他真正关心的项目。

Facebook基础建设总监,索伦·拉森(Soren Lassen)用这样一句话做了总结:“万里长征只迈出了一步,等于说我们意识到,在这个领域进一步开拓是个很大的机遇。”

 

钛媒体相关阅读:

佩奇暗战扎克伯格

Facebook为何要做搜索?

Facebook图谱搜索将改变搜索生态

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
  • 招桃宝兼直,需会网购,多做多得,口口『 1874441577 』

    回复 2013.02.24 · via pc

快报

更多

23:19

妮维雅母公司拜尔斯道夫集团:将加码中国市场供应链投资,计划新设产线提升产能

23:13

蔚来展示“离车自主换电”功能,未公布上线时间

23:07

湖北启动绿色智能家电以旧换新惠民行动,最高补贴5000元

22:57

蚂蚁OceanBase 4.3版本推出列式存储引擎

22:45

阿联酋航空宣布定期航班已恢复

22:43

广东北江发生2024年第2号洪水

22:31

易纲:中国以相对平稳、成本更低的货币政策操作,保持了经济金融体系稳定

22:22

受天气影响,甬金铁路明天停运一天

22:21

北京绿色金融协会副会长马险峰:预计到2060年绿色金融有五百万亿规模需求

21:59

韩国医协称不能接受医学院在规定扩招范围内自主招生方案

21:50

小米汽车:新颜色的小米SU7车模已经开始研发

21:37

半导体石英制品企业强华股份完成C轮数亿元融资,临港项目预计年内投产

21:29

工信部:继续适度超前推进5G、千兆光网建设,优化算力设施建设布局

21:17

安恒信息发布安全大模型恒脑2.0,已至智能体形态

21:07

黑石提议以每股1.24美元现金收购音乐版权投资公司Hipgnosis

20:59

上海交大一个月内成立三所新学院,人工智能学院今日成立

20:38

内蒙古地区一季度生产总值5604亿元,同比增长5.9%

20:33

雷军称小米SU7不适合周鸿祎,等小米做SUV版时再推荐

20:21

高通与Meta达成合作,支持大模型Llama 3在骁龙终端上运行

20:18

知名基金经理一季度重仓股变化情况不大,林英睿:更深入地思考上行的潜在方向

1

扫描下载App