可视化搜索不算新词了,但它与AR的结合却具有特别的潜力

摘要: 对于Pinterest, Bing 和 Google这样将可视化搜索作为重点战略去开拓的公司来说,其可视化领域最有可能进化的方向是将当下最受欢迎的技术之一AR与之完美结合。所以,可视化搜索具有着发展十分完善的潜力。

近日,全球电商巨头eBay收购了计算机视觉和视觉搜索技术领域的佼佼者Corrigon,旨在加强用户可视化搜索体验,帮助顾客从10亿产品中找到他们所需的商品。

据了解,Corrigon擅长根据图片来搜索和辨别特定物体,并能将该物体与其他图片和产品链接相匹配。如果将该技术用在eBay上,就是用来匹配图片与图片所显示的物品。此举将帮助eBay卖家更高效地罗列商品清单,以及帮助买家更快找到他们想要的商品,从而在更大程度上将其转化为有效顾客。

“可视化搜索”早已不是什么新鲜的名词,2008年,TinEye第一次推出基于图像定位技术的图片搜索引擎;2010年,Google一款名为Goggles的APP,目的是让用户以手机拍照的方式,搜寻拍摄物体的资讯,想要搜寻什么东西根本不需要输入关键字。

但直到近两年,可视化搜索才有了它真正意义上的突破。比如2014年,Pinterest推出的可视化搜索引擎Guided Search,它基于用户接触的各种图像信息,能够提前预测用户希望键入的信息。同时允许人们分享和搜索自己感兴趣的对象,打造出电子商务入口。这一商业模式伴随可视化搜索时代的到来而发生巨大变化,“搜索+推荐”将更贴近网络消费需求。

如今,关于可视化搜索的各种方法,我们都早已烂熟于心,比如图片搜索,可以是图片的一部分,可以是手机拍摄的,也可以是一副数字化的油画。而若是和电商APP或是今年火遍全球的AR(增强现实)相结合,毫无疑问,可视化搜索的前途将无可限量。

那么,问题来了,可视化搜索如今的境况是什么样呢,未来又将如何发展?

可视化搜索的“前世今生”

尽管过去几年,图片搜索技术已有了非常大的进步和创新,但图片搜索技术从其最早兴起,即二十世纪九十年代,那时候称之为CBIR(Content-BasedImage Retrieval),即基于内容的图像检索,发展至如今,经历了一个漫长的过程。

事实上,关于图片搜索的概念可以追溯至TinEye第一次推出基于图像定位技术的图片搜索引擎之前,TinEye是第一个运用图像鉴定技术而非关键词、水印或是元数据技术进行搜索的引擎。

2011年,Google也相继为用户推出能够基于图像识别搜索的技术。Google推出的Goggles就能够搜寻拍摄物体的资讯,比如:开启拍照模式,取景之后按拍摄键,相机就会做自动对焦并且拍摄照片,之后程序就会分析照片里面的成份、并且在 Google上面搜寻,如果你拍的是景点照片,搜寻出来的就是这个景点的名称与地点、搜寻书本可以告诉你是什么书,还可以拍画作之类的东西,程序都可以搜得到。

另外,如果相片里的主体是风景,可以得到相关的旅游资讯与搜寻结果;如果相片里的主体是书籍,可以得到相关的比价、评价与搜寻结果;如果相片里的主体是图画,可以得到相关的作者、介绍与搜寻结果,甚至也能找到从颜色、形状等视觉上与之极其相似的结果等等。

(2011年Google图像搜索 来源:Search Engine Land)

另一种要讲的是Image Searcher开发的一款名为CamFind图像识别应用,CamFind 开发的初衷是针对Google Glass的图像识别,在12秒以内给出一个准确的答案。如果这个图像是曾经识别过的,那么当再一次识别时只需几毫秒就能完成识别。

Google Glass的佩戴者则可以通过一个简单的语音指令启动CamFind,“OK Glass, what do you see?” 。之后Google Glass会拍摄一张照片,CamFind会将这张照片与服务器中所有的照片进行比对。CamFind会将反馈的结构显示在Google Glass屏幕上。搜索速度快慢也取决于图像的清晰程度,如果这张图像不清晰,那么CamFind将会让专家人工给用户反馈结果,另外,如果十分喜欢别人穿的一件衣服,也可以利用CamFind得到相关信息。

到2012年, 图片社交网络Pinterest更是以一匹黑马的姿态迅速或遍全球,尤其受到年轻用户的极大欢迎,但即使作为一个以图片分享出身的社交网络并被公认为具有极大的市场潜力,人们却无论如何也想不到它日后会在可视化搜索领域有所作为。这主要因为对 Pinterest而言,精准的可视化搜索都是基于相关内容推荐的需求,服务于用户。 

2014年时,Pinterest收购一家仅有两名员工的创业公司VisualGraph,这家公司主要从事与机器视觉、图像识别和视觉搜索技术有关的业务。也是在同一年, Pinterest先于微软Bing推出了可视化搜索引擎Guided Search,让用户用一种全新的视觉方式来搜索Pinterest超过300亿个Pin。只要点一下图片中的搜索工具,在任何想要买的东西周围画一个框,比如一盏灯,一双鞋或者一件相似的上衣。然后Pinterest运用深度学习图像搜索出与这个图片相似的产品,找到那些你可能会购买的链接。

而近年来,微软Bing搜索引擎则通过将可视化搜索技术用于智能手机APP中,实现了对Pinterest的险胜。但无可否认的是,无论是 Pinterest还是Bing ,都是可视化搜索技术领域的佼佼者,这两家公司未来将如何发展,拭目以待。

当然,你也可以想象,像Google如此高冷傲娇的全球搜索领域巨头科技公司是否会真的让Bing 和Pinterest领先自己一步呢?答案自有分晓。今年7月,谷歌曾宣布,已收购巴黎机器学习技术开发商Moodstocks,Moodstocks是一家图像识别技术公司,推出了智能手机图像识别应用程序Moodstocks Notes,可通过照片识别书籍、CD、海报、传单和酒标等对象。下载该应用程序后,对准照片扫描,用户即可浏览其他人对该商品的说明及评论。所以,Google继续强化可视化搜索领域的机器学习和研发,收购Moodstocks就是这一战略的最新体现。

另外,就在前不久,Google在其10月初举行的秋季发布会上,推出最出人意料的一款产品就是移动聊天 Google Allo,其直接的竞争对手将是 WhatsApp、Facebook Messenger、iMessage、微信和 Line,这些 IM 应用的用户加起来已经有数十亿,那么在这样的情况下,Allo又该如何跟其他社交巨头产品竞争呢?答案是兼顾效率和趣味性的人工智能。这主要包括两个方面,一个是智能回复(Smart Reply),一个是 Google Assistant 智能语音助手。

智能回复功能对于社交类产品的益处已经在 Google 此前推出的邮箱类应用 Inbox 上得以彰显。在今年 3 月的版本更新后,Inbox 可以自动分析你收到的邮件,并给出一系列快捷回复的选项,例如“正在尝试”、“马上发给你”以及“明天见”等。这不仅极大地提高了人们处理电子邮件等效率,还可以在用户选择回复内容时顺便训练 Inbox 智能回复的神经网络系统,对于 Google 和用户来说简直是两全其美。从这一点来看,也体现出了Google在人工智能领域的巨大野心。

可视化搜索叠加电商,简直是天作之合

想想看有多少次你看到一个身材高挑,气质出众的美女从身边走过,没错,她的鞋很Cool,你也非常喜欢?那么问题来了,你用“蓝瘦香菇”的心情纠结要如何才能买到她同款的这双鞋?

试想趁着美女不注意,轻轻按下快门,拍下自己喜欢的鞋子,然后用图片在手机里的电商APP搜索同款,这体验是不是也该逆天了?

可视化搜索+电商,简直是天作之合。于是,可视化搜索领域的春天就来了。举个例子,通过CamFind进行图片搜索,将直接为你搜索出物品的购买链接。

再来看Pinterest,它上线了一项”object search“功能的图片搜索移动应用,旨在为用户解决以上提到的类似问题,为用户网络购物提供极大的便利。

但是,若是提到电商,又怎能少得了以电商起家并站在金字塔顶端的全球电商巨头亚马逊呢?2014年,亚马逊为其电商APP中融入了拍照购物功能。同时也发布了一款名为Firefly且仅可用于Fire Phone的可视化搜索识别App。然而尽管 Fire Phone最终以失败告终,但傲娇如亚马逊,却仍未放弃Firefly,而是将其引入相对性价比高,销量好的Kindle Fire HD,其可视化搜索的功能对于书籍、DVD以及可识别的品牌物品都有非常精准的识别能力。

还有其它一些具代表性的专注可视化搜索领域的公司,包括 Slyce(视觉搜索初创公司),借助它的服务,你只要有部智能手机,给那件你想买的物品拍张照片,就可以进入在进行销售的网站; Catchoom,AR公司,通过图像识别和AR技术实现销售。

然而,尽管视觉搜索技术目前在全球还未达到家喻户晓的地步,甚至有些人都不知道这项技术的存在,它未来仍有很大的潜力去颠覆科技领域。在电商领域的应用只是一方面,未来会应用在哪里,有多大的潜力,都将不可估量。

可视化搜索的未来

暂且不论在可视化搜索技术日渐成熟的情况下,可视化搜索未来将无可限量的这个预测,就目前而言,可视化搜索都有着无限的可能性。

就用于可视化搜索的可视化识别技术而言,它完全可以用于人们的辅助工具。想想CamFind推出一款使用了可视化识别和声音覆盖技术的APP TapTapSee,旨在帮助盲人或视力有障碍的人辨认他们在日常生活中所遇到的东西。用户对物品拍照,稍等后便会得到回应告知这是什么物品。还有与这一APP具有类似功能的APP Talking Goggles。

尽管这些都只是纯粹的识别类APP而非搜索引擎,但图像搜索引擎却可以根据那些视觉受损人员社区的反馈将相应的功能融入到 图像搜索功能中。事实上,若要将图像识别和搜索引擎这两个概念进行区分十分容易,但若是将这两个概念联系在一起,那么未来为那些存在视觉障碍的用户提供真正适用于他们的可视化搜索将不在话下。

那么,想象一下,如果能将基于拍摄功能的视觉搜索和近来较火的语音搜索相结合,又会如何呢?Google最新展示的Google语音助手就非常类似所描述的这种功能,Google Assistant,通过调用系统内更多的权限实现更加智能化信息展示,读取用户社交网络的信息,可以为用户提供导航、社交网络评价等内容信息,所有的内容都更加的立体并贴近真实的用户体验。

而另外一个基于图片搜索的界面是Splash,完全区别于之前说到的任何可视化搜索类型。它的界面能够允许用户通过颜色搜索500px的图片。而随着可视化搜索的逐渐演变,Splash更多的是作为一个风趣新颖的角色为而非搜索工具,用户只能在风景、人、动物、旅游和城市之间进行图片搜索。

但尽管如此,仍有一些用户偏爱Splash在可视化搜索领域的特立独行,试想如Splash赋予自己更多的定义和想法,那么未来极有可能发挥出巨大的潜力。

另外,目前大部分可视化搜索的类型都基于拥有一幅图片或是实物的前提,但试想若想搜索一些图片是如何画出来的?或是没有具体实物在手的时候又该如何呢?

总结:对于Pinterest, Bing 和 Google这样将可视化搜索作为重点战略去开拓的公司来说,其可视化领域最有可能进化的方向是将当下最受欢迎的技术之——AR与之完美结合,典型的就是 Pokémon Go。所以,可视化搜索具有着发展十分完善的潜力。而现在若是断定未来可视化搜索是否会取代文本搜索还为时尚早,但无可否认的是,可视化搜索未来将为搜索世界打开一扇具有无限可能的大门。(本文首发钛媒体)

更多行业新知,关注钛媒体微信号:钛媒体(ID:taimeiti)

qrcode_for_gh_99d4be81cba2_1280

钛媒体微信二维码

 

本文系作者 yangzhao1212 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
分享到:

第一时间获取TMT行业新鲜资讯和深度商业分析,请在微信公众账号中搜索「钛媒体」或者「taimeiti」,或用手机扫描左方二维码,即可获得钛媒体每日精华内容推送和最优搜索体验,并参与编辑活动。

yangzhao1212
yangzhao1212

评论(0

Oh! no

您是否确认要删除该条评论吗?

分享到微信朋友圈