说出来你可能不信,AI可以帮你找到合适的住处

摘要: 我不会去深入剖析AI是如何参与决定哪些新闻,朋友的帖子,视频或城市的照片将被我们看到,但我将要阐述我们如何使用在Teleport中的AI技术去帮助你更客观地看待城市。

钛媒体注:本文作者 Silver Keskkula 是Teleportinc 创始人之一 ,也是Skype 核心团队的首席研究员。作者从五个方面讲述了,如何通过AI 技术让你足不出户就能找到一处适合自己居住的地方。文章由图普科技翻译。

我曾经在《AI将如何重组人口》一文中打趣过我的读者们。就像在线约会网站决定谁跟谁将制造一个婴儿,我们将也让AI技术决定谁将搬去哪儿。所以,我们如何知道如今哪些城市才能被称为好城市?

我们读新闻,听到朋友的好消息,看到照片和视频,从那里得到最好的工作机会,而非常平常的是,我们经常只是走马观花地去看城市。

我不会去深入剖析AI是如何参与决定哪些新闻,朋友的帖子,视频或城市的照片将被我们看到,但我将要阐述我们如何使用在Teleport中的AI技术去帮助你更客观地看待城市。 自从我被《每个孩子都开始编程》一文深深吸引后,接下来,我将通过简单的代码示例来演示这个文中的过程,以说明使用所有工具玩转AI已经是一件很容易的事情。

以下想法主要受到来自MIT的StreetScore项目的启发。

通过AI的眼睛探访城市

让我们从Teleport Developers API中抓取爱沙尼亚Tartu区域,并生成10,000个随机地理坐标。你可能会问,为什么是一万个?因为科学!

这样在地理上的均匀分布当然会使我们对城市的看法有一定意见,因为大多数时候我们在树林里或者屋顶上都几乎看不到任何东西。但幸运的是,在Google Maps API的帮助下,我们可以任意移动坐标,并得到更像这样的东西:

正如你所看到的,我们计划访问的位置(红点)或多或少在热闹的道路和街道上,而不是一些长满了树的地方。

现在我们已经拥有我们的位置,现在是时候进入观看位了,并熟悉Google街景视图图像API。基本上我用我的坐标调用他们的API,并在本地保存生成的图像。

经过一些反向地理编码和一些常规遵循后,Google的API让我得到了每个坐标返回的照片(而均匀分布则会显示的“对不起,我们没有图像”)。

然后通过我的代码,我就可以窥视成千上万的Tartu的图像,而不需要离开房间(或我的电脑?)。

图像HAL层上有什么?

为了简化事情,我通过公共可用的机器视觉API运行我们的图像集。 我们有很多这种类似的选择,比如Microsoft Computer Vision API / Google Cloud Vision API / IBM Vision Recognition API / Cloud / Sight API / Clarifai等等

但为了这个例子,我去了微软的牛津项目。微软研究组织使我印象深刻,老实说,他们的API免费使用条款是最吸引我的。他们甚至慷慨到提供Python 的快速开始代码。

实质上,您只需将图片上传到其API,并返回一行描述场景的文本。这里有一个来自Tartu的图像示例,以及来自MS Vision API的输出文本。

智能压缩

通过他们的API,我将来自Tartu的8.5GB原始图像像素数据压缩成255KB的文本数据。 如果研究过压缩和智能的关系,那么这个减小了35,294倍的尺寸或许能说明一些问题。

无论如何,现在我们终于有了描述场景的自然语言,我们可以开始研究统计数据,看看我们能否找到一些说服某人搬家的理由。

看着那长长的列表,我几乎睡着了,直到我看到“摩托车”这个词。摩托车的数量或者人口中拥有摩托车的比例很好的说明了一座城市的潜力。我个人对此非常有共鸣(因为我拥有两辆摩托车)。

当然,在各个城市寻找关于摩托车的统计数据还是会有很多来源,但是要记住,这些来自不同国家的不同来源的数据需要我们花费大量的工作去抓取以及进行规范化。Google街景的美妙之处就在于它将大城市作为了单个数据源,并且能在捕获图像中可见的任何信息。

AI的进步,更具体来说,深度神经网络的进步每周都让我们感到惊讶,如果你依然怀疑AI技术在图像中提取信息的能力不如人类的话,那么请参考一下下列AI击败人类的成果列表:

  • Google的AlphaGo击败李世石
  • 卡内基梅隆人工智能击败顶级职业扑克选手
  • 微软AI在语音识别方面击败人类

当然了,摩托车只是我个人关心的用于打趣的所举的一个例子,但不难想象,在人类可见(或者也许是不可见的)的图像中提取任何知识。潜藏在Google捕捉来的数百万张图片背后,却有很多线索来描述着这些城市的生活质量。

这里有一个快速健全的检查方法,去检验我们知道的某些事情到底是否真实。我们为阿姆斯特丹拍摄另外了一万张图片,并在图片中标记计算自行车的出现情况:

不考虑人口密度(或实际计算每个图像上有多少自行车),至少,直觉似乎被验证了。从计算自行车的数量和在地图上追溯儿童在建筑物及社区涂鸦的情况,这个巨大的图像数据印证了我们的移动动作是丰富众多的。

远离街道

我们当然不可能对街上看到的一切都关心。有时你必须离开热闹的街道,来个越野。举个例子,Tanel Pärnamaa在Teleport实习时做了一些工作,他从Flickr那里拿到了一组公开地理标记的照片,并使用机器视觉标记来识别海滩。有趣的是,当机器视觉数据信号受限时,他发现了很多沙地高尔夫球场。

更甚者,随着Planet再次发射的那88颗卫星进入轨道,我们又有了另一个惊人的可以让AI技术进入的图像源。这样一来,数据量将呈指数增长,而我们对城市生活质量的理解也随之增长。

选择你的工作,选择你的城市,选择你的生活!

我们的一个投资者说道:“电脑和互联网的传播将把工作分为两类:告诉电脑做什么的人,以及被电脑告知要做什么的人。”

我看到我们站内一些在任者花了大价钱以捕获那些可以用代码完成的事情。而我却相信,通过机器学习和众包获得的效率将为我们提供了巨大的竞争优势,长远来说,我渴望看到它将如何发挥作用。

同时,我要对那些更倾向于告诉电脑怎么做的人们一些具挑战性的事实:

  • 如何在各地理区域分布您的代理/探测器,同时使各种偏差实现最小化(由城市面积大小,人口密度等引起的)
  • 为了促进公平的比较,应该如何规范化的捕捉城市地区的数据?
  • 如何避免在近景中出现的重复计数?
  • 如何在统计中减少天气,季节,白天等的影响?
  • 如何优化观看角度,在每个坐标中采样或组合图像以被运用到360度视图中?
  • 从图像提取生活质量数据后,要如何构建/训练这些特定目标的模型?
  • 最后,那些从公共图片捕捉来的数据也许与生活质量相互对应,并且也有可能影响你决定接下来要搬去哪儿?

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

本文系作者 图普科技 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
分享到:

第一时间获取TMT行业新鲜资讯和深度商业分析,请在微信公众账号中搜索「钛媒体」或者「taimeiti」,或用手机扫描左方二维码,即可获得钛媒体每日精华内容推送和最优搜索体验,并参与编辑活动。

图普科技
图普科技

图普科技是一家将图像识别技术应用于企业服务领域的科技公司,创新打造了国内最大最全面的图像识别云平台。我们为企业提供智能审核、图片增值、图像搜索、深度定制服务。

评论(0

Oh! no

您是否确认要删除该条评论吗?

分享到微信朋友圈