所谓迁移学习,其实就是AI在GTA5里考下的那本驾照

摘要: 让机器也能举一反三、融会贯通。

我们都在歌颂人工智能的伟大,但我们都知道,如今的人工智能对我们生活的改变,很多都基于计算能力的增强、数据量的庞大和算法架构的优化。可自然环境中无穷无尽的变量、每个用户也有不同的个性化需要,这一切都在增加着人工智能算法的应用难度。

最关键的是,很多时候我们很难针对每一个应用模式都寻找到一个相应的数据库,从而进一步阻碍了算法的实际应用。

面对这个问题,很多专家把希望寄托于迁移学习之上。今天就来聊聊,迁移学习到底是个什么鬼,还有它会怎样改变人工智能的应用。

迁移学习——让机器融会贯通

在目前的机器学习中常常出现这种情况,当我们想教会机器辨识一张图片上动物是猫还是狗时,我们需要大量的猫狗图片数据。好不容易教会了,当把问题换成图片上的动物是老虎还是狼时,过去的训练无法发挥一点作用,只能从头开始。又比如说,我们利用白天街景训练出了一个在可以马路上识别行人的模型,可到了晚上,这一模型的表现却糟糕的令人咋舌。

类似的情况正在不断的增加着机器学习应用场景的限制和成本,原因就在于机器缺少在学习上的迁移。什么叫学习上的迁移?就是当你学习过法语再学英语,学习速度会比只懂中文的人更快。让机器在学习时可以举一反三和融汇贯通,是迁移学习的最终目的。

学会抽象思考是迁移学习的第一步

那么机器究竟是怎么迁移学习的?用一句形象的话说,是机器学会了抽取概念。

比如说,我们可以为机器模拟出一个训练环境,就像玩游戏时的模拟教学关卡,学会了怎么玩,再走去面对各种各样的真实游戏情况。当然,这样学习方式一定要建立在模拟数据和现实数据十分相似的前提下。所谓迁移的程度也就大大的降低了。

除此之外,迁移学习也可以让机器通过特征进行迁移。如上文提到的从辨识猫狗到辨识狼虎,机器可以从猫与狗的区别中提出长/短吻、耳朵形状等等特征,将这些特征差异与不同答案的对应模式应用于狼与老虎的判断中。 

其他的还有结合深度神经网络来进行基于模型的迁移,比如我们利用大量语料进行了基于普通话的语音识别训练,当我们开始进行基于山东话的语音识别训练时,虽然不能直接使用普通话的模型,但可以基于原有的模型,只需要少量的语料就可以完成训练了。

相比“直接”的迁移模型,我们目前更多的还是在利用迁移学习减少模型训练成本。如今迁移学习还在不断的发展中,出现了层次型的迁移学习,把问题分层,将能够应用原有模型的层次固定,在其他层次再进行训练。还有传导式的迁移学习、迁移学习方式获取等等。

迁移学习怎么应用?在GTA5里训练无人驾驶!

说了这么多,其实我们最关心的还是迁移学习的实际应用。

最容易理解的迁移学习,存在于机器模拟训练环境之中。最典型的就是DeepMind通过仿真环境训练机械手臂的案例,没错就是那个拥有阿尔法狗的DeepMind,在2015年,DeepMind就将其作为推最新研究成果推出。最近又出现了无人驾驶项目Deep Drive在GTA5里训练AI。

利用模拟环境训练机器,虽然暂时不会加快家务机器人的应用,但对于工业生产来说,极大的降低了智能化的成本。对于各种工业作业的不同需求,应用机械也需要不同的算法模型,可直接在实物上训练意味着巨大的成本。这时利用迁移学习的模拟训练就能解决很多工业方面的需要。同时在无人驾驶上,很多平台也都开放了自身的模拟器,帮助无人驾驶实现更快速的训练。

除了模拟之外特征识别也有很广的应用,最典型的就是对用户在通用领域的喜好迁移到个别领域之上。最典型的就是根据以往数据,得知用户喜欢推理电影,在为用户推荐书籍时,也会为其优先推荐推理小说。不仅仅让智能推荐更加准确,在一些人机会话中,也可以通过增强对用户的了解而减少对话的步骤。

除了以上两点外,迁移学习还有大量应用案例。业内有人认为从深度学习到增强学习再到迁移学习的过程中,我们对数据的依赖程度越来越轻,所以迁移学习相比另外两者更加“高级”。不过我们也可以换个思路,正确的了解和看待每一种学习方式,或许多种理论的交会和共同发展才真正有益于机器学习。

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

本文系作者 脑极体 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
分享到:

第一时间获取TMT行业新鲜资讯和深度商业分析,请在微信公众账号中搜索「钛媒体」或者「taimeiti」,或用手机扫描左方二维码,即可获得钛媒体每日精华内容推送和最优搜索体验,并参与编辑活动。

脑极体
脑极体

写让你脑洞大开且能看懂的人工智能、流媒体、海外科技

评论(0

Oh! no

您是否确认要删除该条评论吗?

分享到微信朋友圈