[每篇 3 分钟,钛媒体带你读懂人工智能]
在 AI 领域,“机器学习”是较难理解的概念之一。
在谈论机器学习之前,我们有必要以具象的方式解释下算法,为了方便理解,北京邮电大学信息学博士、前百度技术管理部首席专家李敏就以数学公式的形态给钛媒体举例:
当我们为机器学习设定一个目标:比如让互联网广告被点击的频率增加,算法科学家就会基于经验与实践形成一个初步的算法模型,假设为:
F(x)=a+bx+cx²+dx³+……
这个公式就可以被视作极简的一种算法。其中,F(x) 就是互联网广告被点击的概率,x 是我们常说的用户画像和搜索关键词,诸如年龄、性别、喜好等维度都会以数值的形式被代入公式,而 a、b、c、d……就是所谓的参数。科学家们整日实验操作的,就是想方设法通过参数的调整,让F(x)的数值达到理想化的状态。
当然,在真实的机器学习场景中,算法的形态要比上述“公式”复杂数倍,调参的标准也需基于不同业务的特性。而在算法的性能得到提升并趋于稳定后,机器就能利用这套打磨好的算法,实现自动化的评估和判断,这就形成一个“全自动机器学习平台”。
这也是李敏正在做的事情。
2017年6月,李敏与前百度资深科学家夏粉等人成立“智铀科技”。夏粉是百度大规模机器学习平台 Pulsar 创立者,在百度的各业务线中,Pulsar 被广泛应用,举个例子:百度的搜索结果成千上万,而机器学习就能对用户画像、广告标签进行算法处理,让搜索结果既满足用户需求,也能具备潜在的营销机会。
为了将 Pulsar 这样的机器学习平台扩展至更多领域,“智铀科技”推出了更为通用的 “Ebrain”平台,用机器来取代人工的模型调参,实现自动建模,而在产品商用落地的过程中,降低 Ebrain 的使用门槛是智铀开发产品的首要目标。
凭着此前在百度的积累,智铀在算法调参、建模等方面较为擅长,包括怎么梳理客户的数据特征;怎么提炼用户画像和业务维度;如何调整参数让 F(x) 的效果更好,智铀可以将这些需要算法科学家完成的工作打包成一个 PC 端的产品,工程师只要将已有的数据导入“Ebrain”系统,就可实现机器的自主学习与判断。
“比如信用卡盗刷事件的响应与预防。信用卡公司将之前出现盗刷案例的时间、频次、盗刷 pos 机类别等规律性特征给我,就能通过 Ebrain 进行学习后对之后的盗刷情况进行识别和预警。”李敏用金融行业的产品落地为钛媒体举例。
目前,智铀科技已与部分基因、金融行业客户进行合作试点,并计划在6 月上旬正式推出商用产品,2018年初智铀曾获由洪泰基金领投的 Pre-A轮融资,投后估值达4亿元。(本文首发钛媒体,作者/苏建勋)
根据《网络安全法》实名制要求,请绑定手机号后发表评论
你那个公式是算法不是搜索吧?