盘点 | 支付宝聚焦AI前沿技术与应用实践的2019

302

2019年,是人工智能与机器学习技术快速发展的一年。对于蚂蚁金服而言,过去一年的人工智能技术、产品、解决方案及研究成果已经在 NeurIPS、KDD、ICML、SIGMOD、SIGIR 等各大国际顶会上陆续亮相,为学界带来了诸多来自实际业务场景的创新研究和应用分享。

正如《哈佛商业评论》2020一月刊里文章提到:蚂蚁金服所服务的客户数量是美国最大银行的10倍多,员工数量却不到其十分之一。不同于传统金融机构,蚂蚁金服所提供的消费信贷、货币基金、财富管理、医疗保险、信用评级,甚至是蚂蚁森林等各种各样的服务,其关键路径均是“无人工”的模式,从而使得业务能够实现快速增长与突破,而这主要得益于背后的人工智能技术与海量的支付宝数据,“AI runs the show”。

紧抓核心技术能力 持续沉淀基础研究应用成果

在人工智能领域,过去一年蚂蚁金服相继在 NeurIPS、ICML、ICLR、AAAI、IJCAI、SIGIR、NAACL、VLDB、ACM T-IST、KDD、CVPR 等全球顶级学术会议和期刊发表多篇论文成果,涵盖计算机视觉、NLP、机器学习等领域,并在大型分布式机器学习、强化学习、图机器学习、无监督学习、数据挖掘等方向均取得突破,这些技术在解决金融场景复杂动态网络、对抗性、鲁棒性、安全性、外部性风险与信息不完备性、实时性等问题上均发挥了重要作用。

比如在2019年6月的 ICML 会议(International Conference on Machine Learning,即国际机器学习大会)上,支付宝AI技术团队即贡献了多篇前沿论文研究成果。包括提出了用生成对抗用户模型来解决强化学习小样本的问题,并将此方法用于优化推荐系统;提出粒子流贝叶斯定理(particle flow Bayes'Rule)算法,实现对高维贝叶斯推理的精确度和计算效率的提升优化等等。

在支付宝业务资金链路和运力优化等场景会涉及组合优化和整数规划问题,车辆路径规划作为该类问题的经典场景,支付宝AI团队提出一套新的 CVRP 算法进行求解(ICLR2020),能够有效发挥机器学习和传统运筹优化各自长处,对比 Google OR-tools提升了10%,并优于 FAIR,Google 以及各种AI顶会的结果。

为了提升AI模型在金融业务场景的安全性和鲁棒性,支付宝AI团队通过深度对抗学习等相关技术打造了体系化的解决方案。例如借助于动态网络中可解释的分层信道选择,显式地将网络决策路径可视化,并提出了一种对抗性实例检测算法(AAAI 2019),该方法能够获得更高的预测精度,并显著提高多个攻击的检测率。而面对支付金融场景对模型鲁棒性的要求,首创了三种可显著降低一些图神经网络模型效果的攻击手段(ICML 2018):基于层次强化学习的攻击、基于遗传算法的攻击和基于梯度的攻击。并提出针对性的对抗训练方法,从而提升模型的鲁棒性和安全性。

同时,为了更高效提取特征,支付宝AI团队开发了 SAFE: Scalable Automatic Feature Engineering Framework for Industrial Tasks (ICDE 2020),从而满足金融场景下对高适用性、分布式计算与实时推理的强需求。

由于金融市场天然具备的外部性风险与信息不完备性,蚂蚁金服在博弈论与多智能体等前沿技术上也在持续投入研究与应用探索。包括提出了 Double Neural Counterfactual Regret Minimization 计算框架(ICLR 2020,以第一单位论文发表),使得CFR可求解超大规模非完全信息博弈IIG问题,同时提出了 mini-batch robust sampling 算法,使得 Monte Carlo CFR 算法收敛速度大幅提升,在双人非限制性德州扑克游戏中,该算法可以收敛到与传统 CFR 算法相似的结果,而存储空间却不到其200分之一;另外还提出了一种比 Discounted CFR 更快收敛的CFR算法,在非限制性德州扑克中,该算法比 DeepStack 中的 Hybrid CFR 算法收敛速度快两倍。

金融市场通常面临复杂动态网络里的多智能体问题,蚂蚁金服创新性提出 value propagation 算法用以解决多智能体问题。具体而言,该算法去中心化训练和去中心化执行场景中 multi-agent reinforcement learning 的值函数传播问题。该方法可用于解决目前多智能体问题面临的诸多挑战:比如多个 agent 如何在只观测到自己奖励函数的情况下学会合作,以及 multi-agent reinforcement learning 算法的收敛性等。在资金优化和交通控制等业务场景中该算法有着广阔的应用场景。

深度学习面临的一大挑战是如何在理解的基础上做推理。在 NLP 里的推理问题上,近日蚂蚁金服的一项工作超越其他科技公司登顶数字离散推理 DROP 榜单。DROP 与传统 MRC 数据集的主要区别在于需要根据问题和上下文做数字逻辑推理才能得出正确答案。主要方法是通过构建数字、日期等常识符号图谱,并基于 GCN 建图,使用 Hard-EM 算法对推理表达式的隐变量进行迭代学习。此外,如何处理海量信息、提升服务效率也已成为国际顶会重点关注话题,在展示信息检索领域 SIGIR 2019 顶会上,支付宝AI团队提出利用强化学习预测用户意图,实现“未问先答”的功能。

这些智能服务背后,少不了蚂蚁金服自主研发的金融级分布式关系数据库 OceanBase 的支撑。在2019年最新发布的 TPC-C 测试排行榜中,OceanBase 超越 Oracle 荣登榜首。目前,除了支持蚂蚁金服自有业务、阿里巴巴集团双十一的流量考验以外,还支持着数十家金融机构的业务。

可以说,国际顶会上诸多基础研究与应用创新成果分享,让蚂蚁金服成为全球学界和工业界不可忽视的力量。而基于蚂蚁金服十五年演进并全面对外开放的“BASIC”技术体系,更多基础研究应用成果因为也将逐渐在产业应用中落地。

提高AI落地服务水平 以技术创新推动普惠金融

实际上,顶级学术会议交流的火热,一方面可推进基础技术最前沿研究的发展,将学术研究与应用相结合,另一方面可推进前沿技术在实际应用中落地,为用户带来价值。正如此前蚂蚁金服副总裁及首席AI科学家漆远所表示的,“发展和使用人工智能技术,我们能够为蚂蚁金服全球超过12亿的用户解决真正的问题,提供真正有意义的服务。”

比如早在2005年,支付宝便率先推出“你敢付,我敢赔”,承诺如果账户被盗全额赔付。2019年,支付宝又将其升级为“秒赔”+“先赔”:用户的投诉如果经AI确定,赔付能秒到账;如果案件存疑,也会先赔再说。在此背后,正是支付宝安全团队在 KDD CUP 2019 大赛上获得全球第一的AI应用能力。

基于丰富的人工智能技术应用场景,目前蚂蚁金服已经沉淀了业界领先的分布式机器学习平台支持大规模深度图算法、在线学习、共享学习、强化学习等能力,以及金融视觉、金融知识图谱、机器人平台、NLP平台等通用能力。

以大规模深度图算法的应用实践为例,面对金融场景可解释性的要求,蚂蚁金服在 AAAI 2019 的多篇论文中介绍了如何在图机器学习过程中引入了 attention 机制来学习不同广度/深度邻居的重要性,以及异质信息的重要性。这些算法不仅为不同类型图数据提供更强大的表达学习能力,同时也提供不同层次的可解释性,目前已应用于智能营销、信用风险、安全风控等多个支付金融场景,极大降低了产品运营成本和欺诈资损从而提高业务收入。

而在2019年关于机器学习和计算神经科学的国际会议——NeurIPS(全称神经信息处理系统大会)上,蚂蚁金服也有多篇论文入选,聚焦 GAN、GNN、深度强化学习等课题。在 NeurIPS 2019 展台现场还展出了基于图像识别、环保知识图谱等技术的智能垃圾分类小程序和智能回收箱视频,观众可通过手机拍照轻松识别垃圾物品和对应的垃圾类别,现场体验来自东方的“生活小助手”。目前,这套图像识别技术已逐步开放给行业伙伴。利用支付宝的海量用户覆盖能力和城市服务的便民心智,结合 AI+IoT 技术,实现人工智能识别垃圾和分类,用科技推动个人与企业单位参与垃圾分类回收的积极性和处理效能。

此外,蚂蚁金服在声纹技术方面部分工作发表在国际语音顶会 IEEE ASRU 2019。在获得同行评审专家的高度认可的同时,该创新技术已经在支付宝 APP 无线端声纹业务落地,有效提高了安全性和用户体验。

随着研究发展、顶会的大热,AI、区块链、计算系统等原本看起来“只可远观”的技术已不断获得突破,实实在在地为我们的生活服务带来改变。2019年已经翻篇,蚂蚁金服AI研究的步伐也逐渐加快,AI技术落地服务水平迅速提高,通过技术创新和科技开放更好地推动普惠金融发展,带来更加美好的智能生活。