首页 资讯频道 互联频道 智能频道 网络 数据频道 安全频道 服务器频道 存储频道

三个Kaggle Grandmaster,支付宝安全为何这么多数据大牛?

2020-04-08 18:20:35 来源 : 财讯网

在前段时间的2020支付宝合作伙伴大会上,已有12亿用户的支付宝宣布转型数字生活开放平台。海量用户,还要对外开放,在这背后,需要极强的安全风控能力。但一般人不知道的是,如此重大艰巨的任务背后,也有着历届应届生的功劳。

应届生如何参与支付宝安全风控的核心研发?我们找到了支付宝安全部门的资深技术专家王维强,请他给我们做一下介绍。

支付宝安全团队的数据大牛们

随着时代发展,业务安全风控逐渐走入人工智能时代,支付宝安全团队就招募了几位Kaggle Grandmaster。

Kaggle是安东尼·高德布卢姆(Anthony Goldbloom)2010年在墨尔本创立的,主要为开发商和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码的平台。该平台已经吸引了超过100万名数据科学家的关注,可以说是数据科学行业最大的交流平台。

Kaggle Grandmaster是在Kaggle Competitions平台上举办的比赛中,连续取得非常优异的成绩才会获得的头衔,可以说是数据科学方面万里挑一的顶级高手。目前,Kaggle只有180位Grandmaster。

支付宝安全团队近几年陆续招募了三位Kaggle Grandmaster,他们的强项各不一样,有的擅长对结构化数据进行特征挖掘,有的对图像检测识别非常精通,还有的对NLP、深度文本挖掘方面很有研究。

崔世文就是其中的一位,在2019年,他和蚂蚁的其它几个小伙伴们组队,利用业余时间在KDD Cup 2019 Regular ML Track全球竞赛中获得冠军,这项比赛被誉为数据挖掘界的奥林匹克。

除此之外,团队在过去两年的蚂蚁金服数据挖掘内部赛中连续获得冠军。也更是在专业赛道比如CCL2019中国法研杯比赛,获得了总分第一。

说起如何找到这些高手,王维强直言是机缘巧合。原来团队里有同学在Kaggle平台上参加比赛交流,通过选手之间的交流知道了圈内的牛人,而支付宝安全团队也刚好需要这个领域的高手加入,于是伸出了橄榄枝。

对于这些数据大牛来说,选择是双向的,他们并不缺乏工作机会,但很多人希望能够有一个较好的平台能够一展所长,或者身边有牛人可以互相交流学习。

支付宝安全团队的业务非常有挑战性,团队拥有数据科学领域各个方面的人才,横向学习的氛围很浓。也正是这些原因,让这些大牛心甘情愿的加入团队。其中还有一位同学拒掉了外部的高薪offer来到蚂蚁,因为短期利益不如长期价值。

另外,他们也认可支付宝安全团队所做的事情,认可支付宝对于用户和社会的价值,认同支付宝做事情简单的价值观,跟一群有情有义的人去做一些有意义的事情。

做安全为何要这么多数据人才

支付宝安全团队需要保护12亿用户的账户和资金安全,责任重大,那么他们具体需要做哪些事情呢?

业务上来讲,安全团队需要负责建设和维护支付宝账号体系、资金交易、商家服务的一整套业务安全防控机制。比如用户的账号是不是被盗了,某笔交易是不是被诈骗了,交易是否用于违规违禁用途如赌博等,还有如商家行为违反监管规定等,这些都会对支付宝的用户和资金造成风险,这些风险的管控就是大安全所做的事情。

在与黑产和羊毛党对抗的过程中,双方的技术都在不断升级,业务安全风控也必须应用最新的技术。随着机器学习开始在数据科学领域大放异彩,做安全的同学也开始利用人工智能来保护业务安全。

具体的手段包括,通过机器学习的算法和模型、与安全策略一起,通过数据挖掘来做风险识别和风险管控,另外也会会涉及到决策优化。

这里面的技术包括数据挖掘、机器学习、决策优化等等。机器学习很广泛,像里边的集成树模型,深度学习中的深度文本挖掘,图像识别,运筹优化,强化学习,对抗机器学习等,在支付宝的安全风控中都会使用到。

至于未来安全风控领域未来的技术趋势,王维强目前比较关注这些方向:模型可解释性,知识推理、图计算、决策优化等。首先模型可解释性,机器学习算法在业务安全落地对可解释性要求是非常高的,完全黑盒的模型可能造成不可预料的后果,这在业务安全上不可接受;其次是知识推理,前些年的机器学习通过学习做判断或预测,但推理比较少,从学习到推理是人工智能下一步的方向;然后是图计算,过去在解决业务问题时,对关系的描述还是靠人工经验,做安全需要对关系进行精细化刻画,因为需要在上亿的用户里和极少数黑产进行对抗;最后则是决策优化,这说的是更好的平衡用户的风险和安全感体验,避免只强调安全而破坏用户的体验,而这里面要做到一个什么样的程度,就是决策优化需要做的事情,对一个决策来说需要从很多角度去平衡。

总体上来讲,业务安全风控的未来将会更智能化。一方面在基础技术上,人工智能需要从学习到推理,再发展到强人工智能,才能应对更多更复杂的场景;另一方面,在安全风控场景中,我们需要更精准的去描绘更复杂的关系,从而更好的调整和应对,而这离不开AI的助力。

安全团队需要什么样的应届生

除了上面那些竞赛大牛外,还有不少校招应届生在支付宝安全团队大展拳脚。

比如,算法工程师王宝坤就是校招进来的,他来自复旦大学,2018年硕士毕业后加入团队。他负责的是图计算、图表征等比较前沿的方向,因为在大学的实验室里也是做这个方向,所以积累很深,加入团队后很快的理解业务,主动提议用图计算做团伙挖掘的场景,并取得了很好的成果。

王维强介绍说,他们希望招募到研究型+业务型的综合性人才。一方面,希望新人在机器学习和大数据分析等方面有比较深入的技术积累,对技术吃的比较透,因为团队做的是没人做过的事情,在业界也属于前沿,所以没有参考,不能套用别人的方案,别人的算法也不能拿来就用,必须要根据业务做相应的创新,而这只有对技术十分了解才能做到。

另一方面,因为安全团队是业务部门里的技术团队,市场形势复杂多变,业务也随之而快速变化,只有非常快的消化技术并理解业务,才能找到风险类型的算法落地的方案,然后把这些新的技术落地到业务里,才能拿到结果。

因此,在校生如果今后想从事业务安全风控行业的话,建议深钻技术,在掌握学校里的技术基础课程的同时,也可以去了解当前大数据和机器学习的主流和前沿技术。在实习或者做项目时,要多问几个为什么,一方面通过了解项目背景从而更好的理解业务,另一方面了解所使用的技术背后的原理,而不是知其然而不知所以然。

现在,支付宝安全团队正在招募应届生人才,欢迎投递简历。

欢迎加入支付宝安全团队

团队介绍:

支付宝大安全的机器智能团队由蚂蚁金服首席AI科学家、阿里达摩院智能金融负责人漆远博士带队,核心团队成员来自海内外知名高校毕业生和一流企业。为了更好地服务全世界十亿多用户和亿级全球商户,迎接背后的安全风险挑战,我们急需高素质的AI人才。在这里你将直接参与支付宝核心项目,解决世界级技术难题,在一流的平台上快速成长。我们既基于成熟的风控算法技术解决实际业务问题,也积极探索和拓展前沿的机器学习算法,从深度图算法到多任务学习,从增强学习到时序点过程,从保护数据隐私的机器学习到知识图谱,用创新来解决现在和未来的安全风险问题。

如果您热爱AI,喜欢解决有挑战的实际安全风险问题,欢迎申请支付宝大安全-机器智能部。

岗位介绍:

岗位名称:算法实习生

工作地点:杭州、上海

岗位描述:

1. 基于蚂蚁金服复杂数据,使用机器学习技术识别打击系统、赌博、洗钱、欺诈、盗用、非法集资、违规违禁等金融场景中的风险,检测舆情和相关风险,使用智能风控技术服务广大商家、企业和用户,同时提供智能合规服务;

2. 基于用户海量的文本、图像、音视频和用户行为等数据,进行语义建模,识别内容风险;

3. 研发对抗学习、博弈论、多智能体、强化学习、动态图算法、深度点过程、知识图谱、隐私保护的机器学习等人工智能技术在安全风控的应用和落地,结合系统和金融安全及区块链技术,打造智能风控引擎的业界标杆。

岗位要求:

1. 2020.11-2021.10毕业的本科/硕士/博士学生,国内211/985和海外知名高校的学生优先,机器学习、计算机视觉、NLP、数学、统计学、安全等相关专业优先;

2. 熟悉Python/C++/Java等编程语言;有基于Tensorflow/PyTorch等机器学习框架的开发经验;有大数据处理经验,熟悉Hadoop或者Spark等分布式处理平台;熟悉主流机器学习/深度学习相关算法和原理,包括NLP/图神经网络/图像处理/搜索推荐广告等领域;

3. 有良好的学习和沟通表达能力,有强烈的好奇心和责任感,有钻研精神;

4. 在顶级会议例如NIPS、ICML、ICLR、CCS、ACL、CVPR或期刊上发表过论文者优先;参加知名大赛获奖或者名次领先者优先;有在国内外知名公司实习工作经验者优先。

简历投递:[email protected]

相关文章

最近更新