SMP 2020 数据挖掘论坛

 

论坛时间:2020年9月6日 上午 10:30-12:30

论坛简介: 数据挖掘是计算机学科相关研究中的热点,其具体研究涵盖理论、关键技术以及计算机核心应用等各个方面。随着大数据时代的到来,人们需要日益强大的挖掘与分析能力,应用于安全和商务领域,根据用户通过电子商务、互联网、电话通信、电子邮箱所留下的更多的生活痕迹,为期提供更全面、更精准、更安全的服务;同时,数据挖掘技术亦需要被应用于气象学、天文学等领域,分析各类设备所传回的愈发难以驾驭的数据流所包含的关键信息。本次论坛邀请了来自清华大学、北京大学、华为诺亚方舟实验室和网易伏羲游戏人工智能实验室的四位专家讲者,分别从(1)稳定学习:因果约束的机器学习;(2)子图结构特征提取驱动的图神经网络模型;(3)面向推荐系统的反事实学习研究;和(4)大数据画像技术在游戏中的研究与应用等四个方面展现数据挖掘研究的前沿动态。

 

论坛主席:况琨 浙江大学计算机学院助理教授

 

主席简介:况琨,浙江大学计算机学院助理教授(讲师)。主要研究方向包括因果推理、稳定学习、可解释性机器学习以及XAI在医疗、法律、教育等领域的相关应用。在数据挖掘和机器学习领域已发表20余篇顶级会议和期刊文章,包括KDD、ICML、MM、AAAI、TKDE、TKDD、Engineering等。曾担任 NIPS, AAAI, IJCAI, CIKM, ICDM 等国际学术会议程序委员会委员。2019年获得清华大学计算机科学与技术专业博士学位,2017-2018年访问美国斯坦福大学。

 

 

 

 

 

论坛嘉宾:

嘉宾一

嘉宾姓名:崔鹏 清华大学 长聘副教授

报告主题:Stable Learning: The Convergence of Causal Inference and Machine Learning

报告摘要:Predicting future outcome values based on their observed features using a model estimated on a training data set in a common machine learning problem. Many learning algorithms have been proposed and shown to be successful when the test data and training data come from the same distribution. However, the best-performing models for a given distribution of training data typically exploit subtle statistical relationships among features, making them potentially more prone to prediction error when applied to test data whose distribution differs from that in training data. How to develop learning models that are stable and robust to shifts in data is of paramount importance for both academic research and real applications. Causal inference, which refers to the process of drawing a conclusion about a causal connection based on the conditions of the occurrence of an effect, is a powerful statistical modeling tool for explanatory and stable learning. In this talk, we focus on causal inference and stable learning, aiming to explore causal knowledge from observational data to improve the interpretability and stability of machine learning algorithms.

嘉宾简介:Peng Cui is an Associate Professor with tenure in Tsinghua University. He got his PhD degree from Tsinghua University in 2010. His research interests include causally-regularized machine learning, network representation learning, and social dynamics modeling. He has published more than 100 papers in prestigious conferences and journals in data mining and multimedia. His recent research won the IEEE Multimedia Best Department Paper Award, SIGKDD 2016 Best Paper Finalist, ICDM 2015 Best Student Paper Award, SIGKDD 2014 Best Paper Finalist, IEEE ICME 2014 Best Paper Award, ACM MM12 Grand Challenge Multimodal Award, and MMM13 Best Paper Award. He is the Associate Editors of IEEE TKDE, IEEE TBD, ACM TIST, and ACM TOMM etc., and the program co-chair of ACM CIKM19 and MMM2020. He is a Senior Member of CCF and IEEE.

 

 

嘉宾二

嘉宾姓名:宋国杰 北京大学 副教授

报告主题:子图结构特征提取驱动的图神经网络模型

报告摘要:图数据是最为普适的数据存在形式,任何数据总可以显示或者隐式的用图来建模。对图数据的高效表征是图数据挖掘和机器学习任务的关键。作为一类重要的网络表征学习方法,图神经网络(GNN)研究备受关注。本报告要解决的基本问题是“如何将网络的子图结构信息有机融入图神经网络的表征学习之中”。具体报告内容如下:(1)子图结构信息的高效提取;(2)基于子图结构信息的GNN模型;(3)面向子图结构分布的GNN模型;并对此问题未来研究进行展望。

嘉宾简介:宋国杰,北京大学副教授。研究方向包括:网络大数据挖掘、机器学习、社会网络分析和智能交通系统。主持了包括国家重点研发计划、高技术研究发展计划(863计划)、国家科技支撑计划、国家自然科学基金等10多项国家级纵向课题,以及20余项横向合作课题。国家级精品课程《数据结构与算法》的主讲教师,两度获得北京大学教学成果一等奖。在包括国际顶级期刊TKDE、TPDS以及国际顶级会议KDD、WWW、AAAI、IJCAI等发表论文100余篇,是多个国际顶级会议(WWW、IJCAI等)的资深程序委员,是Expert Systems with Applications, Machine Learning with Applications等多个知名国际期刊编委。论文获得CIKM2019年最佳论文奖提名以及ESI高被引,研究成果获得省部级一等奖3次。

 

 

嘉宾三

嘉宾姓名:董振华 华为诺亚方舟实验室 技术专家

报告主题:面向推荐系统的反事实学习研究

报告摘要:推荐、搜索系统存在大量的偏置问题,严重影响了模型的预测精度和用户体验, 如何有效纠偏成为了亟待解决的问题,我们将目光投向反事实学习技术。本次报告将介绍面向推荐系统的反事实学习4种技术方案,即:1. 学习对未观察数据,构建全样本空间;2.纠正有偏数据;3. 双重鲁邦学习;4. 无偏数据学习。并通过理论分析和实验验证,证明所述方法的有效性。以上研究成果在SIGIR,RecSys,CIKM等学术会议发表,并应用于实际产品。

嘉宾简介:董振华,华为诺亚方舟实验室技术专家,研究兴趣为推荐系统、反事实学习、稳定学习。董博士致力于应用先进的机器学习技术为用户创造价值,其团队研发的推荐系统技术已经落地到华为信息流、应用市场、服务直达、广告CTR预估等场景,在提升用户体验和平台收入的同时,在TOIS、SIGIR、RecSys、WWW、AAAI等期刊与国际会议上产出20多篇相关高水平论文,申请20多篇专利,并在ACM KDD、SIGAPP等会议担任程序委员会成员,并担任KDD、TOIS、ICDM、SAC的审稿人。董博士本科就读于天津大学,博士毕业于南开大学,曾作为访问学者在明尼苏达大学GroupLens实验室访问交流。

 

 

嘉宾四

嘉宾姓名:陶建容 网易伏羲游戏人工智能实验室,画像方向负责人

报告主题:大数据画像技术在游戏中的研究与应用

报告摘要:随着信息技术的飞速发展与互联网技术的全面普及,人类社会已经进入大数据时代,利用人工智能等前沿技术进行改造升级已成为各行各业的必然趋势。随着网络游戏的普及,游戏玩家开始追求更加个性的游戏体验性以及更高质量的游戏娱乐性,利用以游戏玩家为中心的用户数据建立千人千面的画像智能服务,已成为游戏领域长久以来的研究热点与落地重点。游戏产业为画像智能服务研究提供了良好的数据基础和丰富的应用场景,而智能服务研究又能反过来提升游戏服务品质,延长游戏生命力,形成良性循环。

网易伏羲游戏人工智能实验室依托游戏平台的海量数据,以提升用户体验为出发点,发掘用户数据中的潜在模式和隐含规律,实现人工智能技术在实际游戏场景中的应用落地,如外挂检测、智能推荐、战场匹配、预测归因等,并推动面向用户的人工智能技术不断发展。

嘉宾简介:陶建容(风天),浙江大学工程师学院博士,网易伏羲游戏人工智能实验室画像方向负责人,主要研究“面向游戏的智能画像服务系统与平台”,致力于解决游戏中外挂检测、智能推荐、战场匹配、预测归因等重点难题。在KDD、CIKM、Ubicomp、TKDE、TKDD等国际顶级学术会议及期刊发表近20篇论文,获得Ubicomp2016最佳论文奖、CoG2020最佳论文奖提名,曾担任CIKM、ICDM、IJCAI等国际学术会议程序委员会委员。相关研究成果在网易多款游戏中投入应用,如《逆水寒》、《倩女幽魂》、《天谕》、《荒野行动》、《流星群侠传》等,并申请20多项相关技术专利,获得2018-2019杭州市滨江区青年科技英才认定。

 

 

 
 
 

联系我们

杨洋浙江大学yangya@zju.edu.cn

东昱晓微软雷蒙德研究院yuxdong@microsoft.com