信息科学与技术学院2018年系列学术活动(三)

来源:信息科学与技术学院发稿时间:2018-07-25 浏览次数:867


  报告题目: 分布式机器学习算法的系统优化

  报告时间:2018年7月28日上午10:30-13:00

  报告地点:信息科学与技术学院三楼会议室(绿2-303)

  报告个人简介:

  崔斌,北京大学信息学院长江学者特聘教授,网络与信息系统研究所长。他的研究方向包括数据库系统设计和性能优化、数据挖掘、大数据管理和分析等,在相关领域发表了100多篇学术论文,包括ACM SIGMOD、VLDB、IEEE ICDE、TKDE等。他主持和承担多个科研项目,如国家自然科学基金、核高基项目、863计划等。他担任中国计算机学会数据库专委会秘书长,VLDB理事会理事,IEEE TKDE、VLDB Journal、Information Systems、DAPD等国际期刊编委,担任过数十个国际会议的程序委员会委员,包括一流国际会议SIGMOD、VLDB、ICDE、KDD等。他是中国计算机学会杰出会员,IEEE高级会员,ACM会员,于2008年获得微软亚洲研究院的“微软青年教授奖”,2009年获得中国计算机学会 “CCF 青年科学家奖”,2014年获教育部自然科学二等奖。

  报告简介:

  分布式机器学习算法已经被广泛地用于大规模数据分析与挖掘。在分布式机器学习系统中,我们需要考虑一些对系统性能有重要影响的因素,如并行策略、同步协议和网络通信等。报告将介绍我们在分布式机器学习系统设计优化的一些工作,包括面向高维海量数据的并行策略、面向异构环境的同步协议、基于数据草图的梯度压缩方法。报告最后也将介绍北京大学与腾讯合作研发的分布式机器学习系统Angel,系统针对海量训练数据和高维的模型参数做了深度优化,在易用性、稳定性、可扩展性等方面获得了良好的效果,并支持多种不同类型的机器学习算法。Angel系统作为腾讯第三代高性能机器学习计算平台,已经在腾讯的多个实际业务中得到了应用,并在GitHub开源 (https://github.com/Tencent/angel)。