新闻资讯
网站首页 >  新闻资讯
重点实验室师生参加数据库领域顶级国际会议VLDB2021并做多项报告

发布日期:2021-08-27  访问量:

    2021816-20数据库领域顶级国际会议VLDB 2021在丹麦哥本哈根举行。我校数据工程与知识工程教育部重点实验室范举副教授、重点实验室研究员、高瓴人工智能学院魏哲巍教授、以及多位研究生通过线上的方式参加了会议并做研究论文报告与圆桌论坛报告。范举副教授还获得了大会的VLDB 2021 Distinguished Reviewer Award奖。


    817日,范举副教授与硕士研究生涂荐泓、博士研究生刘同禹先后做了题为“RPT: Relational Pre-trained Transformer Is Almost All You Need towards Democratizing Data Preparation”与“Adaptive Data Augmentation for Supervised Learning over Missing Data的研究论文报告。第一篇论文是与美国麻省理工学院、卡塔尔计算研究所、清华大学合作的论文,范举副教授为论文的通讯作者。论文设计了一个面向关系数据模型的预训练模型,并探讨了如何应用于解决占据数据科学家80%时间以上的数据准备任务,包括信息抽取、数据集成与清洗等。第二篇论文设计了一种基于生成对抗网络的自适应性数据迁移框架,通过将源数据的缺失模式向目标数据对齐的方式,来消除因缺失模式不同而引起的数据分布偏移现象,提高下游模型在机器学习任务的表现。刘同禹为该工作的第一作者,范举副教授为通讯作者。


    818日,范举副教授参与了大会的圆桌论坛“Learning based Algorithms”(学习式算法),该论坛由香港科技大学(广州)的Wei Wang教授与墨尔本大学的Junhao Gan教授组织,主题是探讨学习式算法的复杂性理论、设计方法与成本、可迁移性等问题的研究现状与发展趋势。参与讨论的还有墨尔本大学的Renata Borovica-Gajic、奥尔堡大学的Bin Yang和阿里巴巴的Yaliang Li


    另外,重点实验室研究员、高瓴人工智能学院魏哲巍教授也有两篇论文在VLDB2021上发表。论文“Massively Parallel Algorithms for Personalized PageRank是与香港中文大学的合作论文,魏哲巍教授为论文的共同通讯作者。该论文重点关注Personalized PageRank (PPR) 的并行计算问题基于Massively Parallel Computing (MPC) 模型,在固定机器负载的前提下,设计了一种通讯轮数(rounds)更少的并行PPR算法Delta-Push论文“FlashP: An Analytical Pipeline for Real-time Forecasting of Time-Series Relational Data 是魏哲巍教授与阿里巴巴合作的成果提出了一种平滑采样算法GSW,并以此构建了实时预测系统FlashP,大幅提升了大规模时序预测系统的扩展性。


    魏哲巍教授参与了大会的圆桌论坛“Graph Embedding and Mining”,该论坛奥胡斯大学Davide Mottin教授和香港中文大学的王思博教授组织,关注于目前图表示学习研究中关键方法、核心瓶颈和未来的研究方向。参与讨论的还有西蒙菲莎大学裴健纽约州立大学石溪分校Steve Skiena慕尼黑工业大学Stephan Günnemann、清华大学的崔鹏、斯坦福大学的Jure Leskovec和京东的吴凌飞


附:完整论文信息

1 RPT: Relational Pre-trained Transformer Is Almost All You Need towards Democratizing Data Preparation

链接:www.vldb.org/pvldb/vol14/p1254-tang.pdf

2】“Adaptive Data Augmentation for Supervised Learning over Missing Data

链接:www.vldb.org/pvldb/vol14/p1202-fan.pdf

3 VLDB 2021 Distinguished Reviewer Awards

链接:http://vldb.org/2021/?conference-awards

4 Massively Parallel Algorithms for Personalized PageRank

链接:http://vldb.org/pvldb/vol14/p1668-wang.pdf

5 FlashP: An Analytical Pipeline for Real-time Forecasting of Time-Series Relational Data

链接:http://www.vldb.org/pvldb/vol14/p721-ding.pdf