新闻资讯
网站首页 >  新闻资讯
我实验室两位博士生论文被国际顶级数据库会议VLDB 2016接受为长文

发布日期:2015-09-09  访问量:

    近日,我实验室两位博士生:刘钰和史巨伟,作为第一作者的论文由国际顶级数据库会议VLDB 2016录取,两位博士生的导师都是陆嘉恒教授。

    第一篇刘钰的论文标题是:“Towards Maximum Independent Sets on Massive Graphs”。该论文主要解决在大规模图上近似计算最大独立集问题,提出了基于半外存的Greedy算法和Vertex-Swap算法框架,在I/O高效的前提下得到了非常接近最大独立集的解;并且在power law图模型下给出了较优的期望近似比(expected approximation ratio)。由于计算最大独立集是NP-complete问题(即使对power law分布的图),该论文首次在大规模图上提出了实际可行的较优算法。

    第二篇史巨伟的论文标题是: Clash of the Titans: MapReduce vs. Spark for Large Scale Data Analytics。在目前的大数据时代,有各种各样大数据处理平台。其中Mapreduce和Spark是两个主流的开源平台。本文通过一系列完整的实验比较了两个平台的优缺点。在相同的机器环境中,我们的实验表明:针对wordcount,k-means和Pagerank任务, Spark 分别比Mapreduce 快 2.5倍,5倍和3倍。但是针对Sort任务, Mapreduce 却比Spark快两倍。这个实验结果纠正了以往通常认为Spark 总是比Mapreduce 运行的更快的观念。 本文对于目前大数据项目中的平台选择具有较好的参考价值。

    注:国际数据库顶级会议VLDB 2016将于2016年9月5-9日在印度新德里举行。作为数据库领域具有最高学术地位的国际性学术会议之一,其平均论文录用率低于20%。