发布日期:2020-06-05 访问量:
近日,数据工程与知识工程教育部重点实验室张峰博士的论文被计算机系统领域顶会USENIX ATC 2020长文录用。该文研究现代集成架构上的流数据SQL查询优化问题,研制了FineStream原型系统,和目前最先进的SQL流处理系统相比,可达到52%的性能提升。
USENIX组织成立于1975年,是计算机系统领域最受开发者和研究者尊敬的国际学术组织。USENIX ATC国际会议(USENIX Annual Technical Conference)是USENIX组织的技术年会,偏重系统设计与实现,是计算机系统领域具有最高学术地位的国际性会议之一,被中国计算机学会(CCF)推荐为A类会议。据了解,USENIX ATC会议发表难度大,本篇论文是我校第一篇在USENIX ATC发表的论文。USENIX ATC每年录用70篇左右的论文,录用率在20%左右。2020年投稿348篇,录用65篇,录用率为18.6%。今年的 USENIX ATC 将于7月15-17日在线上举行。
附:论文信息
论文题目:FineStream: Fine-Grained Window-Based Stream Processing on CPU-GPU Integrated Architectures
作者:张峰,杨霖,张书豪,何炳胜,卢卫,杜小勇
论文概述:
利用GPU等异构设备对流数据进行SQL查询加速是近年来数据管理领域的研究热点。然而,以往研究会将SQL查询语句整体分配到一个设备进行操作,忽略了查询语句中不同算子的设备倾向性。本研究提出了基于连续算子模型(continuous operator model)的细粒度调度原型系统FineStream,解决了SQL查询语句细分为不同算子时如何进一步向CPU、GPU等不同设备进行映射的难题,并在CPU、GPU相集成的真实硬件平台上进行了实现,在谷歌服务器日志等数据集验证了方法的有效性。实验表明,FineStream和目前最先进的SQL流处理系统相比,可达到52%的性能提升。