发布日期:2017-06-01 访问量:
2017年5月14日-19日,数据库领域顶级国际会议SIGMOD 2017在美国芝加哥举行。重点实验室范举、魏哲巍副教授,以及博士生卞昊穹同学参加了会议。14日上午,范举副教授与来自清华大学、加拿大SFU、香港大学的研究者一起组织了题为”Crowdsourced Data Management: Overview and Challenges”的Tutorial(辅导报告),他们介绍了众包数据管理领域近年的研究热点,包括众包质量控制、成本控制、延迟控制、众包数据库系统开发等内容。
16日,卞昊穹同学报告了论文”Wide Table Layout Optimization based on Column Ordering and Duplication”并和参会者进行了互动交流。该论文是我校与微软亚洲研究院 (MSRA) 合作的成果,卞昊穹是论文的第一作者,其他作者还包括陈跃国副教授和杜小勇教授,该工作主要在陈跃国副教授指导下完成。论文通过对HDFS (Hadoop Distributed File System) 列式存储中数据列顺序的调整和常用列的复制,提高了HDFS上宽表数据的访问性能。HDFS作为大数据存储的通用平台和工业标准,其数据存储和访问性能的提高对其上的大数据生态系统具有非常重要的意义。
17日,范举副教授与新加坡国立大学的合作者报告了论文“Discovering Your Selling Points: Personalized Social Influential Tag Exploration”,这一工作侧重发现大规模社交网络中用户有影响力的话题,能够应用于社交网络广告、病毒营销等多个领域中。范举副教授另有一篇与清华大学合作的众包论文“CDB: Optimizing Queries with Crowd-Based Selections and Joins”,该工作侧重于构建一个实用的众包数据库系统。本届SIGMOD会议首次增加了Teaser Talks环节,即在16日-18日每天上午的主会场上,将要在当天各个research session中做论文报告的作者需要用1页PPT和1分钟时间向全体参会者介绍自己的论文,吸引参会者前往自己所属的Research Session听取报告和参与讨论。
SIGMOD是数据库领域公认具有最高学术地位的学术会议,由美国计算机协会 (ACM) 数据管理专业委员会 (SIGMOD) 发起,每年一届,至今已举办36届。会议的目的是在全球范围内为数据库领域的研究者、开发者以及用户提供一个探索最新学术思想和研究方法、交流开发技巧、工具以及经验的平台,引导和促进数据库学科的发展。本届SIGMOD会议共收到Research Paper(研究论文)投稿489篇,接收96篇,接受率仅为19%. 此外,会议还接收了13个Tutorial(辅导报告)、31个Demo(系统展示)和4篇Industrial Paper(工业论文)。
在历届SIGMOD会议中,我校师生以第一作者共发表研究论文7篇,在国内各高校中处于前列。
附:论文信息
【1】 “Wide Table Layout Optimization based on Column Ordering and Duplication” 链接:http://dl.acm.org/citation.cfm?id=3035930
【2】 “Discovering Your Selling Points: Personalized Social Influential Tag Exploration” 链接:http://dl.acm.org/citation.cfm?id=3035952
【3】“CDB: Optimizing Queries with Crowd-Based Selections and Joins” 链接:http://dl.acm.org/citation.cfm?id=3064036
【4】“Crowdsourced Data Management: Overview and Challenges” 链接:http://dbgroup.cs.tsinghua.edu.cn/ligl/papers/sigmod17-tutorial-crowd.pdf