国际数据库顶级会议ACM SIGMOD 将于今年5月20-24日在美国亚利桑那州斯克茨代尔市举行。教育部数据工程与知识工程重点实验室陆嘉恒副教授收到ACM SIGMOD 2012组委会的接受函,其作为第一作者的论文" Optimal Top-k Generation of Attribute Combinations based on Ranked Lists"由该次会议全文接受。本篇论文受973项目“海量弱可用信息上知识发现、演化与服务的理论和技术研究” (项目号. 2012CB316205) 资助。
该论文提出了新的Top-K问题,称为Top-k,m问题,该问题是在含有多个attribute的group集合中找出top-k个attribute的组合,而这些组合中的top-m的元素的aggregate的score是最大的。为了高效地解决该问题,论文提出了两个新颖的算法ULA和ULA+,并从理论上证明了这两个算法是instance optimal的。该论文还把该方法实际运用到XML关键字改写中,并通过实验证实了top-k,m能很好地解决实际问题。该论文的研究成果在近似实体匹配,模糊决策系统中都有广泛的应用。
附:论文信息
Optimal Top-k Generation of Attribute Combinations based on Ranked Lists
Jiaheng Lu1, Pierre Senellart2, Chunbin Lin1, Xiaoyong Du1, Shan Wang1 and Xinxing Chen1
1 DEKE, MOE and School of Information, Renmin University of China
2 Institute Telecom; Telecom ParisTech, France
SIGMOD’12, May 20–24, 2012, Scottsdale, Arizona, USA
注: ACM SIGMOD数据管理国际会议是由美国计算机协会(ACM) 数据管理专业委员会(SIGMOD)发起、在数据库领域具有相当高学术地位的国际性学术会议,该会议的平均论文录取率大约为15%-17%。今年投稿论文为289篇,只录取48篇,录取率仅为16.61%。