新闻资讯
网站首页 >  新闻资讯
重点实验室汪云海教授团队多篇论文获SIGMOD、NeurIPS、IEEE VIS录用

发布日期:2025-11-07  访问量:

    近日,中国人民大学数据工程与知识工程教育部重点实验室汪云海教授团队共有10论文获SIGMOD 2026、NeurIPS 2025、IEEE VIS 2025三大 CCF A 类会议录用。以下是被录用论文的简要介绍。

一、SIGMOD 2026




图片

SIGMOD(Special Interest Group on Management of Data,简称SIGMOD)是数据库领域的顶级国际会议,致力于展示和分享数据库系统和数据管理领域的最新研究成果,也是中国计算机学会推荐A类国际学术会议(CCF A),论文录取率约为20%。汪云海教授团队论文《Visualization-Oriented Progressive Time Series Transformation》已被SIGMOD 2026录用。

论文 1


Visualization-Oriented Progressive Time Series Transformation


论文作者:张凌宇,陈昕,鲍怀威,卢卫,Eugene Wu,Xiaohui Yu,汪云海

通讯作者:汪云海

论文简介:大规模时序数据(如金融交易记录、物联网传感器数据)的可视分析通常涉及对多变量数据进行复杂的变换操作。现有分析系统在处理海量数据时,往往需要对全量数据执行完整的变换与计算,导致计算开销巨大,难以满足交互式分析所要求的毫秒级响应延迟。为此,本文提出了PIVOT,一种面向可视化的增量式时序变换系统。该系统通过智能识别并仅对生成可视化所必需的关键数据点进行选择性变换计算,在保障视觉精度的同时,显著提升了大规模时序数据的交互式探索效率。PIVOT的核心技术贡献体现在两个方面:(1)变换感知的高效查询机制,该机制通过评估分析算子应用于预先构建好的最小–最大值层次结构上产生的值域,引导深度优先搜索,从而能够高效地执行逐点变换计算,避免了对完整数据集的扫描,从根本上降低了查询的计算复杂度;(2)基于像素的误差上界保证策略,该策略能够在不依赖完整计算结果的前提下,实时评估增量生成的可视化结果的准确性,并动态权衡响应延迟与视觉保真度,从而在保证交互流畅性的同时,确保可视化结果的可靠性。在多个十亿级规模的基准数据集上的实验结果表明,PIVOT能够在交互式响应时间内生成高保真度的可视化结果,其性能相较于现有的无损变换方法提升高达一个数量级。

二、NeurIPS 2025




图片

神经信息处理系统大会(Neural Information Processing Systems,简称NeurIPS)与国际机器学习大会(ICML)、国际学习表征会议(ICLR)并称“机器学习三大顶会”。据悉,第39届NeurIPS会议将于2025年12月2日至7日在美国圣地亚哥和墨西哥城两地同步举行。汪云海教授团队有2篇论文被NeurIPS 2025录用。

论文 2


GraphChain: Large Language Models for Large-scale Graph Analysis via Tool Chaining


论文作者:韦淳于,胡文吉,郝兴家,汪鑫,杨逸凡,汪云海,田阳,陈跃国

通讯作者:汪云海

论文简介:大型语言模型(LLM)在处理大规模图数据(例如资金转账网络)时面临显著限制,难以应对上下文约束和缺乏灵活推理能力。我们提出GraphChain,一种新颖框架,使LLM能够通过编排动态序列的专用工具来分析大型图,模拟人类的探索过程。GraphChain包含两项核心技术贡献:(1)渐进图蒸馏,一种强化学习方法,学习生成在任务相关性与中间状态压缩之间取得平衡的工具序列,从而克服LLM的上下文限制;(2)结构感知测试时适应(STTA),一种利用轻量级自监督适配器的机制,该适配器以图谱属性为条件,通过软提示高效地将冻结的LLM策略适应于多种图结构,无需重新训练。实验表明,GraphChain显著优于先前方法,实现了可扩展且自适应的LLM驱动图分析,并且能够在公安经侦实例数据上表现出色。面对真实的资金转账图谱,GraphChain能够通过动态编排工具链精准定位目标账户,为经侦部门打击非法集资、洗钱等金融犯罪提供了有力的技术支持。

图片

论文 3


Conditional Diffusion Anomaly Modeling on Graphs


论文作者:韦淳于,林浩哲,陈跃国,汪云海

通讯作者:陈跃国

论文简介:图异常检测(GAD)已成为一个关键的研究领域,在金融欺诈和电信等领域得到了成功应用。现有的图异常检测范式受限于传统图神经网络(GNNs)的固有缺陷:在拓扑层面,GNN的过平滑效应导致异常信号被邻域聚合所湮没;在特征层面,判别式模型对于能够主动伪装特征以规避侦测的欺诈节点显得尤为脆弱。为此,我们提出条件图异常扩散模型(CGADM),旨在通过引入生成式建模范式,利用扩散模型强大的迭代优化与去噪重建能力,从根本上突破上述瓶颈 。该框架的核心技术贡献体现在两个方面:(1)先验引导的扩散过程,它创新性地将一个预训练的异常估计器作为条件先验,注入并约束整个扩散-逆扩散过程,从而显著提升了异常模式恢复的精确性 ;(2)先验置信度感知机制,一种高效的自适应采样策略,它根据各节点的先验置信度动态调节逆向去噪的计算资源分配,在保证检测性能的同时优化了大规模图上的计算效率 。在多个基准数据集上的实证分析表明,CGADM不仅在检测精度上达到了新的SOTA水平,同时在计算开销上展现出显著优势。在公安实例资金转账图谱上,CGADM通过先验感知机制,自适应减少对正常账户的计算步骤,增加对风险账户的计算步骤,大幅降低了大规模金融图计算的时间成本的同时精准捕捉金融犯罪相关的异常模式,为公安经侦部门高效开展金融犯罪侦查、异常金融行为监测等提供了有力技术支持。

图片

三、IEEE VIS




图片

IEEE VIS是可视化领域最具影响力的顶级国际会议,由IEEE(电气和电子工程师协会)主办,每年汇集全球科学可视化、信息可视化及可视分析领域的顶尖学者与最新研究成果,是该领域年度学术盛会。IEEE VIS 2025于11月1日至7日在奥地利维也纳举行。

汪云海教授团队的多篇论文在IEEE VIS 2025进行报告,其中包括3篇被会议接收并发表于《IEEE Transactions on Visualization and Computer Graphics》(TVCG)期刊的论文,以及4篇已发表于TVCG并受邀在会议上报告的期刊论文。

论文 4


PiCCL: Data-Driven Composition of Bespoke Pictorial Charts


论文作者:师浩晏,汪云海,陈君豪,汪成龙,Bongshin Lee

通讯作者:汪云海

论文简介:我们提出了一种新型图像化图表组合语言PiCCL(Pictorial Chart Composition Language),该语言允许用户通过一系列简洁的操作符,轻松构建象形图表。为支持系统化的图表构建,并应对当前象形图创作中面临的主要挑战——如图形对象手动组合困难、视觉属性调节复杂等问题,PiCCL 引入了一种参数化表示方法,将数据驱动的图表生成与图形合成过程相融合。同时,语言采用惰性数据绑定机制,实现了图表的自动合成。PiCCL 的设计基于对大量真实象形图表示例的系统性分析。本文介绍了该语言的设计理念及其基于 JavaScript 的实现库 piccl.js。为评估 PiCCL 的实际效果,我们构建了一个涵盖多种应用场景的图表示例库,以展现其表达能力强、适应性广的特点,并通过对 piccl.js 的用户研究系统评估了其可用性。最后,我们讨论了 PiCCL 目前存在的局限性、潜在发展方向以及未来的研究计划。

图片

论文 5


Authoring Data-Driven Chart Animations Through Direct Manipulation


论文作者:沈袁程, 赵跃, 汪云海, 葛彤, 师浩晏, Bongshin Lee

通讯作者:汪云海

论文简介:数据叙事越来越依赖图表动画来传达信息,但传统的制作方式往往依靠编程或者专业的关键帧工具,既复杂又缺乏直观性。因此我们提出了CAST+——一款让用户通过“关键帧”直接操控图表动画的交互式创作工具。基于我们此前提出的声明式图表动画语言 Canis,CAST+提出了“可视化关键帧规范”的新理念,用户可在图形界面中直接设置关键帧、定义动画时序(如持续时间、延迟等),并通过可视化轨道进行同步与调整,从而以“点按-拖拽”的交互方式构建复杂动画,而无需编写任何代码。CAST+ 引入了两项关键技术:1)关键帧自动补全机制:利用数据驱动推理自动生成关键帧与动画序列,帮助用户快速建立动画结构。2)广义选择算法:支持在同一关键帧组中为多类型视觉标记统一生成动画,使系统能够识别并补全可动画化对象,大幅提升创作效率与动画表现力。我们通过用户实验验证了CAST+ 的设计理念与易用性。结果表明,该系统能显著降低动画创作的复杂度,同时支持更高的视觉表达自由度。我们还展示了一系列复杂的典型应用场景,覆盖数据新闻、教学演示与信息设计等领域。通过CAST+,图表不再只是静态呈现数据,而成为动态叙事的媒介,为数据可视化创作带来了全新的交互体验与方法范式。

图片

论文 6


Generalization of CNNs on Relational Reasoning with Bar Charts


论文作者:崔振兴*陈路*,汪云海,Daniel Haehn,王勇,Hanspeter Pfister

通讯作者:汪云海

论文简介:这篇论文研究了卷积神经网络(CNN)在条形图关系推理任务中的泛化能力,并系统比较了其与人类在视觉推理上的表现。研究者构建了一个包含真实可视化元素的大规模数据集 GRAPE,用于评估CNN在条形图比例估计任务中的表现。结果显示,在训练与测试图表视觉编码一致的情况下(IID场景),经过优化的CNN(如ResNet152)可以超越人类表现,但一旦测试图表出现颜色、条宽、标题位置等变化(OOD场景),CNN性能显著下降,显示出较差的泛化能力。

进一步分析表明,CNN在图表中的注意焦点往往分散,对与任务无关的视觉变化高度敏感;而人类主要基于条形长度进行判断,因此更具稳健性。尽管通过数据增强或引入显式掩膜可以一定程度改善CNN的泛化表现,但仍难以达到人类水平。论文指出,未来的模型应强化对任务相关视觉特征的学习,并引入任务导向的注意力机制,从而提高在复杂可视化环境下的理解与推理能力。

图片

论文 7


Color-Name Aware Optimization to Enhance the Perception of Transparent Overlapped Charts


论文作者:卢克成,朱利航,汪云海,曾琼,宋维涛,Khairi Reda

通讯作者:汪云海

论文简介:在可视化中,透明度常用于重叠可视化图表(如直方图、平行坐标、集合图)中,从而便于对类别数据进行视觉比较。然而,此类图表往往存在对象之间的大量重叠,导致显著的颜色相互作用。传统的Alpha Blending混色方法在这种场景下表现不佳,常常产生含糊的颜色映射并引入语义歧义。为解决这些问题,我们提出一种自动化方法,用于生成最优的颜色编码,以增强对透明叠加图表的感知。该方法利用颜色可命名性,最大化复合色与其所属类别标签之间的关联。我们引入了一个颜色名称感知优化框架,在确保可视化中所有区域具备感知可分辨性的同时,生成尽可能一致的配色方案与透明度设置。通过对多类别重叠直方图开展的众包实验,我们展示了该技术相较于标准混色和面向可视化的专用混色模型具有显著优势。此外,该方法还可以推广至其他可视化形式,包括平行坐标系与维恩图。我们提供了该技术的开源实现以及一个基于 Web 的工具,为重叠场景下的复杂数据可视分析提供可复用的工程方案。

图片

论文 8


Visualization-Driven Illumination for Density Plots


论文作者:陈昕,汪云海,鲍怀威,卢克成,Jaemin Jo,Chi-Wing Fu,Jean-Daniel Fekete

通讯作者:汪云海

论文简介:在处理大规模、高密度的离散点数据集(如地理空间数据)时,传统散点图常因严重的过度绘制(overplotting)问题而掩盖数据中潜在的结构与模式。尽管密度图作为一种聚合可视化形式可有效缓解该问题,但其现有的光照渲染模型仍存在显著局限:一方面,传统光照模型易引入颜色失真,干扰用户对密度值的准确感知与比较;另一方面,它们往往弱化甚至完全遮蔽低密度区域的细节,使得离群点的识别与分析变得极为困难。为此,我们提出一种新颖的可视化驱动的密度图光照模型,旨在通过增强渲染效果,同时清晰地揭示高、中密度区域的精细结构与低密度区域的离群点,并避免对颜色编码的密度场造成伪影干扰。该模型的核心技术贡献体现在两个方面:(1)可视化驱动的定制光照模型:不同于计算机图形学中以视觉真实感为导向的传统光照范式,该模型围绕密度图的核心分析任务(如数值判读、模式对比与异常识别)进行专门设计,确保光照效果直接服务于数据洞察;(2)阴影与色彩解耦的图像合成技术:提出一种创新的图像合成方法,将用于凸显空间结构的阴影信息与用于编码密度值的颜色通道有效分离,从根本上消除传统方法中阴影对颜色感知的干扰,从而保障数据表达的准确性。我们开展了一项定量实验、一项受控用户研究以及两项实际案例分析,涵盖12个大型真实数据集,全面地验证了所提模型的有效性。在城市犯罪热点分析、人口流动监测等应用中,本技术能够在同一视图中清晰展示高密度聚集模式与低密度的零星异常事件,为资源规划和应急响应等决策提供了更可靠、更精细的可视化支持。

图片


    此外,汪云海教授团队参与完成的2篇论文《Self-Supervised Continuous Colormap Recovery from a 2D Scalar Field Visualization without a Legend》及《Neighborhood-Preserving Voronoi Treemaps》也获选于IEEE VIS 2025会议上进行报告。