近日,SIGMOD 2026公布了录用结果,中国人民大学数据工程与知识工程教育部重点实验室数据库系统团队的文章《Performant Synchronization in Geo-Distributed Databases》被录用。这是人大数据库系统团队在继GeoTP(ICDE 2025)、GeoLM(INFOCOM 2025)之后在跨空间域数据管理方向的最新成果。
论文信息
论文作者包括徐都玲(中国人民大学博士生)、李彤(中国人民大学副教授)、孙泽港(中国人民大学硕士生)、陈政(清华大学博士后)、周慰星(东北大学博士生)、张岩峰(东北大学教授)、卢卫(中国人民大学教授)、杜小勇(中国人民大学教授)。
Duling Xu, Tong Li(通讯作者), Zegang Sun, Zheng Chen, Weixing Zhou, Yanfeng Zhang, Wei Lu, Xiaoyong Du. Performant Synchronization in Geo-Distributed Databases. ACM SIGMOD, 2026.
论文预印本链接: https://arxiv.org/abs/2511.22444
论文介绍
随着全球服务架构的持续扩张,跨域分布式数据库已成为支撑金融交易、跨境电商、全球社交平台等业务的基础设施。然而,广域网环境下的高延迟、有限带宽特性,使得跨区域数据同步成为制约系统性能的主要瓶颈 —— 现有优化方案多聚焦单一维度(如事务调度、数据压缩或网络协议优化),未能充分适配广域网的实际拓扑与传输特性,难以在效率、一致性与扩展性间实现平衡。
基于对真实广域网环境的测量分析,研究团队发现(1)地理上邻近的节点天然形成低延迟集群;(2)部分传输路径存在三角不等式违背现象;(3)跨区域数据传输中存在大量冗余内容。针对上述发现,团队提出了针对跨域分布式数据库的通信优化框架GeoCoCo,下面简要介绍该框架的基本设计思想.

延迟感知分组调度:通过实时监测广域网链路延迟,动态生成节点通信集群,并借助线性规划算法优化组内数据聚合与组间传输路径,减少跨区域通信的往返次数;
任务导向数据过滤:精准识别并剔除同步过程中的 “无效数据”(如冲突写入、重复更新等),在不影响数据一致性的前提下降低带宽消耗;
一致性保障传输架构:采用分层通信模式,结合 CRDT(无冲突复制数据类型)的代数特性,确保在消息重排序、传输延迟或网络分区等异常场景下,数据库仍能维持正确的全局一致性。

GeoCoCo框架通过创新的分组策略与数据优化机制,将跨地域数据库的同步成本降低 40.3%,系统吞吐量提升 14.1%,为全球规模化数据服务的高效协同提供了解决方案。该框架兼容性良好,无需修改现有数据库的事务逻辑或存储模块,仅通过适配通信层即可无缝集成于 GeoGauss、CockroachDB 等主流跨域分布式数据库。在 TPC-C 与 YCSB 基准测试中,即使在 50 节点的跨区域部署场景下,GeoCoCo 的规划开销仍控制在总同步成本的 7.07% 以内;同时,GeoCoCo与网络协议优化、zlib 数据压缩等技术可形成互补增益,进一步验证了方案的通用性与扩展性。

第一作者介绍

徐都玲,中国人民大学博士生。主要研究方向为分布式数据库、广域网网络传输优化。
通讯作者介绍

李彤,中国人民大学副教授、信息技术中心副主任、数据科学与技术系副主任,中国人民大学杰出学者,曾任华为主任工程师。主要研究方向为互联网体系结构、网络安全和数据空间,先后发表包含ACM SIGCOMM(3篇)、USENIX NSDI(2篇)在内的CCF-A类论文30余篇,主持国家自然科学基金青年、面上、华为胡杨林基金、腾讯犀牛鸟专项等10余项,申请/授权国内外技术发明专利40余项。研究成果应用于华为云和鸿蒙系统,被授予华为十大发明奖和总裁奖等;研究成果还应用于腾讯云,服务亿级直播视频用户,产生显著经济效益。
会议介绍
SIGMOD(ACM SIGMOD International Conference on Management of Data)作为数据库领域最具影响力的旗舰会议之一,聚焦数据库管理技术与前沿交叉研究,主题覆盖数据库系统架构、查询处理与优化、事务与并发控制、分布式与云数据管理、大规模数据存储与计算框架、数据挖掘与机器学习融合方法、数据安全与隐私保护机制,以及图数据与时空数据处理等方向。

团队在跨空间域数据管理方向的“Geo家族”系列工作:
跨域数据管理是人大数据库系统团队近年提出的一个新的研究方向,包括跨空间域、跨管辖域和跨信任域三个子方向,由多位教授分别牵头开展研究。跨空间域数据管理技术面临性能和可用性方面的挑战。近年来,团队针对跨空间域数据存储和跨空间域事务处理进行了深入研究。在跨空间域数据存储方面,针对分布式共识协议的领导者选举问题,GeoLM(INFOCOM 2025)提出了一种性能导向的领导者管理策略,全面考虑跨域网络延迟、节点访问频率和读写操作比例,动态优化领导者切换;针对分布式共识协议的日志同步问题,GeoCoCo(SIGMOD 2026)通过节点分组解决时延瓶颈,通过数据过滤解决带宽瓶颈,从而解决跨域引发的通信瓶颈;在跨空间域事务处理方面,GeoTP(ICDE 2025)技术通过去中心化准备机制、延迟感知调度及启发式优化,显著提升了跨域分布式数据库的分布式事务处理性能。未来团队将进一步在跨域空间域数据管理方向深入探索,欢迎感兴趣的专家、老师和学生参与到“Geo家族”系列工作中来。联系方式:tong.li@ruc.edu.cn.
附:“Geo家族”系列论文列表
[1] Duling Xu, Dafang Zhang, Tong Li, Yunpeng Chai, Zegang Sun, Weiming Li, Yangfan Liu, Qipeng Wang, Jiaqi Liang, Yang Ren, Wei Lu, Xiaoyong Du. GeoLM: Performance-oriented Leader Management for Geo-Distributed Consensus Protocol. IEEE INFOCOM, 2025.
[2] Duling Xu, Tong Li, Zegang Sun, Zheng Chen, Weixing Zhou, Yanfeng Zhang, Wei Lu, Xiaoyong Du. Performant Synchronization in Geo-Distributed Databases. ACM SIGMOD, 2026.
[3] Qiyu Zhuang, Xinyue Shi, Wei Lu, Yuxing Chen, Zhanhao Zhao, Tong Li, Anqun Pan, and Xiaoyong Du. GeoTP: Latency-aware Geo-Distributed Transaction Processing in Database Middlewares. IEEE ICDE, 2025.
[4] 杜小勇, 李彤, 卢卫, 范举, 张峰, 柴云鹏. 跨域数据管理.计算机科学, 2024.