
11月24日,数据工程与知识工程教育部重点实验室(以下简称“重点实验室”)2025年度学术委员会会议在中国人民大学中关村校区召开。学术委员会委员及特邀专家,重点实验室、信息学院、高瓴人工智能学院、信息资源管理学院相关代表参加会议。
会议由学术委员会主任、中国科学院院士梅宏主持。
首先,重点实验室主任杜小勇作年度工作汇报,全面介绍了重点实验室2024-2025年在科研队伍、研究方向、学科建设、开放交流等方面的进展和成果。他重点阐述了重点实验室在数据管理、数据治理与数据智能三大方向上的科研布局与创新突破,并展望了重点实验室未来在系统能力建设、高水平成果培育和人才梯队优化等方面的发展规划。
随后,重点实验室三位新进讲师依次作学术报告。
数据管理团队董谨豪以“大模型训练三阶段的协同优化”为题,系统介绍了在预训练、监督微调和强化学习等环节中提升模型代码能力的创新方法,重点分享了在代码数据多样性构建、质量评估与奖励机制优化等方面的研究成果。
数据治理团队张绍磊围绕“基于大模型的数据治理系统研究”展开汇报,详细阐述了其在多语言大模型、多模态对齐与智能体技术等领域的研究进展,提出了“智能从数据中来、回到数据中去”的研究理念,并展示了在自动化数据准备与代理型数据分析方面的初步探索。
数据智能团队朱倩聚焦“面向空间情境的数据可视化交互任务”,介绍了在虚拟现实环境中支持数据感知、分析与交互的创新工作,分享了在意图理解、交互范式与空间系统构建等方面的重要成果,展望了与人工智能技术融合的未来研究方向。



会议最后,梅宏院士作总结发言。他强调,重点实验室要坚守数据学科的初心与特色,推动数据工程与知识工程的协同创新发展,并鼓励青年学者立足前沿、深化探索,为我国数据科学与人工智能发展贡献更大的力量。