您所在的位置:首页 新闻资讯

新闻资讯

“数据智能的发展路径研判”项目“大模型理论边界与应用实践”研讨会举办

3月26日,由国家自然科学基金委员会和中国科学院联合资助的前沿交叉研判研究项目—“数据智能的发展路径研判”项目系列专题研讨会之“大模型理论边界与应用实践”在中国人民大学举办。中国科学院院士梅宏、吕建,国家自然科学基金委员会、中国科学院学部工作局有关负责同志,以及来自北京大学、清华大学、西安交通大学、南京大学、中南大学、中国人民大学等多所高校的专家学者参加会议。

image.png

项目负责人梅宏院士首先介绍了项目背景。他指出,当前人工智能热潮之下,研究路径日益单一化,亟需冷思考与多元探索。本项目旨在厘清以数据驱动为核心的人工智能发展路径,研判其能力边界,促进AI研究的多样性。他强调,系列研讨会将围绕大模型的理论局限、应用效能、符号知识融合等主题展开深度研讨,以期形成具有学术价值和战略参考意义的研判成果。

image.png

北京大学数学科学学院张志华以“现代人工智能的本质”为题作报告。他从人工智能的基本定义出发,系统梳理了人工智能的发展历程,提出现代人工智能的核心是机器学习,而机器学习的本质则根植于统计学。他认为,人工智能通过不确定性机制与数据驱动方法,将“维数诅咒”转化为“维数祝福”,但其发展仍未超出计算机科学的范畴,未来需要概率论、统计学与物理学的深度融合。

image.png

西安交通大学数学与统计学院孟德宇围绕“机器学习的数理基础”展开报告。他回顾了机器学习理论的演进历程,指出当前大模型的理论发展已严重滞后于工程实践,面临“智能涌现”“幻觉”“脆弱性”等现象缺乏系统理论解释的困境。他提出,可从物理学的守恒律与对称性中汲取灵感,通过将数据先验嵌入网络架构,为新一代大模型提供数理基础支撑。

image.png

清华大学统计与数据科学系李赛以“从预测到保障:大模型下游任务中的统计稳健性理论”为题作报告。她聚焦大模型后处理阶段,提出在适配性、可靠性与可控性三个维度上构建统计学的“外挂工具箱”。通过检索增强、共形预测、水印植入等方法,可在不改变模型参数的前提下,实现分布漂移下的自适应、不确定性量化以及内容确权,为大模型应用提供稳健的统计保障。

image.png

南京大学人工智能学院俞扬围绕“大模型持续学习”作报告。他指出,当前大模型缺乏持续学习能力,难以应对知识更新与任务变化。他系统梳理了持续学习的发展脉络,分析了基于数据回放、参数正则化、知识蒸馏等方法的演进,并结合大模型时代的特点,提出基于模型复用的“学件”范式,通过构建模型库与规约刻画,实现模型的高效复用与系统化演进。

image.png

北京大学计算机学院李戈以“大模型能力与智能体系统探讨”为题作报告。他从程序语言与自然语言的本质差异出发,分析了Transformer模型在形式化推理与泛化能力上的局限,介绍了通过状态栈增强、傅里叶分析网络等改进方法提升模型推理能力的探索。他还分享了多智能体系统在软件工程应用中的实践与挑战,指出当前智能体系统仍面临工具协调、错误传播、开销过高等“五大殇”问题。

image.png

清华大学计算机系崔鹏以“从第一性原理看大模型能力边界”为题作报告。他提出从统计机器学习的基本假设出发,剖析大模型在独立同分布假设、最大似然估计、自回归预测、Transformer架构等方面的内在局限,总结出六大能力边界。他主张将“能力”与“知识”解耦,构建以因果推断为核心的能力模型,并从“开环”走向“闭环”,通过感知-行动-反馈循环实现高效学习与分布外泛化。

image.png

中国人民大学高瓴人工智能学院赵鑫围绕“大模型数据工程方法与评测技术”作报告。他系统介绍了大模型预训练、中期训练、后训练等阶段的数据工程方法,包括数据采集、预处理、配比、课程设计以及指令数据构造与强化学习训练等技术。他还分析了当前评测技术的发展趋势,指出随着模型能力提升,面向复杂环境、多轮交互、真实任务场景的实践评测将愈发重要。

image.png

在讨论环节,与会专家围绕大模型的理论基础、能力边界、数据效率、持续学习与智能体系统等议题展开了深入交流,进一步凝聚了共识。

image.png

会议由中国人民大学数据工程与知识工程教育部重点实验室主任杜小勇、副主任汪云海,高瓴人工智能学院副院长魏哲巍共同主持。

本次研讨会是“数据智能的发展路径研判”项目系列专题研讨的首场活动,后续还将围绕符号知识融合、结构化数据大模型、数据智能系统的体系架构等主题持续展开研讨,为推动数据智能领域的前沿探索与健康发展贡献智慧。