新闻资讯
网站首页 >  新闻资讯
讲座回顾丨德科前沿技术讲座第五期

发布日期:2025-05-12  访问量:

图片

5月8日上午,数据工程与知识工程教育部重点实验室举办了第五期德科前沿技术讲座。本期讲座的主题为“Self-Learning Data Platform Powered by LLM”,由涛思数据创始人、CEO 陶建辉先生主讲,数据工程与知识工程教育部重点实验室卢卫教授主持。


图片

讲座伊始,卢卫教授对陶建辉先生的到来表示欢迎,并简要介绍了陶建辉先生的行业背景以及涛思数据在物联网、工业大数据领域的领先实践。



图片

陶建辉先生首先介绍了ODMP(Operational Data Management Platform)的概念及其在工业领域的广泛应用。他指出,ODMP主要用于采集、存储、处理和分析来自各种设备的实时和历史数据,是工业互联网不可或缺的基础设施。然而,当前的ODMP产品面临诸多挑战,包括行业知识积累的难度、IT(信息技术)与OT(操作技术)融合的障碍,以及难以形成泛行业标准产品等。他通过对比Aveva、Honeywell等商业产品,进一步阐述了这些挑战的具体表现。

随后,陶建辉先生阐释了大型语言模型(LLM)如何为数据管理平台带来创新。他指出,无论是普通用户还是数据分析师,在使用LLM进行数据分析时都面临挑战:普通人难以提出精准有效的问题(即写出好的提示词),而数据分析师则需要花费大量精力理解业务场景,确定“要做什么分析”,而非仅仅是编写SQL语句。



图片

接着,陶建辉先生介绍了涛思数据开发的Self-Learning Data Management Platform(自学习数据管理平台),详细说明了该系统的核心目标、工作流程和技术难点。该平台旨在让数据“自己说话”,降低数据分析的门槛,让不具备深厚行业背景的人也能理解数据,从数据中挖掘价值。系统通过提取数据源的Schema(结构信息),结合一个通用的Asset(资产)管理模型(对应逻辑或物理实体),将这些描述信息发送给LLM。LLM基于这些信息,能够推断出可能的应用场景,并建议需要关注的指标和分析类型,甚至返回可视化报表(Panel)模板所需的参数。

陶建辉先生特别强调,为了确保准确性,该平台不直接让LLM生成SQL语句,而是基于LLM返回的Panel参数,由系统按照预设规则构建SQL,从而保证生成的查询是正确可执行的。执行SQL获取结果后,系统即可自动进行可视化展示。他坦言,开发过程中的主要难点在于构建一个通用的Asset管理模型,以及如何简化Panel参数的生成,后者通过引入“虚拟表”(Virtual Table)的概念得以解决,即将来自不同数据源、不同结构的表合并成一个简化的虚拟视图,极大地简化了后续的查询和参数构建过程。



图片
图片

最后,陶建辉先生简要介绍了涛思数据的高性能、分布式的物联网、工业大数据平台TDengine,同时提及了TDengine 4.0版本在工业数据平台方面的能力,以及TDAsset中集成大模型智能生成可视化报表的功能,并强调了TDengine的开源特性。



图片
图片
图片
图片

互动环节,现场师生就LLM在数据管理中的具体应用、自学习平台的未来发展方向、数据安全与隐私等问题与陶建辉先生进行了热烈讨论。杜小勇教授也对讲座内容进行了点评和总结,从学术角度阐述了AI与数据库结合带来的界面范式转变(从数据模型到信息模型),以及“自学习”概念在信息模型层面的潜在意义,引发了大家更深层次的思考。



本次德科前沿技术讲座为师生带来了一场关于AI与数据管理深度融合的精彩分享。陶建辉先生提出的基于LLM的自学习数据平台,不仅展示了前沿技术在解决实际工业痛点方面的巨大潜力,也为数据分析的未来发展方向提供了新的视角,激发了师生们对相关领域的浓厚兴趣和深入研究的动力。

图片