接着,陶建辉先生介绍了涛思数据开发的Self-Learning Data Management Platform(自学习数据管理平台),详细说明了该系统的核心目标、工作流程和技术难点。该平台旨在让数据“自己说话”,降低数据分析的门槛,让不具备深厚行业背景的人也能理解数据,从数据中挖掘价值。系统通过提取数据源的Schema(结构信息),结合一个通用的Asset(资产)管理模型(对应逻辑或物理实体),将这些描述信息发送给LLM。LLM基于这些信息,能够推断出可能的应用场景,并建议需要关注的指标和分析类型,甚至返回可视化报表(Panel)模板所需的参数。
陶建辉先生特别强调,为了确保准确性,该平台不直接让LLM生成SQL语句,而是基于LLM返回的Panel参数,由系统按照预设规则构建SQL,从而保证生成的查询是正确可执行的。执行SQL获取结果后,系统即可自动进行可视化展示。他坦言,开发过程中的主要难点在于构建一个通用的Asset管理模型,以及如何简化Panel参数的生成,后者通过引入“虚拟表”(Virtual Table)的概念得以解决,即将来自不同数据源、不同结构的表合并成一个简化的虚拟视图,极大地简化了后续的查询和参数构建过程。