7

中国人民大学重点研发项目组

项目名称:高时效、可扩展的大数据计算模型、优化技术与系统

中国人民大学在该项目中负责自适应、可伸缩的大数据存储系统,研究对不同计算模式和不同任务负载可进行自适应优化和可伸缩调整的新型分布式数据存储系统 。将从数据组织模型、存储架构、存储介质三个层次出发,重点研究关系模型和图模型的高效数据组织方法、直通式键值和文件存储的架构设计与优化方法、各类新型存储硬件的性能优化方法、混合计算模型和任务负载的自适应优化方法及实现资源按需分配的高效可伸缩调整技术, 构建自适应优化、可伸缩调整的大数据存储系统,与指南“研究对不同计算模式和不同任务负载可进行自适应优化和可伸缩调整的新型分布式数据存储系统”完全符合。

时间计划

第一阶段:调研与设计阶段(2018.06.01-2018.11.30)
2018.08.31 完成需求调研与前期准备工作
2018.10.31 完成基准评测工具设计
2018.11.30 完成整体项目设计、确定系统接口;完成基准评测工具内部试用版
第二阶段:研发阶段(2018.12.01-2020.05.31)
2019.12.31 各课题组完成中期考核。中期目标包括各课题系统的设计文档、 各课题系统的关键技术模块,以及部分论文、专利和软著的知识产权指标
2020.03.15 完成自适应、可扩展的大数据存储系统的开发。完成批流融合大数据计算系统、高维大规模机器学习系统、智能交互向导系统的开发
2020.03.31 完成大数据系统测试基准与测试工具正式版的开发
2020.04.30 完成高时效、可扩展的大数据系统内部测试版
2020.05.31 完成大数据系统中各子系统的集成联调与测试.完成高时效、可扩展的大数据系统试用版.完善系统标准/规范制定、评测基准及工具研发
第三阶段:评测与应用示范阶段(2020.06.01-2021.05.31)
2020.12.31 在阿里云的实际应用场景中部署课题的研究成果
2021.01.31 开展流数据大规模在线分析的示范应用,开始上线试运行
2021.03.15 基于示范应用运行结果,对各系统进行反馈
2021.04.30 完成大数据系统平台发布版、工具发布版
2021.05.31 完成大数据系统的评测工作