购置原因
随着人工智能技术的快速发展,高校作为科研和教学的前沿阵地,亟需引入先进的智能化技术以提升整体竞争力。DeepSeek大模型凭借其卓越的自然语言处理、突出的推理能力、较低的部署及训练成本,为高校大模型私有化部署与全面推广应用带来了前所未有的机遇。 我校作为能源领域的重要高校,科研与教学管理面临数据量大、计算复杂度高的挑战。为提升科研效率和教学质量,我校亟需建设以DeepSeek为基座的油气人工智能科研大模型平台,为构建高性能计算与AI驱动的科研教学管理体系提供支撑。该平台包含基础平台、数据采集、数据清洗与标注、基座模型设计、基座模型训练等功能模块开发部署,用于支撑学校教师开展科研所需的AI应用,提升科研智慧化水平。
经费预算
300000.00元
技术指标
1)开发部署基础平台模块,该项目的顺利开展需要使用FP16计算能力≥148 TFLOPS,显存≥96GB,CPU:2颗48核处理器(主频≥2.6GHz),内存:≥2TB高性能深度学习训练服务器2台,FP16计算能力≥312 TFLOPS,显存≥80GB,CPU:2颗32核处理器(主频≥2.3GHz),内存:≥2TB智能计算加速单元1台,操作系统选用 Linux 的主流发行版,如 CentOS 或 Ubuntu,以确保系统的稳定性和开源软件的兼容性。部署算力管理工具,如 Cuda。
2) 以DeepSeek的高校智能化科研教学管理算力建设,部署满血版DeepSeek(671B)以打造学校油气人工智能科研底座大模型,通过校内现有数据进行数据采集、数据清洗与标注、基座模型设计、基座模型训练等技术开发部署。 (1) 数据采集与清洗模块:收集校内现有数据,从学术数据库、行业报告、专利文献等渠道收集与油气领域相关的文本数据,提取其中有价值的信息。利用API接口整合学校内部已开展的科研项目所产生的数据,包括实验数据、模拟数据等。根据一定的数据清洗规则,对校内重复数据进行处理,错误数据进行纠正,少量缺少数据进行填充,并对清洗后的数据进行图像或者文本标注。 (2) 基座模型设计模块:基于 DeepSeek 模型的基础架构,结合油气领域数据的特点和科研任务需求,进行针对性的架构调整。例如,对于处理序列型生产数据,引入循环神经网络(RNN)或其变体(如 LSTM、GRU)结构;对于分析地质图像数据,采用卷积神经网络(CNN)架构,并根据图像的分辨率和特征复杂度,合理设置卷积层、池化层和全连接层的参数。可构建基于深度学习的油气储量预测模型,开发能够模拟油藏内部流体流动和压力变化的油藏动态模拟模型等。 (3) 基座模型训练模块:将采集和清洗后的数据训练成数据集,并选用随机梯度下降(SGD)及其变体(如 Adagrad、Adadelta、Adam 等)作为模型训练的优化算法,根据模型的收敛速度和训练效果加快模型训练,同时利用计算集群的多节点并行计算能力,采用数据并行和模型并行相结合的方式,加速模型训练过程。
3) 通过学校油气人工智能科研大模型逐步开展校内人工智能应用,全面提升学校在科研、教学及管理领域的智能化水平,推动高校数字化转型。 (1) 教育管理模块:通过大模型应用助力学校教育管理工作,通过大模型应用分析学生成绩和行为数据,提供综合评估,识别学生潜在问题(如学习困难、心理问题)。收集并分析教师教学表现,提供改进建议,推荐适合教师的培训课程和资源。同时优化教育资源分配,提高教学资源利用率。 (2) 个性化学习:对学生日常学习中的行为进行采集,分析学生学习行为,提供个性化学习路径,提升学生综合能力培养,根据学生兴趣和学习风格,推荐适合学生的学习资源(如视频、习题等),分析学生考试成绩和作业完成情况,评估学生学习效果,生成学习报告。
询价小组意见
询价小组意见:经讨论,决定拟选用中国联合网络通信有限公司北京市分公司为供应商,报价297000.00元。
询价小组成员:李港,吴荣焕,徐铭莉
质疑方式
询价结果公示期为三天,公示期间如有疑问,请致电010-89733226。