中文题目:一种基于极限学习机和元学习的稀缺样本故障诊断新方法
论文题目:A Novel Fault Diagnosis Method under Limited Samples based on An Extreme Learning Machine and Meta-learning
录用期刊/会议:Journal of the Taiwan Institute of Chemical Engineers (中科院SCI 3区,JCR Q1)
原文DOI:https://doi.org/10.1016/j.jtice.2024.105522
原文链接:https://www.sciencedirect.com/science/article/pii/S1876107024001809
录用/见刊时间:2024年04月25日
作者列表:
1) 许泽坤 中国石油大学(北京)信息科学与工程学院/人工智能学院 控制工程 硕21
2) 高小永 中国石油大学(北京)信息科学与工程学院/人工智能学院 自动化系 教师
3) 付 军 中海油能源发展股份有限公司 天津
4) 李 强 中国石油大学(北京)信息科学与工程学院/人工智能学院 控制科学与工程 博22
5) 檀朝东 中国石油大学(北京)信息科学与工程学院/人工智能学院 自动化系 教师
文章简介:
本文提出一种面向稀缺样本的故障诊断新方法,并用于电潜泵的故障诊断。通过结合极限学习机和元学习,有效克服了数据量稀缺的挑战。这种方法显著提高了分类模型的准确性,并通过实际应用验证了其效果,展现出优于传统方法的性能。
摘要:
传统的故障诊断方法通常依赖于足够数量的故障样本。然而,在工业过程中,故障样本往往稀缺,同时样本采集成本也很高。在这种情况下,传统方法很难做到准确的故障诊断。关于解决稀缺样本的问题,元学习作为一种优秀的算法,旨在使机器“学会学习”。通过元学习优化器,获得一个较好的模型初始化参数,元学习的提出为解决稀疏故障样本问题提供了新的研究思路。然而,元学习方法面临着网络结构设计复杂、整体算法耗时等问题。
极端学习机(ELM)最初由Huang等人提出,由于其简单的结构、快速的学习效率、高精度和最小的干预要求,它受到了学者的广泛关注,并在故障诊断领域中取得了成功的应用,已经成为故障诊断研究的优秀算法之一。
因此,本文提出了一种新的故障诊断方法,将极限学习机(ELM)和元学习相结合。采用模型不可知元学习框架从可用的故障数据中提取有价值的模型参数,从而优化网络模型的初始权重和偏差,获得优化后的ELM。这显著增强了模型性能,尤其是在故障样本稀缺的情况下。所提出的方法已被证明在电潜泵的故障诊断中是成功的,解决了由于故障样本稀缺而导致故障诊断效果欠佳的问题。
背景与动机:
优秀的故障诊断技术在确保工业系统长稳有效运行中发挥着至关重要的作用。然而,在实际的工业设备运行中,机器大部分时间通常在正常条件下运行,这意味着只能收集很有限数量的故障数据,有标签的故障数据则更为稀缺,而传统的故障诊断方法在处理有限样本时效果往往不佳。因此,针对这一问题,本文提出一种基于极限学习机和元学习的新方法,旨在通过创新方法提高稀缺样本下故障诊断的准确性。
设计与实现:
为了让ELM在稀缺故障样本条件下获得更好的分类性能,本文利用MAML框架学习以往数据的分类经验。在学习到的分类经验基础上,对目标的稀缺样本数据进行最终分类。MLELM模型配置为多个子ELM、MAML框架和一个顶层ELM分类器。MAML从每个子ELM中更新输入权重和偏置,并将最优参数和输出给顶层ELM。具体的流程图如下所示。
图1 MLELM流程图
每个子ELM依次在的不相交子集上执行训练任务,参考MAML框架优化输入和,并将最优和输出给顶层ELM作为顶层ELM的初始参数。这样,顶层ELM会对类似数据极其敏感,使得顶层ELM在稀缺故障样本的目标任务上能达到更优秀的分类效果。
具体流程步骤如表1所示。
表1 MLELM的流程步骤
实验结果及分析:
为了验证所提方法的有效性,本部分首先将其与ELM进行对比,之后将其与PSO-ELM、FOS-ELM、LE-ELM以及Siamese Nets进行对比。
MLELM与ELM在电潜泵稀缺故障样本数据集上评判指标与运行时长对比如图2-图3和表2所示
图2 ELM和MLELM的分类性能对比情况
图3 ELM和MLELM的分类性能对比情况
表2 ELM和MLELM的分类性能对比情况
|
ACC (max) |
ACC(average) |
F1-score (max) |
F1-score(average) |
Kappa (max) |
Kappa(average) |
ELM |
0.6157 |
0.3948 |
0.5890 |
0.3891 |
0.5594 |
0.3395 |
MLELM |
0.9352 |
0.6281 |
0.9314 |
0.6070 |
0.9245 |
0.5844 |
提升 |
0.3195 |
0.2333 |
0.3424 |
0.2179 |
0.3651 |
0.2449 |
从上述实验结果可以看出,MLELM对比ELM在处理电潜泵稀缺样本故障诊断问题上的各项评价指标都有明显提升。说明了在原有ELM模型上结合元学习优化策略可以有效加强原模型对于稀缺故障样本诊断的性能,也说明了元学习方法对处理电潜泵稀缺故障样本的实际有效性。
之后,将MLELM与PSO-ELM、FOS-ELM和LE-ELM进行对比,如图4所示。
图4 各算法评价指标的比较
分类结果的混淆矩阵如图5所示。可以看出,在处理稀缺故障样本问题时,MLELM在12种电潜泵故障类别的综合准确率要平均高出其他三种改进ELM算法8%左右,F1-score要高出0.8分左右,KAPPA要高出0.9分左右。在总12种类型中,全部都分对的类型有7种,并有10种类型的准确率和8种F1-score得分高于其余三种算法。
图5 不同算法的混淆矩阵
图6全面比较了在数据样本进一步减少的三种规格下各算法的性能情况。具体来说,数据样本分别减少到280个和220个样本。这种比较可以更能直观看出每个算法在处理稀缺样本的情况下的实际性能。此外,还添加了与孪生网络(Siamese Nets,SN)的比较,以全面评估本文算法在三种样本规格下的性能。
图6 在三种样本规格情况下的各算法评价指标比较
为了更清楚地说明本章算法在不同数据量下的性能优势,图7展示了每个算法评价指标的比较分析。
图7 在三种样本规格情况下的各算法评价指标比较
综上,根据上述实验结果可以看出,本章所提出的MLELM在处理电潜泵稀缺样本的故障分类方面优于ELM、PSO-ELM、FOS-ELM、LE-ELM和Siamese Nets。结果表明,MLELM可以有效地解决在稀缺样本下故障分类问题。此外,实验说明了将元学习方法与ELM相结合后,提高了模型在处理稀缺样本时的故障诊断性能。
结论:
本文提出了一种基于元学习和极限学习机的故障诊断方法,并应用于稀缺样本的电潜泵故障诊断。结果表明,与ELM、PSO-ELM、FOS-ELM、LE-ELM和Siamese Nets相比,MLELM在处理稀缺故障样本问题上有着更为出色的故障分类性能。说明使用元学习方法对ELM进行参数优化可以显著改善ELM在处理稀缺样本数据时的故障诊断性能。并且,该算法成功地应用于电潜泵故障诊断领域,为该领域提供了新的研究思路。在未来的研究中,可以通过改进ELM的基本框架,从而进一步改善算法的故障诊断性能。
通讯作者简介:
高小永,信息科学与工程学院/人工智能学院副院长,博士生导师,石大学者,校青年拔尖人才,自动化专业及控制科学与工程学科建设负责人,担任北京自动化学会常务理事、中国自动化学会过程控制专业委员会委员、中国自动化学会教育工作委员会委员、中国化工学会信息技术应用专业委员会副秘书长、中国系统工程学会过程系统工程专业委员会委员等。研究领域为复杂石油石化工业过程智能制造,主要方向有:机理与数据驱动的故障诊断、复杂工业过程建模与优化控制、工业过程计划与调度优化等。主持国家自然科学基金项目2项、北京市自然科学基金面上项目1项、校企联合项目20多项,发表SCI/EI等各类论文50多篇。
Email:x.gao@cup.edu.cn