当前位置: 主页 > 学术动态 >

一致性与视图特定的隐因式多视图聚类

点击数:   更新日期: 2021-05-10

论文题目: Multi-view subspace clustering with consistent and view-specific latent factors and coefficient matrices

发表会议: The International Joint Conference on Neural Networks (IJCNN 2021),CCF-C类会议

作者列表:

1) 卢润坤 中国石油大学(北京)信息科学与工程学院 16

2) 刘建伟 中国石油大学(北京)信息科学与工程学院

3) 中国石油大学(北京)信息科学与工程学院

4) 李卫民 上海大学 计算机工程与科学学院

背景与动机

在多视图学习的研究工作中,子空间聚类是一个典型的学习任务,同时也是最受研究者关注的方向之一。大部分多视图子空间聚类其实是基于自表示的子空间聚类算法,这类算法认为,一系列子空间中的每个数据都能够被其它数据线性表示。大多数现有的多视图子空间聚类算法主要关注两个方面的信息,一是子空间表示的先验约束,二是隐表示的构造形式。对于前者,对子空间表示引入不同的限制会得到不同的效果,例如,Brbić等人在每个视图上均进行了自表示重构,并为每个视图的自表示系数矩阵同时添加了稀疏与低秩限制,之后将所得各个视图的系数矩阵求平均,从而构建谱聚类所需的邻接矩阵;Weng等人也是首先在每个视图上均进行了自表示重构,但引入了拉普拉斯正则化项将多个系数矩阵整合为了一个一致性自表示系数矩阵,这种将整合多个系数矩阵的过程嵌入至学习流程中的方式更具解释性。此外,关于隐表示的构造形式,研究者往往尝试挖掘各个视图间潜在的互补性与一致性信息,获取更加完备且不冗余的隐表示,从而提升学习任务的性能。例如,Chen等人提出的工作可以获得多个视图中的互补性嵌入隐表示;Zheng等人首先将所有视图的数据拼接,并用稀疏诱导范数约束自表示重构项中的噪声从而可以使模型能够利用到各个视图间潜在的一致性信息。相比于学习更完备的隐表示,大多数工作将注意力集中于子空间表示的先验约束与学习过程。然而,基于自表示的子空间聚类算法的表现依赖于数据表示的质量,多数子空间聚类算法都假设数据表示分布良好,不符合真实数据集的实际情况。因此,在子空间自表示学习的过程中引入表示学习很有意义,其不仅能为子空间聚类提供好的表示,也能利用子空间学习任务更好的挖掘数据的潜在信息。

本文基于以上动机,提出了一种能够同时挖掘并分离多个视图中相互耦合的一致性与互补性隐表示的矩阵因式分解方法。其中,一致性表示指所有视图共享的信息,互补性表示则是各个视图独有的却能够互相弥补其余视图信息缺失的特有信息。基于此,本章进一步提出种子空间学习策略-子空间级分层策略:基于一致性与视图特有隐因子与子空间的多视图子空间聚类(Multi-View Subspace Clustering with Consistent and view-Specific Latent Factors and SubspacesMVSC-CSLFS)。MVSC-CSLFS为不同视图的一致性与互补性表示设计了不同自表示重构方法,即分别用Frobenius范数与核范数来约束互补性与一致性隐表示对应的子空间表示矩阵,此方法通过为不同性质的隐表示设计更合适的子空间聚类策略,从而获取更佳的聚类效果。此外,本章还为提出的方法引入了自适应的动态权重,从而可以在不同学习阶段衡量各个视图对学习的贡献,该机制也可以提升模型抵抗噪声和不可靠视图所带来的影响。最后,本章将采用基于增广拉格朗日乘子的交替方向最小化算法来求解我们提出的模型,并通过与多种基准算法在大量的真实数据集中的对比来验证所提出算法的效果。本章研究的主要贡献如下所示:

(1)通过同时考虑多个视图的一致性与互补性信息,我们提出的隐因子提取算法能够帮助MVSC-CSLFS获取更加紧凑且完备的隐表示,且能将隐表示中这些耦合的信息分离,使隐表式有更为明确的语义信息。

(2)MVSC-CSLFS对不同属性隐式因子对应的子空间表示使用不同的先验约束,因此能够将为相应的隐表式设计符合其语义信息的子空间聚类策略。

(3)为了消除不可靠视图带来的影响,同时在学习中能够衡量不同视图的贡献,本章在表示学习阶段和子空间聚类阶段均引入了动态权重策略。

设计与实现

本文提出的矩阵因式化过程如下图所示:

目标函数为:

4c275722d33544ca8d7ff292355f025b.png

实验结果:

1. 收敛性分析

2. 邻接矩阵可视化

3. 聚类效果

4. 消融分析

作者简介

刘建伟,副教授,博士生导师/硕士生导师。长期从事模式识别与智能系统、复杂系统分析与智能控制、机器学习和数据挖掘方面的研究工作。美国数学会《数学评论》评论员,中国人工智能学会机器学习分会高级会员。在计算机学报,自动化学报、计算机研究与发展、Neurocomputing、TNNLS等期刊上和国内国际会议上发表学术研究论文200多篇,其中三大检索150多篇。联系方式:liujw@cup.edu.cn