论文题目:Data Subdivision Based Dual-weighted Robust Principal Component Analysis

论文第一作者:王思思

期刊名称:IEEE Transactions on Image Processing

论文链接:https://ieeexplore.ieee.org/document/10878426

论文概述:该论文对机器学习方法中所涉及的模型鲁棒性问题进行了深入地剖析,从根本上解决了数据样本中强噪声数据以及干扰特征降低模型鲁棒性的问题,通过巧妙设计双权重叠加互补策略以及最优均值联合优化算法,实现数据的精细化管理,有效地提升了模型对数据中关键特征的学习。

该论文的主要贡献包括以下四点:(1)为了从根本上解决强噪声数据对模型性能的负面影响,首先设计标记向量区分正样本和强噪声样本,并根据标记权重直接剔除强噪声数据。(2)其次,将正样本划分为干净样本和噪声样本。由于两者之间没有明显的边界,对所有被标记向量标记为正样本的数据构造自约束权重,根据自约束权值对数据进行相对定位,其目的是赋予干净样本较大的权重,赋予噪声样本较小的权重,从而更好地学习投影矩阵。(3)为了保持模型的旋转不变性,采用平方2范数最小化重构误差。不仅如此,该模型还同时优化数据均值,使数据中心更加精确,更有利于挖掘数据中的关键信息。(4)为了求解该目标函数,文中探索了一种有效的迭代算法,并进行了相关的理论证明。最后,在真实数据集和大型RGB数据集上进行了实验验证,结果表明本文提出的DRPCA不仅能够更有效地表达数据特征,而且具有更强的异常检测能力。图1和图2分表展示了DRPCA在数据重构以及异常检测方面的表现。

1 数据重建实验结果

2 异常检测实验结果(绿色框表示已检出,红色框表示未检出)