机器之心编辑部发布样本自适应的在线卷积稀疏入选ICML2018

机器之心发布

机器之心编辑部

在瑞典斯德哥尔摩国际会展中心举行的机器学习国际会议(ICML)引起了世界科技界的关注。由代表第四范式的国内人工智能企业团队姚全明和香港科技大学研究人员提出的《Online Convolutional Sparse Coding with Sample-Dependent Dictionary:Sample Adaptive Online Convolutional Sparse Coding》入选ICML 2018 .

论文链接:

随着卷积神经网络(CNN)在图像识别中的效果越来越好,CNN越来越受到AI学者的青睐,越来越多的应用开始尝试使用CNN方法。随着研究的深入,其不可解释性以及实验不可重现和可重复的问题越来越严重。与处理图像分类问题的 CNN 相比,卷积稀疏编码 (CSC) 是一种无监督的线性卷积。学习方法。CSC 模型更简单、更直观、更易于分析和理解。因此,最近一些机器学习&机器视觉的巨头(例如Michael Elad——稀疏编码创始人一)开始尝试使用CSC解决应用问题和理解CNN,在应用层面,

与使用所有样本共享的字典进行卷积的传统 CSC 算法不同,本文中的 SCSC 使用样本自适应字典,其中每个滤波器是从数据组合中学习的一组线性基本滤波器。这种增加的灵活性允许捕获大量依赖于样本的模式,这在处理大型或高维数据集时特别有用。在计算上,可以通过在线学习有效地学习得到的模型。大型数据集的实验结果表明,所提出的 SCSC 算法优于现有的 CSC 算法,时间和空间复杂度显着降低。

本文提出的样本自适应卷积稀疏编码(SCSC)主要解决了传统卷积稀疏编码(CSC)无法应用于高维数据(P表示)和更多滤波器(K表示)的问题。SCSC的核心有两点:

(a) 首先,CSC滤波器由两部分表示,第一部分是所有样本共享的基础滤波器(base filters),第二部分是sample-dependent weights(sample-dependent weights)每个样本学习分别地。这样,与标准CSC相比,SCSC方法没有全局滤波器,而是通过每个样本的样本自适应系数,从一堆基本滤波器中组合出自己的滤波器。

(b) 基于上述模型,只有基础过滤器依赖于所有数据。该方法的第二点是我们使用在线学习的方法来快速学习基本过滤器,并且几乎没有记忆。

下图对比了标准CSC算法与研究人员提出的样本自适应SCSC算法:

左为标准CSC算法基于稀疏表示与字典学习的图像去噪算法研究,右为论文提出的样本自适应SCSC算法。相比之下,对于每个测试样本,研究人员将与样本无关的系数 Wi 和基本滤波器 B 结合起来,以创建一个新的样本自适应滤波器。

表 1:SCSC 与其他 CSC 算法在时间/空间复杂度上的比较

与最新的CSC算法相比,SCSC算法的优势主要体现在三个方面:

(1) 大型数据集

在小样本数据集的实验中,论文将SCSC算法与batch CSC算法(包括DeconvNet、fast CSC、fast and flexible CSC等)进行了比较,其中还包括了与SCSC采用相同在线方法的OCSC。该指标使用PSNR(Peak Signal to Noise Ratio),结果如下:

上图显示了各种 CSC 方法在时钟时间的 PSNR 收敛。实验表明,在小样本数据集的情况下,在线CSC算法比批量CSC算法收敛速度更快,具有更好的PSNR。虽然同为在线方法的 OCSC 和 SCSC 具有与 OCSC 相似的 PSNR,但 SCSC 收敛速度更快。

在大样本数据集的实验中,所有的批量 CSC 算法和两种在线 CSC 算法 OCDL DEGRAUX 和 OCDLLU 都无法处理如此大的数据集。因此,研究人员仅将SCSC与OCSC进行了比较,比较结果如下:

在 CIFAR-10 数据集上,研究人员为 SCSC 和 OCSC 设置 K(过滤器数量)= 300。在 Flower 数据集上,SCSC 的 K 值仍然是 300。但是,OCSC 只能使用 k=50,因为它的内存占用要大得多。图 7 显示了测试的 PSNR 的收敛性。在这两种情况下,SCSC 的表现都明显优于 OCSC。

(2) 在高维数据集上的表现

高维数组使用三个数据集:视频数据集、光谱数据集和光场数据集。研究人员将 SCSC 与 OCSC 和 CCSC(分布式 CSC 算法)进行了比较,所有方法仅使用一台机器进行公平比较。值得一提的是,由于 SCSC 的内存占用小,实验者可以在 GTX 1080 TI GPU 上运行这个实验。OCSC 还在 GPU 上运行视频。但是,OCSC 只能在 CPU 上运行多光谱和光场。CCSC 在处理过程中需要访问所有的样本和代码,并且只能在 CPU 上运行。实验结果如下:

根据论文中的实验结果,SCSC是唯一可以在一台机器上处理整个视频、多光谱和光场数据集的方法。相比之下,CCSC 最多只能处理 30 个视频样本、40 个多光谱样本和 35 个光场样本。OCSC 可以处理整个视频和多光谱,但在使用整个光场数据集后 2 天内无法收敛。

至于速度基于稀疏表示与字典学习的图像去噪算法研究,如表4所示,SCSC的速度是最快的。但值得注意的是,这仅供参考,因为 SCSC 在 GPU 上运行,而其他(视频数据集上的 OCSC 除外)在 CPU 上运行。然而,这仍然显示了 SCSC 的一个重要优势,即它的小内存占用可以从 GPU 的使用中受益,而其他的则不能。

(3) 图像去噪与恢复

在之前的实验中,通过重建干净的图像证明了学习字典的优势。在本文中,研究人员进一步研究了学习词典中的两个应用:图像去噪和修复。研究人员使用 SCSC 与(批量 CSC)SBCSC 和(在线)OCSC 进行比较。结果如表5所示:

可以看出,SCSC 获得的 PSNR 始终高于其他方法。它还表明,在图像重建中产生高 PSNR 的字典也可以在其他图像处理应用中带来更好的性能。

未来的工作

同时,研究人员还表示,未来他们将结合自适应在线卷积稀疏编码SCSC和神经网络模型的优势,将样本自适应的思想应用到卷积神经网络模型中。这将增加神经网络迁移学习的能力,同时减少所需的计算量,使这些网络适用于高维和低样本数据。

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论