近日,信息工程学院张健老师课题组的一篇关于压缩感知的研究成果“Deep Memory-Augmented Proximal Unrolling Network for Compressive Sensing”被国际顶级期刊IJCV录用(论文地址:https://link.springer.com/article/10.1007/s11263-023-01765-2)。张健老师课题组主页:https://villa.jianzhang.tech/。
IJCV的全称是 International Journal of Computer Vision(计算机视觉国际期刊),是中国计算机学会推荐的A类学术期刊,其最新JCR影响因子为13.369。IJCV是Springer出版公司的最顶级期刊之一,主要收录有关计算机视觉的数学、物理、计算等多方面,包含图像渲染、计算机图形学、机器人技术等多种应用的优秀研究成果。
压缩感知(CS)是一种信号采集并重构的方法,其旨在从少量线性观测值中重建原始图像信号,以突破奈奎斯特采样极限、极大地降低获取信号的成本。CS应用广泛,其中包括了单像素相机、医疗成像(如CT和MRI)、无限遥感技术以及视频快照等。
压缩感知问题被引起了广泛的关注,目前随着深度学习的出现,也出现了很多基于神经网络的方法,其中可以分为两类,一种是“黑盒”网络,直接通过网络从观测值中学习重建原始图像;另一种是深度展开网络,将优化方法与网络进行结合,从而展开整个迭代过程,进行端到端学习。由于深度展开网络保持实时推理,具有很好的可解释性,目前成为了CS问题的主流方法。
由人类大脑实现记忆的方式得到启发,本文将深度展开网络中每次迭代过程(stage)看作一个神经元,从而信息传递方式可被分为stage内部和stage之间,因此为了增强网络信息传输,本文对这两种方式分别进行精细化设计,如图1所示。
图1. 网络整体框架
在stage内部,本文中提出了自调制模块(SMB),如图2所示。SMB可以自适应地生成仿射变换参数,从而进行元素级特征调制。SMB 在没有增加模型参数的情况下,增大了感受野,使得网络在stage内部高效地提取到更丰富的特征信息。
图2. 自调制模块结构框图
为了增加stage之间的信息传输,本文提出了两种记忆传输机制:高通的短期记忆机制(HSM),跨stage的长期记忆机制(CLM),如图1所示。HSM 在每个stage中引入前一个stage中的多通道信息,强调解决相邻stage间信息损失的问题;CLM 利用LSTM本身具备的长期依赖特性,使得stage间信息具备长距离传输能力。
结合以上设计,本文提出了记忆增强的深度展开网络(MAPUN),并且已在多个数据集上验证了MAPUN的性能最优。
图3. 实验结果
本篇工作的第一作者为信息工程学院张健老师课题组的博士四年级学生宋皆充同学,第二作者为张健老师课题组硕士二年级学生陈斌同学,通讯作者为张健助理教授。以上研究工作在算力方面得到了深圳鹏城实验室的“鹏城云脑”支持。