|
中山大学学报(自然科学版) 2017
混合深度网络在场景识别技术中的应用Keywords: 场景识别,混合深度结构,直连卷积自编码,金字塔Fisher编码,数据扩充 Abstract: 摘要 场景识别是计算机视觉领域重要的研究方向,场景图片的类间相似性和类内差异性使得场景识别极具挑战性.提出一种混合深度场景识别方法,该模型首先在混合识别的Fisher编码层和判别层之前用深度直连自编码器作为图像局部特征提取层,完善了整个混合深度识别框架.采用直连非监督深度网络输出直接重构输入,能够提取更有判别性的中尺度局部特征.本文还在Fisher编码层引入金字塔空间信息,考虑局部特征空间分布.此外,通过改变场景图片对应局部图像块的构成实现场景数据扩充.引入图片所在类中出现概率低的图像块作为类内干扰加入原图像块中,减少类内差异误判.为了减少类间相似性影响,通过信息熵度量保留图片的类间相似的图像块,引入相似类中特有的关键图像块,替换原先类别相关的图像块,同时改变对应标签,突出关键图像块对相似类别判断的决定性.在scene15数据集上的实验表明本文方法可以有效提高场景识别的准确率
|