我国对于智能化安检有着迫切需求。2019年,我国每天产生1亿个快递包裹,民航运输总量6.6亿人次,铁路发送量33.7亿人次,数量逐年快速增长。当前安检严重依赖于人工操作,高强度、重复性的工作环境,导致安检人员出现身体与精神的双重疲劳,造成漏检、错检、忘检等人为事故。因此,智能安检势在必行。但当前智能安检技术在稳定性、鲁棒性、实用性方面均未满足落地应用的需求,亟待引入新的理论技术。因此本项目的科学问题属性为“需求牵引,突破瓶颈”。从计算机视觉角度出发,构建X光安检图像内容智能分析模型,在不改变硬件成像设备的前提下实现智能安检,在技术与应用上都具备可行性。X光安检图像中的违禁品目标检测属于计算机视觉中的“What in Where”问题,即不仅要知道违禁品的种类,而且要确定违禁品所处的位置,甚至是其轮廓信息。X光安检图像存在如下特点:违禁品多尺度性。违禁品种类繁多,不同违禁品的尺寸相差明显;背景杂乱。旅客行李中物品摆放随意,种类多样,导致图片背景复杂混乱;物体重叠。由于X射线的透视成像性质,导致物体之间相互遮挡、颜色混叠。以上特点致使传统的目标检测技术无法完成稳定、准确的安检图像违禁品智能检测任务。深度学习技术的广泛发展为安检图像智能分析带来了新的处理手段。本项目结合神经科学中的相关研究成果,构建基于视觉注意力机制的X光安检图像违禁品弱监督检测模型,探索如何把人类视觉本身所具有的注意力机制、视觉反馈机制、神经元激励抑制机制等基本工作模式科学地融入卷积神经网络框架中,并结合安检图像识别的特定任务创建可实现违禁品智能检测的新型网络模型。依靠注意力机制实现目标定位属于弱监督学习策略,训练阶段仅依靠图像类别属性,极大缓解了数据标注压力。课题研究成果不仅能够推动智能安检技术进步,而且能够引导计算机视觉目标检测理论技术发展,在实际应用与理论技术层面,具有重要的科学研究价值。
本研究从智能安检的角度出发,在不改变安检硬件设备的基础上,采用图像处理技术,构建深度学习框架下的X 光机安检图像智能分析模型。具体研究内容如下:
(1)X 光机安检图像数据库构建
(2)X 光机安检图像数据库扩充
(3)深度卷积神经网络构建
(4)视觉注意力机制下X 光机安检图像违禁品语义分割
(5)检测算法性能对抗性优化
本项目特色之处在于:以人的视觉机理为基础,在深度卷积神经网络框架下通过融入视觉反馈机制,实现X 光机安检图像中违禁品目标的识别、定位与分割,解决智能安检所需的What 和Where 这两个基本工作需求。本项目的主要创新点可归纳如下:
(1)建立满足深度学习训练需求的X 光机安检图像数据库,解决网络训练所需的数据基准问题;
(2)运用生成式对抗网络(GAN)模型解决安检图像的生成和合成问题,扩增安检图像数据集,为系统稳定性奠定基础;
(3)建立适合安检图像处理的CNN 特征提取框架,解决安检图像处理中遇到的多尺度、多种类、背景杂乱、相互遮挡等实际应用问题。
(4)构建注意力机制下的弱监督目标定位模型,以人的视觉注意力机制为指导,在深度卷积神经网络的基础上建立反馈机制,实现高层特征(语义)到具体目标的非线性映射;
(5)以人的视觉反馈机制为基础,建立神经网络链路的修剪模型,并利用优化方式通过计算完成链路选择;引入神经元激励的抑制模型,实现特征与目标相关的神经元激励加强和不相关视觉任务的抑制问题;
(6)结合安检开机员的实际培训流程,建立人机对抗模型优化系统,逐渐改善模型性能。