关注微信公众号:【人工智能前沿讲习】,回复【SFFAI69】获取讲者PPT资料,入交流群,推荐论文下载。
图像分类是使用计算机视觉和机器学习算法从图像中抽取意义的任务。这个操作可以为一张图像分配一个标签,或者也可以解释图像的内容并且返回一个人类可读的句子。图像分类是一个非常大的研究领域,随着深度学习的普及,它还在继续发展。目前此任务较为基础的模型主要为ResNet和DenseNet,本期讲者杨传广设计了一个全新的图像分类模型,解决了两者的缺陷并结合了两者的优势,十分具有启发性。
讲者介绍
杨传广:中科院计算所硕士研究生,主要研究方向为基于图像分类的模型设计与优化,以第一作者在 AAAI-2020会议上发表论文。
报告题目:混合连通性的门限卷积网络来进行图像分类
报告摘要:图像分类是计算机视觉中的基础任务,基于图像分类的深度卷积神经网络模型也在不断地被设计和优化,来达到更好的准确率和更低的复杂度。在图像分类的基础模型中,有两大经典高效的模型,分别是ResNet和DenseNet,两者在图像分类任务上具有优秀的表现同时具有较小的复杂度,但是两者都各具有缺陷。为了解决两者的缺陷并同时结合两者的优势,本文提出了一个高效的混合特征连通性模式用于图像分类,此外,本文还结合了现有的注意力机制操作构造了遗忘门和更新门来实现旧特征和新特征的有效混合。基于上述的结构,本文提出了一个全新的图像分类模型,名为HCGNet。
在CIFAR和ImageNet数据集上的实验结果表明我们的模型以更低的复杂度超过了现有的人工设计的图像分类模型,同时在MS-COCO数据集上的实验结果验证了本模型具有优秀的特征迁移能力。
Spotlight:
- 本文提出了一种混合性的特征连通模式来促进特征重用;
- 本文结合注意力机制引入遗忘门和更新门实现特征的有效混合;
- 本文提出的模型不仅在图像分类任务取得卓越的表现,而且在目标检测和分割任务上具有优秀的迁移能力。
论文推荐
Deep Residual Learning for Image Recognition
推荐理由:ILSVRC-2015 ImageNet数据集上的冠军分类模型,ResNet核心结构是残差连接用于特征重用和防止梯度消失。该模型目前也被广泛作为其他的任务的backbone模型。
Densely Connected Convolutional Networks
推荐理由:改进了ResNet的特征连通性模式,将特征结合由相加变为通道级别的相连,提高了特征重用能力,以显著更低的复杂度获得了更好的性能。
Squeeze-and-Excitation Networks
推荐理由:ILSVRC-2017 ImageNet数据集上的冠军分类模型,提出了轻量级的通道注意力机制,可以在复杂度几乎不提升的情况下有效提升分类性能。
Designing Network Design Spaces
推荐理由:提出了一个新的网络设计范例,从设计网络空间并参数化网络整体的角度出发,结合手工设计和自动搜索得到最终的RegNet结构,超过了先前的SOTA EfficientNet。
GhostNet More Features from Cheap Operations
推荐理由:提出了一个Ghost模块,在模块内部使用廉价的操作从原始的特征图中生成所需信息的“幻影”特征图。根据Ghost模块搭建的GhostNet的性能超过了MobileNet-V3。
ResNeSt Split-Attention Networks
推荐理由:提出一种将特征图分组,并在组内部使用注意力机制将特征图加权聚合来抓住跨通道的关系的模块。将该模块用于ResNet中对分类,检测和分割任务上都有显著提升。
参考资料
https://www.bilibili.com/video/BV1az411v7MS/
https://bbs.sffai.com/d/160