aoi学院

Aisaka's Blog, School of Aoi, Aisaka University

SFFAI 51 | ICCV'19专场 实例分割 & 人脸识别

SFFAI51 - 高乃钰

SFFAI51 - 王玫

关注微信号:人工智能前沿讲习,回复“高乃钰”,“王玫”获取讲者PPT资料。
国际计算机视觉大会ICCV为计算机视觉方向的三大顶级会议之一,会议的论文集代表了计算机视觉领域最新的发展方向和水平。本期论坛我们邀请了两位ICCV 2019论文作者,来分享他们工作中的思考与创想。


讲者介绍

高乃钰:中国科学院自动化研究所在读博士,主要研究方向为图像分割。

报告题目:基于亲和度金字塔的实例分割

报告摘要:自下而上的实例分割方法通常生成实例无关的语义分割标签和实例感知特征,从而将像素分组为不同的对象实例。先前的方法大多对这两个子任务分别采用单独的模块,在测试阶段需要进行多次前馈,缺乏效率。同时之前的方法在性能上也大大低于自上而下的方法。为此,这项工作提出了一种自下而上的实例分割方法,该方法仅需进行一次前馈就能得到实例分割结果。我们的方法基于像素对亲和度金字塔,层级式地计算了两个像素属于同一实例的概率。此外,结合学习到的亲和度金字塔,我们提出了级联图分割模块,以高效地融合两部分输出并最终实现对实例的分割。该方法在Cityscapes数据集上实现了最先进的性能。

Spotlight:

  1. 基于亲和度金字塔的自下而上实例分割方法;
  2. 图分割模块的加速优化方案。

王玫:北京邮电大学在读博士,主要研究方向AI公平性和迁移学习。

报告题目:自然环境下的多种族人脸:利用信息最大化自适应网络去减少种族偏差

报告摘要:种族偏见是生物特征识别中的一个重要问题,但在人脸识别领域还没有得到深入的研究。在这篇论文中,我们首先提供了一个名为“自然环境下的多种族人脸”(RFW)的数据库。利用该数据库,我们验证了四个商业API和四个当前最先进算法都存在种族偏见。然后,我们进一步提出利用深度无监督域自适应算法来解决种族偏差,并提出了一个深度信息最大化自适应网络(IMAN)。在算法中,我们以白种人作为源域,其他种族作为目标域来缓解这种偏差。这种无监督的方法一方面在域层面减小源域和目标域的全局分布,另一方面在类别层面学习有区分性的目标域特征。此外,我们还提出了一种新的互信息损失,在没有标签的情况下,进一步提高了网络输出的鉴别性。通过在RFW、GBU和IJB-A数据库上进行的大量实验表明,IMAN学习到的特征在不同种族和不同数据库上有很好的泛化性。

Spotlight:

  1. 构建并发布了一个新的RFW测试集,用于研究人脸识别中的种族偏差;
  2. 通过实验验证了现有的人脸识别算法中都普遍存在种族偏差;
  3. 提出了一个新的信息最大化自适应网络,利用无监督域自适应来缓解种族偏差。

论文推荐

  1. PersonLab Person Pose Estimation and Instance Segmentation with a Bottom-Up,Part-Based, Geometric Embedding Model

    推荐理由:该工作以及后续的DeeperLab,Panoptic-DeepLab通过物体关键点加空间偏移向量的方式建模实例分割问题,在多个公开数据集上取得了不错的性能。

  2. Instance Segmentation by Jointly Optimizing Spatial Embeddings and Clustering Bandwidth

    推荐理由:该工作通过联合优化空间偏移向量和聚类带宽实现了较好的实例分割性能。其中,基于可学习的聚类带宽实现尺度归一化,以及基于Lovasz-hinge 损失实现端到端训练均具有借鉴意义。

  3. Object as Distribution

    推荐理由:该工作从物体表征方式(包围框、多边形、像素等)的角度分析了物体检测与分割算法,并提出使用二元正态分布作为更加鲁棒的物体表征。其中对于多种物体表征方式优劣势的分析具有借鉴意义。

  4. Predicting Positive and Negative Links in Online Social Networks

    推荐理由:这篇文章在非深度学习时代研究了人口统计学对人脸识别算法性能的影响。通过测试六种不同的人脸识别算法(三种商用,两种非训练,一种可训练)对不同种族、性别、年龄的人群的识别能力,较早的得出了人脸识别中的偏差来源于数据和算法两个方面。

  5. Uncovering and Mitigating Algorithmic Bias through Learned Latent Structure

    推荐理由:这篇文章主要研究了在人脸检测中的性别偏差和种族偏差问题。该文章将原始的学习任务与变分自编码器相融合,学习数据集中的潜在结构,然后在训练时自适应地使用所学习的潜在分布来重新加权某些数据点的重要性,通过这种方式来缓解算法偏差。

  6. Deep Visual Domain Adaptation A Survey

    推荐理由:这是一篇深度域自适应的综述,总结了近年来深度域自适应的各类方法,并将其分为基于差异的方法、基于对抗的方法和基于重构的方法。该文章还总结了深度域自适应在图像检测、分割、人脸识别等领域的应用。


参考资料

https://www.bilibili.com/video/BV1qJ411y7jS/
https://bbs.sffai.com/d/119/2