aoi学院

Aisaka's Blog, School of Aoi, Aisaka University

SFFAI 5 | 自省变分自编码器理论及其在图像生成上的应用

关注微信公众号:人工智能前沿讲习班,后台回复:黄怀波,获取PDF资料~
生成模型一直是机器学习和计算机视觉领域的重要研究方向。以生成对抗网络(GANs)和变分自编码器(VAEs)等为代表的深度生成模型已经成为当前人工智能研究的热点问题和重要前沿方向。目前的各种深度生成模型都各有其优点和缺点,比如生成对抗网络的训练稳定性和模式崩溃(mode collapse)问题等,变分自编码器生成图像比较模糊等。针对这些问题,我们提出了一种新的生成模型——自省变分自编码器,用于实现稳定训练和生成高分辨率真实图像


讲者介绍

黄怀波:中国科学院自动化研究所博士生,导师谭铁牛院士。2012年获西安交通大学工学学士学位,2016年获北京航空航天大学工学硕士学位。一直从事计算机视觉和模式识别方法研究,并应用于图像分析,图像生成和图像恢复。近期主要针对图像生成和恢复中遇到的瓶颈问题,展开基础理论和模型设计等研究。

报告题目:自省变分自编码器理论及其在图像生成上的应用

报告摘要:深度生成模型是无监督学习最有前景的方法之一,一直是学术界研究的热点问题。高分辨率真实图像的生成,一直是机器学习和计算机视觉领域的重要研究目标和前沿方向。针对高清真实图像的生成,我们提出一种新的深度生成模型——自省变分自编码器(Introspective Variational Autoencoder,IntroVAE)。该模型一方面在不引入额外的对抗判别器的情况下,克服了变分自编码器固有的合成图像趋于模糊的问题;另一方面在不使用常用的多阶段多判别器策略下,实现了高分辨率图像合成的稳定训练。实验结果表明,该模型不仅能够稳定生成高分辨率照片级图像(比如1024×1024的人脸图像),而且在生成模型常用的量化指标上取得了目前最好的结果。


参考资料

https://www.bilibili.com/video/BV1ft411D7aa/
https://bbs.sffai.com/d/12