StyleGAN-XL:将 StyleGAN 扩展到大型多样化数据集

  最近,计算机图形学经历了以数据为中心的方法的激增,用于照片级逼真和可控的内容创建。StyleGAN 尤其为关于图像质量和可控性的生成建模设定了新标准。然而,StyleGAN 的性能在 ImageNet 等大型非结构化数据集上严重下降。StyleGAN 是为可控性而设计的;因此,先前的工作怀疑其限制性设计不适合不同的数据集。相比之下,我们发现主要的限制因素是当前的训练策略。遵循最近引入的投影 GAN 范式,我们利用强大的神经网络先验和渐进式增长策略在 ImageNet 上成功训练了最新的 StyleGAN3 生成器。我们的最终模型 StyleGAN-XL,在大规模图像合成方面树立了新的最先进技术,并且是第一个在这样的数据集规模上生成分辨率为 $1024^2$ 的图像。我们证明该模型可以在肖像或特定对象类的狭窄领域之外反转和编辑图像。

论文作者:Axel Sauer, Katja Schwarz, Andreas Geiger

论文地址:

https://arxiv.org/abs/2202.00273v1

下载权限

查看
  • 免费下载
    评论并刷新后下载
    登录后下载

  • {{attr.name}}:
您当前的等级为
登录后免费下载登录 小黑屋反思中,不准下载! 评论后刷新页面下载评论 支付以后下载 请先登录 您今天的下载次数(次)用完了,请明天再来 支付积分以后下载立即支付 支付以后下载立即支付 您当前的用户组不允许下载升级会员
您已获得下载权限 您可以每天下载资源次,今日剩余

给TA买糖
共{{data.count}}人
人已赞赏
论文推荐

排名信息噪声对比估计:通过排名正面促进对比学习

2022-1-30 20:31:39

论文推荐

FigARO:通过精细的艺术控制生成符号音乐

2022-2-9 14:39:23

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
搜索