GAN卷土重来:10亿参数的GigaGAN效果堪比扩散模型
2023-04-22 06:15:16 程序员客栈


(资料图片)

点蓝色字关注“机器学习算法工程师”

设为星标,干货直达!

自从 DALL·E 2 之后,在图像生成方面扩散模型替代GAN成了主流方向,比如开源的文生图模型stable diffusion也是基于diffusion架构的。近日, Adobe研究者在论文Scaling up GANs for Text-to-Image Synthesis提出了参数量为10亿(1B)的GAN模型:GigaGAN,其在文生图效果上接近扩散模型效果,而且推理速度更快,生成512x512大小图像只需要0.13s,生成16M像素图像只需要 3.66s。同时GigaGAN也支持latent空间的编辑功能,比如latent插值,风格混合,以及向量运算等。

GigaGAN改进了StyleGAN架构,采用两阶段训练策略:一个是64x64的图像生成器和一个512x512的图像超分2器,其图像生成器架构如下所示(这里也是采用CLIP text encoder来引入text condition):GigaGAN在 LAION2B-en和 COYO-700M数据集上训练,其在COCO数据集上的FID达到9.09,超过stable diffusion 1.5,推理速度比stable diffusion快20倍多(2.9s vs 0.13s):GigaGAN除了文生图能力,还可以实现可控的合成,比如风格混合,如下图所示:更多效果图和技术细节见论文https://arxiv.org/abs/2303.05511和网站https://mingukkang.github.io/GigaGAN/

热门推荐

文章排行

  1. 2023-04-22GAN卷土重来:10亿参数的GigaGAN效果堪比扩散模型
  2. 2023-04-22“智能汽车计算芯片的引领者”黑芝麻智能亮相上海车展
  3. 2023-04-22每日关注!沼气池原理图解_沼气池原理
  4. 2023-04-22上汽荣威新能源转型提速:未来3年推8款新能源车-全球热消息
  5. 2023-04-22当前最新:新加坡以四大主题玩法、两项战略合作全面重启中国旅游市场
  6. 2023-04-22中科三环(000970):4月21日北向资金减持104.04万股
  7. 2023-04-22美国第一季度“堕落天使”规模占去年全年60%,或创规模纪录-当前热门
  8. 2023-04-22【播资讯】潮州市宝妮珠饰有限公司_关于潮州市宝妮珠饰有限公司介绍
  9. 2023-04-221500余场活动亮相“国际中文日”-天天快看
  10. 2023-04-22热血青春 发现更好玩,vivo游戏节正式启动
  11. 2023-04-2223144代表什么意思_2314
  12. 2023-04-22【独家焦点】浙江杭州:立法为独立网约配送员“撑腰”
  13. 2023-04-22指导价42.78-53.13万元 全新奔驰GLC正式上市
  14. 2023-04-22AMD RX 7600S 笔记本 GPU 测试出炉:不仅满血 RTX 4060
  15. 2023-04-22汉字廿表示什么(汉字廿表示二十) 每日速讯
  16. 2023-04-22精彩看点:今日最新pta期货价格查询(2023年4月21日)
  17. 2023-04-21辉柏嘉水溶性彩铅和油性彩铅的区别(水溶性彩铅和油性彩铅的区别)
  18. 2023-04-21立体贺卡的制作方法简单步骤_立体贺卡的制作方法简单_环球快消息
  19. 2023-04-21【天天速看料】湖南天雁: 湖南天雁机械股份有限公司关于公司2023年度日常关联交易预计情况的的公告
  20. 2023-04-21语料库管理系统怎么写说明_语料库是什么