|本期目录/Table of Contents|

[1]王罕仁,张华熊.基于生成对抗网络与稳定扩散模型的花卉丝巾图案生成方法[J].浙江理工大学学报,2025,53-54(自科四):556-570.
 WANG Hanren,ZHANG Huaxiong.A generative method for floral scarf patterns using GANs and  stable diffusion models[J].Journal of Zhejiang Sci-Tech University,2025,53-54(自科四):556-570.
点击复制

基于生成对抗网络与稳定扩散模型的花卉丝巾图案生成方法()
分享到:

浙江理工大学学报[ISSN:1673-3851/CN:33-1338/TS]

卷:
第53-54卷
期数:
2025年自科第四期
页码:
556-570
栏目:
出版日期:
2025-07-10

文章信息/Info

Title:
A generative method for floral scarf patterns using GANs and  stable diffusion models
文章编号:
1673-3851 (2025) 07-0556-15
作者:
王罕仁张华熊
浙江理工大学,a.信息科学与工程学院;b.计算机科学与技术学院,杭州 310018
Author(s):
WANG HanrenZHANG Huaxiong
a.School of Information Science and Engineering; b.School of Computer Science and Technology,Zhejiang Sci-Tech University, Hangzhou 310018, China
关键词:
丝巾图案图案生成方法生成对抗网络稳定扩散模型图生图数据扩增
分类号:
TS106;TP18
文献标志码:
A
摘要:
以花卉丝巾图案为研究对象,结合生成对抗网络与稳定扩散模型,提出了一种双阶段模型协同生成丝巾图案的快速方法。首先,构建了基于SDXL模型的丝巾图案扩增工作流,通过丝巾图案收集、预处理和扩增,构建了花卉丝巾图案数据集;然后,在丝巾图案生成的第一阶段,将注意力机制融合到StyleGAN框架中,通过集成自注意力与边框注意力机制对现有生成对抗网络进行改进,构建了SABStyleGAN模型,生成基模花卉丝巾图案;最后,在丝巾图案生成的第二阶段,构建了基于SDXL模型的图生图工作流,将稳定扩散模型的细节刻画能力嫁接至生成对抗网络,生成兼具可控性与精细度的精绘花卉丝巾图案。实验结果表明,该方法生成的精绘花卉丝巾图案清晰,FID值低至41.25,与真实样本高度接近。该方法为丝巾图案的快速生成提供了一种高效解决方案,有助于企业降低设计成本、提升生产效率,推动时尚产业的数字化转型。

参考文献/References:

1 Radford A, Metz L, Chintala S, et al. Unsupervised representation learning with deep convolutional generative adversarial networks EB/OL . (2016-01-07) 2025-03-03 . https: arxiv.org/abs/1511 06434v2.

2]任雨佳,陈璐,陈郁.基于DCGAN算法的服装款式交互设计[J.毛纺科技,2022,50(3):93-97.

3Arjovsky M, Chintala S, Bottou L. Wasserstein generative adversarial networksC]∥ Proceedings of the 34th International Conference on Machine Learning. Sydney, Australia. PMLR, 2017: 214-223.

4]田乐,祝双武,王茹,.生成对抗网络及其在纺织行业中的应用[J.纺织科技进展,2023(11):1-7.

5Wu Q, Zhu B, Yong B, et al. ClothGAN: Generation of fashionable Dunhuang clothes using generative adversarial networksJ. Connection Science, 2021, 33(2): 341-358.

6]刘康,马浩然,邢乐.基于生成对抗网络的中式婚服设计[J.服装学报,2024,9(3):208-214.

7Sohl-Dickstein J, Weiss E, Maheswaranathan N, et al. Deep unsupervised learning using nonequilibrium thermodynamicsC]∥Proceedings of the 32nd International Conference on Machine Learning. Lille, France. PMLR, 2015: 2256-2265.

8Ho J, Jain A N, Abbeel P. Denoising diffusion probabilistic modelsC]∥Proceedings of the 34th International Conference on Neural Information Processing Systems. Red Hook, NY: Curran Associates, Inc., 2020: 6840-6851.

9Rombach R, Blattmann A, Lorenz D, et al. High-resolution image synthesis with latent diffusion modelsC]∥2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). June 18-24, 2022, New Orleans, LA, USA. IEEE, 2022: 10674-10685.

10Podell D, English Z, Lacey K, et al. SDXL: Improving latent diffusion models for high-resolution image synthesis . (2023-07-04)2025-03-03.

备注/Memo

备注/Memo:
收稿日期: 2025-03-03
网络出版日期:2025-04-29
基金项目: 浙江省“尖兵”“领雁”研发攻关计划项目(2022C01220)
作者简介: 王罕仁(2000—),男,江西南昌人,硕士研究生,主要从事图像处理方面的研究
通信作者: 张华熊,E-mail:zhxhz@zstu.edu.cn
更新日期/Last Update: 2025-07-08