|本期目录/Table of Contents|

[1]钟梓锐,梁玲琳.基于美学梯度法的人工智能风格化绘画系统[J].浙江理工大学学报,2024,51-52(自科四):537-547.
 ZHONG Zirui,LIANG Linglin.An artificial intelligence stylized painting system  based on the aesthetic gradient method[J].Journal of Zhejiang Sci-Tech University,2024,51-52(自科四):537-547.
点击复制

基于美学梯度法的人工智能风格化绘画系统()
分享到:

浙江理工大学学报[ISSN:1673-3851/CN:33-1338/TS]

卷:
第51-52卷
期数:
2024年自科第四期
页码:
537-547
栏目:
出版日期:
2024-07-10

文章信息/Info

Title:
An artificial intelligence stylized painting system  based on the aesthetic gradient method
文章编号:
1673-3851 (2024) 04-0537-11
作者:
钟梓锐梁玲琳
浙江理工大学艺术与设计学院,杭州 310018
Author(s):
ZHONG Zirui LIANG Linglin
School of Art and Design, Zhejiang Sci-Tech University, Hangzhou 310018, China
关键词:
人工智能绘画模型Stable diffusion美学梯度法感性需求风格化
分类号:
TP18
文献标志码:
A
摘要:
当前Stable diffusion等人工智能绘画模型在绘画时难以直接控制图像风格,同时风格模型训练仅针对单种风格。针对该问题,提出了一种基于美学梯度法的人工智能风格化绘画系统,以实现多种图像风格的控制和融合,并提供更加便捷的图像创作体验。收集并分析网络用户数据,结合问卷得到用户对图像风格的感性需求;根据感性需求收集各风格图像数据得到对应的风格图像训练集。使用梯度下降算法计算风格化文本编码器的权重,实现生成图像风格化的效果。通过可用性测试对比用户对该系统与传统人工智能绘画系统产出图像的风格满意程度,结果表明:人工智能风格化绘画系统的平均满意度相较传统人工智能绘画系统提升23%,表明人工智能风格化绘画系统在图像风格生成上具有更好的效果,可满足用户对图像风格的需求。该人工智能风格化绘画系统可以更便捷地实现图像风格调整,允许用户直观选择不同风格的权重,便捷使用一种或多种风格,能够有效满足用户对图像风格设计的需求。

参考文献/References:

1 RameshA, Dhariwal P, Nichol A, et al. Hierarchical text - conditional image generation with CLIP latents. (2022 - 04 - 13) 2023 - 03 - 06 .

2 JianY N, Yu F X, Singh S, et al. Stable diffusion for aerial object detection. (2023 - 11 - 21) 2023 - 11 - 30 .

3 KuangZ Y, Zhang J X, Huang Y Y, et al. Advancing urban renewal: an automated approach to generating historical arcade facades with stable diffusion models. (2023 - 11 - 20) 2023 - 11 - 30 .

4 ChangD, Shi Y, Gao Q, et al. MagicDance: Realistic human dance video generation with motions & facial expressions transfer. (2023 - 11 - 18) 2023 - 11 - 30 .

5 LuoH S, Ji L, Zhong M, et al. CLIP4Clip: An empirical study of CLIP for end to end video clip retrieval and captioning J . Neurocomputing, 2022, 508(C): 293 - 304.

6 RonnebergerO, Fischer P, Brox T. U - Net: Convolutional networks for biomedical image segmentation C ]∥ International Conference on Medical Image Computing and Computer - Assisted Intervention. Cham: Springer, 2015: 234 - 241.

7 BorjiA. Generated faces in the wild: Quantitative comparison of stable diffusion, midjourney and dall - e 2. (2023 - 6 - 5) 2023 - 11 - 30 .

8 GalR, Alaluf Y, Atzmon Y, et al. An image is worth one word: Personalizing text - to - image generation using textual inversion . (2023 - 8 - 2) 2023 - 11 - 30 .

9 RuizN, Li Y Z, Jampani V, et al. DreamBooth: Fine tuning text - to - image diffusion models for subject - driven generation C ]∥ 2023 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Vancouver, BC, Canada. IEEE, 2023: 22500 - 22510.

10 GallegoV. Personalizing text - to - image generation via aesthetic gradients. (2023 - 9 - 25) 2023 - 11 - 30 .

undefined

备注/Memo

备注/Memo:
收稿日期: 2023-11-17
网络出版日期:2024-05-10
基金项目: 国家社会科学基金青年项目(22CXW024)
作者简介: 钟梓锐(1999—),男,广州人,硕士研究生,主要从事人工智能绘画方面的研究
通信作者: 梁玲琳,E-mail:lianglinglin916@126.com
更新日期/Last Update: 2024-08-01