基于样本学习服饰图像生成平台的设计与开发

2022-11-11 04:34黄张燕李一媛岑婷婷邓涌康吕燕君
电子测试 2022年20期
关键词:服饰卷积样本

黄张燕,李一媛,岑婷婷,邓涌康,吕燕君

(桂林电子科技大学,广西桂林,541004)

0 引言

随着智能化应用的不断发展,不管是现在和未来,我们都需要一款面向广大用户的智能化生成服装样式和搭配软件。目前我们国内的网络定制服务发展还不够成熟,而人们生活水平和消费水平与日俱增,这一形式迫切需求服装产业在互联网上的快速发展。“壹服设”平台缩短了服饰设计的过程,降低设计成本,节省人力、物力和财力,能快速满足市场对具有时尚、独特、个性化的服饰样式的消费需求,这一功能可以有效地应用到各服装品牌和服装生产厂。同时它还能作为个人APP为广大消费者实现个性化定制,满足不同的消费需求,为用户提供试衣模型,便于购买服装以减少商家库存囤积,同时为广大设计爱好者的提供艺术交流的平台。平台能够在很大程度上促进服装产业的发展。在将来基于智能服饰设计的兴盛是趋势所向,它具有更广阔的发展空间。

1 项目背景

随着我国综合国力的不断增强和在国际舞台地位的提高,国人甚至外国友人对富有传统文化的产品关注度也在提升,当代服装企业为吸引更多的消费者,将增强当代文化服饰体系的钻研的力度,为品牌注入中华传统文化内涵。我国服装业是世界头号产量及出口大国我国服装加工业技术高,在能满足市场需求情况下,还有很大的发展前景。服装的款式设计和色彩搭配是一项耗时耗力却又十分重要的工作。目前,国内服装市场上还没有出现一款可以智能化快速生成服装设计图的软件,此环境下,基于深层卷积生成对抗网络的服装图像生成的方法,大幅减少服饰设计的本钱,是目前市场需求大、真正解决现有问题的创新产品,迎合了市场的需求,具有非常巨大的市场前景。

目前市面上所使用的服装生成器大多使用基于数据的整理分类生成方法,仅能做到随机生成不同的服装搭配,而且由于生成器使用基于数据的整理分类生成方法,导致生成的服装种类只能是已有的款式,针对性不强。进而存在生产水准低下、产品同质化严峻等一连串的问题,无法满足消费者对服装质量、时尚、前卫的需求,此时基于样本学习服饰图像生成平台显得尤为重要。

2 系统软件设计方案与实现

本项目旨在开发一个基于样本学习进行服饰设计搭配的服饰图像生成的Web平台,主要功能包括:服饰生成功能、个性化定制功能、模型试衣功能、社交板块等。为用户提供快捷的服饰设计、搭配参考,基本功能实现后,我们将根据用户反馈,不断完善软件,增加新的功能。

(1)服饰生成功能

根据用户给定的服饰图像自动提取其主要特征(如颜色、纹路、款式),并自动生成新的设计样式,最后通过使用智能优化算法给出合理的服饰搭配设计图。

服饰生成功能采用基于深层卷积生成对抗网络的服装图像生成方法。 首先,结合卷积神经网络强大的特征提取能力、生成对抗网络能很好的学到复杂数据潜在分布的能力,设计并构建了深层卷积生成对抗网络模型,学习服装图像的潜在分布并且生成新的图像。其次针对生成对抗网络难以收敛的问题,引入对噪声鲁棒的激活函数和初始化方法对其改进,使用判别器和生成器的迭代次数比为1: 3的训练策略帮助网络收敛到稳定状态。

(2)个性化定制功能

向用户推荐流行服饰元素、并能根据市场流行元素、图案分类、服装款式分类,给用户定制个性化服饰设计。

卷积神经网络是一种端到端的学习模型,它将会以网络的输入作为原始数据,然后经过多个卷积层、激活层,以及池化层之后,原始数据将会隐性地特征表示,进而达到改善因人工提取特征的偏差导致网络鲁棒性差的问题。

卷积核权值共享机制能够实现减少网络中训练参数个数以及减小网络的复杂度的效果。池化操作能够通过降低特征图的分辨率,具备提取具有空间不变性的特征的能力,这有利于降低了网络模型的计算量,提升了网络的泛化能力。

本文用X 表示输入CNN的原始图像,Fi表示CNN第i层的特征图Fo=X,经过卷积层得到Fi的过程可以表示为:

其中wi表示第i层卷积核的权值向量,运算符号“⊗”表示卷积核与第i-1层特征图的卷积运算操作,卷积运算的结果与第i层的偏移向量bi相加得到线性特征表示,然后通过非线性激活函数f(x)对输出结果去线性化,得到第i层的特征图Fi。卷积层之后通常连接池化层,池化操作这个过程并不会改变特征图的数量,该过程能对特征图的下采样起到二次提取特征的效果。经过池化层得到第i层特征图的过程可以表示为:

经过卷积层和池化层的多次交替传递,获得原始图像的深层特征体现,之后连接1个或者多个全连接层,用来整合卷积层或许池化层中能够辨别类别的部分信息,得到基于输入X的条件概率分布Y(i表示第i个类别的标签):

然后根据具体的任务,选择合适的损失函数loss(W,b),利用梯度更新优化算法对网络中的参数进行更新。

生成对抗网络模型结构由一个生成器G和一个判别器D构成,其中生成器G的任务是将随机噪声z尽量拟合到真实数据的分布Pdata中,并输出生成数据G(z),判断器的工作为辨别出输入样本是真实数据X还是生成数据G(z)。GAN的优化目标是达到纳什均衡,这一优化流程如图1所示。

图1 GAN流程图

判别器D是基于Sigmoid的二分类模型,在生成器G给定的情况下,通过最小化交叉熵损失来优化判别器D,其损失函数为:

其中,E(·)表示期望值,X表示真实数据分布Pdata(x)的采样,Z表示先验分布Pz(z)的采样,通常是100维的随机噪声向量。D(x)表示判别器判别输入样本是真实数据X的概率,D的目标是使其越接近1越好,D(G(z))表示判别器判别输入样本是生成数据G(z)的概率,D的目标是使其越接近0越好,同时G的目标是使其越接近1越好。这是一个关于D和G的零和博弈,此时生成器G的损失函数为:

所以GAN的优化问题是一个极小极大问题,GAN的目标函数为:

在GAN的训练过程中,需要训练优化D的参数来最大化判别不同输入数据的准确率,同时训练优化G的参数来最小化log(1 - D( G( z)))。在训练达到纳什均衡状态的GAN网络中,生成器G掌握了真实数据的分布,学习到随机噪声到真实数据之间的映射关系,并且可以生成与真实数据几近相似的数据样本,此时判别器D对真实数据和生成数据的判别概率都为0.5。

深度学习在图像和视觉领域发展迅速.卷积神经网络(Convolutional neural network,CNN)是一种经典的深度学习模型,具有卷积核权值共享,相连层之间局部连接,降维的池化操作等优良特性,其强大的特征学习能力引起众多科学领域的广泛关注. Goodfellow等在2014年提出生成对抗网络(Generative adversarial networks,GAN)模型.GAN 的提出使得图像生成模型取得了巨大的进展。目前,GAN已经可以生成手写数字图像和自然的人脸图像,给黑白图像上色,从物体轮廓恢复原图像,从低分辨率图像生成高分辨率图像等。此外深度学习是一种基于数据驱动的方法,GAN可以从大量数据中学习到真实数据的潜在分布,将随机的高斯噪声拟合到真实数据的分布中,从而生成与真实数据相似的样本。

(3)模型试衣功能

建立2D人体模型,将生成的平面设计图二维展示,用户可通过模型直观地观察服饰设计效果。

其中模型的收敛性使用Tensorboard可视化训练效果,所有的损失变化图均使用0.926的平滑系数。随着训练次数的增加,生成样本的损失函数变化情况如图2所示,判别器的损失如图3所示。根据图2和图3可以看出生成器和判别器在初始相互对抗的过程中呈现出图中大幅震荡的状态,随着训练次数的增加,两个模型的损失都在逐渐下降,网络模型总体收敛到稳定状态。

图2 d_loss的变化趋势

图3 gloss的变化趋势

猜你喜欢
服饰卷积样本
基于3D-Winograd的快速卷积算法设计及FPGA实现
一种并行不对称空洞卷积模块①
动物“闯”入服饰界
用样本估计总体复习点拨
听诸子百家讲“服饰穿搭”
从《长安十二时辰》看唐代服饰
从滤波器理解卷积
规划·样本
基于傅里叶域卷积表示的目标跟踪算法
随机微分方程的样本Lyapunov二次型估计