图像生成方法、装置、计算机、存储介质及程序产品与流程

    技术2024-12-22  50


    本技术涉及计算机,尤其涉及一种图像生成方法、装置、计算机、存储介质及程序产品。


    背景技术:

    1、随着基于扩散模型的生成模型的出现,图像可控生成领域取得了显著进展,使得技术可以广泛应用到图像创作及编辑等产品中。常规图像生成采用文本描述驱动文生图模型在潜在空间借助去噪结构进行噪声预测,从而去除噪声获得目标图像生成。一般情况下,会借助垫图方式进行图文控制生成,也就是将约束图作为输入进行编码处理,再采用文本在约束图基础上进行控制生成,该方式是对原图像(即约束图)进行编辑,使得最终生成的图像相对于约束图的画面色彩及环境布局等都相差不远,相比起原约束图来说可编辑性不强,导致图像生成的准确性较差,图像生成性能较差。


    技术实现思路

    1、本技术实施例提供了一种图像生成方法、装置、计算机、存储介质及程序产品,可以提高图像生成的准确性及生成的图像的质量。

    2、本技术实施例一方面提供了一种图像生成方法,该方法包括:

    3、获取媒体数据样本及样本引导数据;

    4、在初始图像生成模型中,采用样本引导数据对媒体数据样本进行下采样处理,得到下采样样本特征;下采样处理用于进行维度降低及特征提取;

    5、在初始图像生成模型中,采用样本引导数据对下采样样本特征进行上采样处理,得到上采样样本特征,采用初始拼接参数对下采样样本特征与上采样样本特征进行加权拼接以及去噪处理,得到样本去噪特征;上采样处理用于进行维度增加及图像恢复;

    6、通过初始图像生成模型对样本去噪特征进行解码处理,得到样本图像数据,获取样本图像数据的图像评估指标;

    7、通过初始拼接参数与图像评估指标构建数据分布关系,从数据分布关系中搜索特征拼接参数,将包括特征拼接参数的初始图像生成模型确定为目标图像生成模型;目标图像生成模型用于根据图像引导数据生成图像数据。

    8、本技术实施例一方面提供了一种图像生成方法,该方法包括:

    9、获取初始媒体数据,获取图像引导数据;

    10、在目标图像生成模型中,采用图像引导数据对初始媒体数据进行下采样处理,得到下采样语义特征;下采样处理用于进行维度降低及特征提取,下采样处理所使用的参数为超参数;

    11、在目标图像生成模型中,采用图像引导数据对下采样语义特征进行上采样处理,得到上采样语义特征,采用特征拼接参数对下采样语义特征与上采样语义特征进行加权拼接以及去噪处理,得到去噪特征;上采样处理用于进行维度增加及图像恢复,上采样处理所使用的参数为超参数,特征拼接参数是从针对媒体数据样本所构建的数据分布关系中搜索得到的参数;数据分布关系用于表示由初始拼接参数,以及基于初始拼接参数对媒体数据样本进行预测得到的图像评估指标构建的关系;

    12、通过目标图像生成模型对去噪特征进行解码处理,得到目标图像数据;目标图像数据具备图像引导数据所指示的特征。

    13、本技术实施例一方面提供了一种图像生成装置,该装置包括:

    14、样本获取模块,用于获取媒体数据样本及样本引导数据;

    15、样本下采样模块,用于在初始图像生成模型中,采用样本引导数据对媒体数据样本进行下采样处理,得到下采样样本特征;下采样处理用于进行维度降低及特征提取;

    16、样本上采样模块,用于在初始图像生成模型中,采用样本引导数据对下采样样本特征进行上采样处理,得到上采样样本特征,采用初始拼接参数对下采样样本特征与上采样样本特征进行加权拼接以及去噪处理,得到样本去噪特征;上采样处理用于进行维度增加及图像恢复;

    17、样本解码模块,用于通过初始图像生成模型对样本去噪特征进行解码处理,得到样本图像数据,获取样本图像数据的图像评估指标;

    18、参数调整模块,用于通过初始拼接参数与图像评估指标构建数据分布关系,从数据分布关系中搜索特征拼接参数,将包括特征拼接参数的初始图像生成模型确定为目标图像生成模型;目标图像生成模型用于根据图像引导数据生成图像数据。

    19、其中,该样本获取模块,可以用于:

    20、获取初始图像生成模型,获取业务描述信息以及初始图像生成模型所对应的模型训练集合;初始图像生成模型为已经训练完成的模型;

    21、从模型训练集合中获取具备业务描述信息所指示的特征的媒体数据样本,根据业务描述信息生成样本引导数据。

    22、其中,在从模型训练集合中获取具备业务描述信息所指示的特征的媒体数据样本时,该样本获取模块可以用于:

    23、识别模型训练集合所包括的训练图像样本的样本描述信息,获取训练图像样本的样本描述信息与业务描述信息之间的信息相似度,将信息相似度大于或等于业务关联阈值的样本描述信息所对应的训练图像样本,确定为媒体数据样本;或者,

    24、基于业务描述信息确定图像生成任务所针对的业务对象,从模型训练集合所包括的训练图像样本中识别业务对象,将识别出业务对象的训练图像样本确定为媒体数据样本。

    25、其中,在从模型训练集合中获取具备业务描述信息所指示的特征的媒体数据样本时,该样本获取模块可以用于:

    26、从模型训练集合中获取具备业务描述信息所指示的特征的初始图像样本,将初始图像样本确定为媒体数据样本;或者,

    27、从模型训练集合中获取具备业务描述信息所指示的特征的初始图像样本,对初始图像样本进行图像优化处理,得到媒体数据样本;或者,

    28、从模型训练集合中获取具备业务描述信息所指示的特征的初始图像样本,获取初始图像样本的样本质量,基于样本质量从初始图像样本中确定媒体数据样本。

    29、其中,下采样样本特征包括下采样残差特征、下采样自注意特征及下采样交叉注意特征;

    30、该样本下采样模块,可以用于:

    31、在初始图像生成模型中,对媒体数据样本所对应的媒体样本特征进行残差处理,得到下采样残差特征;残差处理用于保留残差处理前的特征;

    32、对下采样残差特征进行自注意处理,得到下采样自注意特征;下采样自注意特征用于表示媒体数据样本自身的语义信息;

    33、获取样本引导数据所对应的样本引导特征,将下采样自注意特征与样本引导特征进行特征融合,得到下采样交叉注意特征;下采样交叉注意特征用于表示媒体数据样本与样本引导数据的组合语义信息。

    34、其中,该装置还包括:

    35、样本编码模块,用于对媒体数据样本进行编码处理,得到样本编码特征;

    36、噪声生成模块,用于基于样本编码特征的特征维度,生成样本噪声数据;

    37、样本融合模块,用于对样本编码特征与样本噪声数据进行特征融合,得到媒体样本特征。

    38、其中,该样本上采样模块可以用于:

    39、当i为大于1且小于或等于m的正整数时,在初始图像生成模型的第i个上采样块中,采用样本引导数据对第i-1个样本去噪特征进行上采样处理,得到第i个上采样样本特征,获取第m-i+1个下采样块所生成的第m-i+1个下采样样本特征,采用第i个上采样块中的第i个初始拼接参数,对第m-i+1个下采样样本特征与第i个上采样样本特征进行加权拼接,得到第i个样本预测特征,若i为m,则对第m个样本预测特征进行去噪处理,得到样本去噪特征;m为初始图像生成模型所包括的上采样块的数量;

    40、当i为1时,在初始图像生成模型的第一个上采样块中,采用样本引导数据对第m个下采样样本特征进行上采样处理,得到第一个上采样样本特征,采用第一个初始拼接参数对第m个下采样样本特征与第一个上采样样本特征进行加权拼接,得到第一个样本预测特征。

    41、其中,在获取样本图像数据的图像评估指标时,该样本解码模块可以用于:

    42、获取样本图像数据与样本引导数据之间的数据相似度,获取样本图像数据的图像质量;

    43、采用图像清晰检测模型对样本图像数据进行清晰度检测,得到样本图像数据的图像清晰度;

    44、对数据相似度、图像质量以及图像清晰度进行加权求和,得到样本图像数据的图像评估指标。

    45、其中,该装置还包括:

    46、权重确定模块,用于获取相似权重范围,获取模型训练需求信息,基于模型训练需求信息从相似权重范围中获取相似度权重;

    47、该权重确定模块,还用于基于相似度权重确定剩余权重,将剩余权重拆分为质量权重及清晰度权重;

    48、在对数据相似度、图像质量以及图像清晰度进行加权求和,得到样本图像数据的图像评估指标时,该样本解码模块可以用于:

    49、采用相似度权重、质量权重及清晰度权重,对数据相似度、图像质量以及图像清晰度进行加权求和,得到样本图像数据的图像评估指标。

    50、其中,该装置还包括:

    51、参数生成模块,用于获取第一参数范围及第二参数范围,在第一参数范围内随机生成n个第一初始参数,在第二参数范围内随机生成n个第二初始参数;n为正整数,第一初始参数用于对下采样样本特征进行加权处理,第二初始参数用于对上采样样本特征进行加权处理;

    52、该参数生成模块,还用于对n个第一初始参数及n个第二初始参数进行组合,得到n个初始拼接参数;每个初始拼接参数包括一个第一初始参数,以及一个第二初始参数。

    53、其中,初始拼接参数的数量为n,样本引导数据的数量为h,n为正整数,h为正整数;样本图像数据的数量为n*h;

    54、在通过初始拼接参数与图像评估指标构建数据分布关系,通过数据分布关系对初始拼接参数进行调整,得到特征拼接参数时,该参数调整模块可以用于:

    55、基于在每个初始拼接参数下,h个样本引导数据分别对应的图像评估指标的统计值,确定n个初始拼接参数分别对应的初始参数质量;

    56、将n个初始拼接参数与n个初始拼接参数所对应的初始参数质量,组成n个数据对;每个数据对包括一个初始拼接参数及该初始拼接参数所对应的初始参数质量;

    57、根据n个数据对构建数据分布关系;

    58、若数据分布关系中的最大参数质量收敛,则将数据分布关系中最大参数质量所对应的拼接参数,确定为特征拼接参数;

    59、若数据分布关系中的最大参数质量不收敛,则从数据分布关系中获取最大参数质量所关联的更新拼接参数,获取h个样本引导数据在更新拼接参数下的图像评估指标。

    60、本技术实施例一方面提供了一种图像生成装置,该装置包括:

    61、数据获取模块,用于获取初始媒体数据,获取图像引导数据;

    62、数据下采样模块,用于在目标图像生成模型中,采用图像引导数据对初始媒体数据进行下采样处理,得到下采样语义特征;下采样处理用于进行维度降低及特征提取,下采样处理所使用的参数为超参数;

    63、数据上采样模块,用于在目标图像生成模型中,采用图像引导数据对下采样语义特征进行上采样处理,得到上采样语义特征,采用特征拼接参数对下采样语义特征与上采样语义特征进行加权拼接以及去噪处理,得到去噪特征;上采样处理用于进行维度增加及图像恢复,上采样处理所使用的参数为超参数,特征拼接参数是从针对媒体数据样本所构建的数据分布关系中搜索得到的参数;数据分布关系用于表示由初始拼接参数,以及基于初始拼接参数对媒体数据样本进行预测得到的图像评估指标构建的关系;

    64、数据解码模块,用于通过目标图像生成模型对去噪特征进行解码处理,得到目标图像数据;目标图像数据具备图像引导数据所指示的特征。

    65、其中,在获取初始媒体数据时,该数据获取模块可以用于:

    66、获取随机种子,根据随机种子生成随机噪声数据,将随机噪声数据确定为初始媒体数据;或者,

    67、获取随机种子,根据随机种子生成随机噪声数据,获取输入图像数据,对随机噪声数据与输入图像数据进行融合,得到初始媒体数据。

    68、本技术实施例一方面提供了一种计算机设备,包括处理器、存储器、输入输出接口;

    69、处理器分别与存储器和输入输出接口相连,其中,输入输出接口用于接收数据及输出数据,存储器用于存储计算机程序,处理器用于调用该计算机程序,以使包含该处理器的计算机设备执行本技术实施例一方面中的图像生成方法。

    70、本技术实施例一方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,该计算机程序适于由处理器加载并执行,以使得具有该处理器的计算机设备执行本技术实施例一方面中的图像生成方法。

    71、本技术实施例一方面提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本技术实施例一方面中的各种可选方式中提供的方法。换句话说,该计算机指令被处理器执行时实现本技术实施例一方面中的各种可选方式中提供的方法。

    72、实施本技术实施例,将具有如下有益效果:

    73、在本技术实施例中,可以获取媒体数据样本及样本引导数据;在初始图像生成模型中,采用样本引导数据对媒体数据样本进行下采样处理,得到下采样样本特征;下采样处理用于进行维度降低及特征提取;在初始图像生成模型中,采用样本引导数据对下采样样本特征进行上采样处理,得到上采样样本特征,采用初始拼接参数对下采样样本特征与上采样样本特征进行加权拼接以及去噪处理,得到样本去噪特征;上采样处理用于进行维度增加及图像恢复;通过初始图像生成模型对样本去噪特征进行解码处理,得到样本图像数据,获取样本图像数据的图像评估指标;通过初始拼接参数与图像评估指标构建数据分布关系,从数据分布关系中搜索特征拼接参数,将包括特征拼接参数的初始图像生成模型确定为目标图像生成模型;目标图像生成模型用于根据图像引导数据生成图像数据。通过在图像生成模型中引入拼接参数,使得对上下采样特征的拼接参数变化成为超参数向量,使得可以对图像生成模型中的生成特征进行更细节性的调节,提高图像生成的准确性以及生成的图像的质量。而且通过进行数据分布关系构建,对拼接参数的应用效果(即图像评估指标)进行量化评估,实现对拼接参数的更新优化,得到优化后的特征拼接参数,从而可以进一步提高最终的目标图像生成模型的模型质量及性能,进而提高图像生成的准确性。再加上,在本技术中,只需对拼接参数进行优化调整,使得模型训练的数量很小,使得在对图像生成模型的功能进行调整时,也只需要处理较小的数据量,提高模型训练的灵活性及模型质量。


    技术特征:

    1.一种图像生成方法,其特征在于,所述方法包括:

    2.如权利要求1所述的方法,其特征在于,所述获取媒体数据样本及样本引导数据,包括:

    3.如权利要求2所述的方法,其特征在于,所述从所述模型训练集合中获取具备所述业务描述信息所指示的特征的媒体数据样本,包括:

    4.如权利要求2所述的方法,其特征在于,所述从所述模型训练集合中获取具备所述业务描述信息所指示的特征的媒体数据样本,包括:

    5.如权利要求1所述的方法,其特征在于,所述下采样样本特征包括下采样残差特征、下采样自注意特征及下采样交叉注意特征;

    6.如权利要求5所述的方法,其特征在于,所述方法还包括:

    7.如权利要求1所述的方法,其特征在于,所述在所述初始图像生成模型中,采用所述样本引导数据对所述下采样样本特征进行上采样处理,得到上采样样本特征,采用初始拼接参数对所述下采样样本特征与所述上采样样本特征进行加权拼接以及去噪处理,得到样本去噪特征,包括:

    8.如权利要求1所述的方法,其特征在于,所述获取所述样本图像数据的图像评估指标,包括:

    9.如权利要求8所述的方法,其特征在于,所述方法还包括:

    10.如权利要求1所述的方法,其特征在于,所述方法还包括:

    11.如权利要求1所述的方法,其特征在于,所述初始拼接参数的数量为n,所述样本引导数据的数量为h,n为正整数,h为正整数;所述样本图像数据的数量为n*h;

    12.一种图像生成方法,其特征在于,所述方法包括:

    13.如权利要求12所述的方法,其特征在于,所述获取初始媒体数据,包括:

    14.一种图像生成装置,其特征在于,所述装置包括:

    15.一种图像生成装置,其特征在于,所述装置包括:

    16.一种计算机设备,其特征在于,包括处理器、存储器、输入输出接口;

    17.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序适于由处理器加载并执行,以使得具有所述处理器的计算机设备执行权利要求1-11任一项所述的方法,或者执行权利要求12-13任一项所述的方法。

    18.一种计算机程序产品,包括计算机指令,其特征在于,所述计算机指令被处理器执行时实现权利要求1-11任一项所述的方法,或者执行权利要求12-13任一项所述的方法。


    技术总结
    本申请实施例公开了一种图像生成方法、装置、计算机、存储介质及程序产品,该方法包括:在初始图像生成模型中,采用样本引导数据对媒体数据样本进行下采样处理,得到下采样样本特征,采用样本引导数据对下采样样本特征进行上采样处理,得到上采样样本特征,采用初始拼接参数对下采样样本特征与上采样样本特征进行加权拼接以及去噪处理,得到样本去噪特征,对样本去噪特征进行解码处理,得到样本图像数据。从初始拼接参数与样本图像数据的图像评估指标构成的数据分布关系中,搜索特征拼接参数;包括特征拼接参数的目标图像生成模型,用于根据图像引导数据生成图像数据。采用本申请,可以提高图像生成的准确性及生成的图像质量。

    技术研发人员:郭卉
    受保护的技术使用者:腾讯科技(深圳)有限公司
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-24086.html

    最新回复(0)