一种图像编码方法及解码方法与流程

    技术2025-02-10  56


    本申请涉及编解码,特别涉及一种图像编码方法及解码方法。


    背景技术:

    1、目前,图像压缩一般是采用成熟的在空域上去除低频冗余数据的算法实现压缩,如jpeg等。这类算法虽然相对成熟和稳定,但压缩率会因该类算法本身的特性而受到限制,导致图像的压缩率不高,压缩后的数据量依然较大。


    技术实现思路

    1、本申请实施例的目的在于提供一种图像编码方法及解码方法,用以解决图像压缩时压缩率不高,压缩后数据量依然较大的问题。

    2、本申请的实施例采用如下技术方案:一种图像编码方法,包括:

    3、按照预设划分模式划分输入图像为多个图像区域;

    4、基于第一转换模块,将所述多个图像区域转换为多个语义文本数据,其中,每个语义文本数据表征为描述对应图像区域的语义;

    5、打包所述多个语义文本数据以生成所述输入图像的编码数据。

    6、在一些实施例中,所述方法还包括:

    7、基于所述多个语义文本数据重建各个图像区域;

    8、确定当前编码图像区域;

    9、如果当前编码图像区域与对应的重建图像区域的差异大于预设度量阈值,更新当前编码图像区域的语义文本数据。

    10、在一些实施例中,更新当前编码图像区域的语义文本数据,包括:

    11、将当前编码图像区域重新划分为多个相互独立的子图像区域;

    12、基于所述第一转换模块,将重新划分的多个相互独立的子图像区域转换为多个子语义文本数据,每个子语义文本数据表征为描述对应子图像区域的子语义;

    13、将所述多个子语义文本数据确定为所述当前编码图像区域的语义文本数据。

    14、在一些实施例中,更新当前编码图像区域的语义文本数据,包括:

    15、确定当前编码图像区域的相邻区域,基于相邻区域的语义文本数据修改所述当前编码图像区域的语义文本;或,

    16、基于第二转换模块重新生成所述当前编码图像区域的语义文本数据,其中所述第二转换模块与所述第一转换模块的模型参数不同。

    17、在一些实施例中,所述预设划分模式,包括:

    18、第一模式、第二模式和第三模式;

    19、所述第一模式下多个图像区域为相互独立的区域;

    20、所述第二模式下多个图像区域包括第一区域和第二区域,所述第一区域包括所述第二区域;

    21、所述第三模式下多个图像区域包括第一区域和第二区域,所述第一区域和第二区域存在部门重叠区域。

    22、在一些实施例中,基于第一转换模块,将所述多个图像区域转换为多个语义文本数据,包括:

    23、对于不同的划分模式,所述第一转换模块分别将所述多个图像区域转换为对应模式的语义文本数据;基于每个对应模式语义文本数据重建对应模式的图像;

    24、确定各模式对应的重建图像与输入图像的差异;

    25、将各模式中对应最小差异模式的语义文本数据进行打包以生成所述输入图像的编码数据。

    26、在一些实施例中,划分输入图像之前,所述方法还包括:

    27、识别输入图像的类型;

    28、基于输入图像的类型从多个转换模块中选择与所述输入图像的类型匹配的转换模块,其中每个转换模块对应一图生文模型。

    29、在一些实施例中,所述方法还包括:

    30、更新当前编码图像区域的语义文本数据的次数超过预设阈值的情况下,将当前编码图像区域采用熵编码方式编码成对应的数据流;

    31、将数据流嵌入所述输入图像的编码数据中。

    32、本申请实施例还提供了一种解码方法,包括:

    33、获得输入图像的编码数据;其中,所述编码数据包括多个图像区域对应的多个语义文本数据;

    34、基于第三转换模块,将所述多个语义文本数据转换为对应多个图像区域的多个图像区域数据;

    35、组合所述多个图像区域数据,以获得解码的输入图像数据。

    36、在一些实施例中,所述方法还包括:

    37、识别解码的输入图像数据中的图像类型,基于所述图像类型从多个转换模块中选择与所述图像类型匹配的转换模块,其中每个转换模块对应一文生图模型。

    38、本申请实施例的有益效果在于:

    39、通过将输入图像划分为多个图像区域,然后再通过图文转换模型将每个图像区域转换为与每个图像区域对应的语义文本数据,打包多个语义文本数据以生成输入图像的编码数据,实现了将庞大的图像数据转化为数据量很小的文本信息,降低了存储需要的空间,在通过网络进行数据传输时,也减少了传输消耗的时间。



    技术特征:

    1.一种图像编码方法,包括:

    2.根据权利要求1所述的图像编码方法,所述方法还包括:

    3.根据权利要求2所述的图像编码方法,更新当前编码图像区域的语义文本数据,包括:

    4.根据权利要求2所述的图像编码方法,更新当前编码图像区域的语义文本数据,包括:

    5.根据权利要求1所述的图像编码方法,所述预设划分模式,包括:

    6.根据权利要求5所述的图像编码方法,基于第一转换模块,将所述多个图像区域转换为多个语义文本数据,包括:

    7.根据权利要求1所述的图像编码方法,划分输入图像之前,所述方法还包括:

    8.根据权利要求3所述的图像编码方法,所述方法还包括:

    9.一种解码方法,包括:

    10.根据权利要求9所述的解码方法,所述方法还包括:


    技术总结
    本申请提供了一种图像编码方法及解码方法,编码方法包括按照预设划分模式划分输入图像为多个图像区域;基于第一转换模块将多个图像区域转换为多个语义文本数据,其中,每个语义文本数据表征为描述对应图像区域的语义;打包所述多个语义文本数据以生成输入图像的编码数据。解码方法包括获得输入图像的编码数据;其中,编码数据包括多个图像区域对应的多个语义文本数据;基于第三转换模块将多个语义文本数据转换为对应多个图像区域的多个图像区域数据;组合多个图像区域数据,以获得解码的输入图像数据。

    技术研发人员:杨涛
    受保护的技术使用者:联想(北京)有限公司
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-26277.html

    最新回复(0)