网格运动矢量编解码中重复顶点的自适应合并的制作方法

技术2025-11-16 24

背景技术：

1、1、领域

2、本申请涉及一组先进的视频编解码技术，包括网格运动矢量编解码中的自适应合并重复顶点以及顶点分组。

3、2、相关技术的描述

4、三维(three-dimensional，3d)捕获、建模和渲染方面的进步促进了3d内容普遍存在于许多平台和设备上。目前，可以在一个大洲捕捉到婴儿的第一步，并使得祖父母能够在其它大洲观看(也可以进行互动)并享受与孩子的完全沉浸式体验。然而，为了实现这种真实性，模型变得越来越复杂，这些模型的创建和消耗与大量数据相关联。3d网格被广泛用于表示这种沉浸式内容。

5、动态网格序列可能需要大量数据，因为动态网格可能包括随时间变化的大量信息。因此，需要有效的压缩技术来存储和传输这种内容。动态图像专家组(moving picturesexperts group，mpeg)之前已经开发了网格压缩标准，例如ic、meshgrid和famc，以用于处理具有恒定连通性、时变几何和顶点属性的动态网格。然而，这些标准没有考虑时变属性映射和连通性信息。数字内容创建(digital content creation，dcc)工具通常会生成这样的动态网格。相应地，对于体积采集技术来说，生成恒定的连通性动态网格，尤其是在实时约束下生成，是具有挑战性的。现有标准不支持这种类型的内容。mpeg正计划开发一种新的网格压缩标准，以直接处理具有时变连通性信息和可选的时变属性映射的动态网格。该标准的目标在于各种应用的有损和无损压缩，例如实时通信、存储、自由视点视频、增强现实(augmented reality，ar)和虚拟现实(virtual reality，vr)。还可以考虑诸如随机访问和可扩展/渐进编解码的功能。出于任何一个这些原因，需要提出对视频编码技术中出现的这些问题的技术方案。

技术实现思路

1、本公开包括一种方法和装置，所述装置包括被配置为存储计算机程序代码的存储器和一个或多个处理器，所述一个或多个处理器被配置为访问所述计算机程序代码并根据所述计算机程序代码的指示进行操作。计算机程序被配置为使处理器实现：获得代码，被配置成使得至少一个处理器获得至少一个3d视觉内容的已编码体数据，所述已编码体数据表示3d视觉内容的多个网格的网格序列；确定代码，被配置成使得至少一个处理器确定与已编码体数据一起获得的语法，所述语法用于指示是否将多个网格的顶点预测为组；以及解码代码，被配置成使得至少一个处理器通过基于语法元素将顶点预测为组来解码所述已编码体数据。所述顶点中的至少两个顶点不是边连通的，所述语法依赖于自适应决策以将多个网格的顶点预测为组。

2、根据示例性实施例，所述语法是基础网格帧间子网格数据单元语法。

3、根据示例性实施例，所述组由整数k个所述顶点组成，基础网格帧间子网格数据单元语法是与已编码体数据一起获得的，并且所述基础网格帧间子网格数据单元语法用于指示整数k。

4、根据示例性实施例，自适应决策依赖于顶点中重复顶点的数量。

5、根据示例性实施例，自适应决策依赖于顶点的数量。

6、根据示例性实施例，自适应决策依赖于顶点中重复顶点的数量与顶点的数量之比。

7、根据示例性实施例，通过莫顿(morton)顺序和遍历顺序中的至少一种顺序将顶点划分为组。

8、根据示例性实施例，所述语法包括sismu_integrate_mv_byte[submeshid]、sismu_multi_mv_idx[submeshid][i]、以及sismu_mv_pred_mode_group[submeshid][g]中的至少一个。

9、根据示例性实施例，所述语法包括sismu_mv_residual_abs_gt0[submeshid][g][k]、sismu_mv_residual_sign[submeshid][g][k]、sismu_mv_residual_abs_gt1[submeshid][k]、以及sismu_mv_residual_abs_rem[submeshid][v][k]中的至少一个。

10、根据示例性实施例，由语法指示组的预测模式包括熵编码、算术编码和基于上下文的算术编码中的任一种。

技术特征：

1.一种用于视频解码的方法，所述方法由至少一个处理器执行，包括：

2.根据权利要求1所述的方法，其中，

3.根据权利要求2所述的方法，其中，

4.根据权利要求1所述的方法，其中，

5.根据权利要求1所述的方法，其中，

6.根据权利要求1所述的方法，其中，

7.根据权利要求1所述的方法，其中，

8.根据权利要求1所述的方法，其中，

9.根据权利要求1所述的方法，其中，

10.根据权利要求1所述的方法，其中，由所述语法指示所述组的预测模式包括熵编码、算术编码和基于上下文的算术编码中的任一种。

11.一种用于视频解码的装置，所述装置包括：

12.根据权利要求11所述的装置，其中，

13.根据权利要求12所述的装置，其中，

14.根据权利要求11所述的装置，其中，

15.根据权利要求11所述的装置，其中，

16.根据权利要求11所述的装置，其中，

17.根据权利要求11所述的装置，其中，

18.根据权利要求11所述的装置，其中，

19.根据权利要求11所述的装置，其中，

20.一种存储有程序的非暂时性计算机可读介质，所述程序使得计算机：

技术总结
一种方法和装置，该装置包括计算机代码，被配置为使得一个或多个处理器：获得至少一个三维(3D)视觉内容的已编码体数据，该已编码体数据表示3D视觉内容的多个网格的网格序列；确定与已编码体数据一起获得的语法，该语法用于指示是否将多个网格的顶点预测为组；通过基于语法元素将顶点预测为组来解码已编码体数据，组的顶点中的至少两个顶点不是边连通的，语法依赖于自适应决策以将多个网格的顶点预测为组。

技术研发人员：田军,许晓中,刘杉
受保护的技术使用者：腾讯美国有限责任公司
技术研发日：
技术公布日：2024/10/24

转载请注明原文地址:https://symbian.8miu.com/read-36812.html

专利

最新回复(0)