一种移动设备端的人脸模型的重建方法及电子设备与流程

    技术2025-06-13  30


    所属的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为″电路″、″模块″或″系统″。在一些可能的实施方式中,根据本发明的电子设备可以至少包括至少一个处理器、以及至少一个计算机存储介质。其中,计算机存储介质存储有程序代码,当程序代码被处理器执行时,使得处理器执行本说明书上述描述的根据本发明各种示例性实施方式的移动设备端的人脸模型的重建方法中的步骤。例如处理器可以执行如图2中所示的步骤201-206。下面参照图10来描述根据本发明的这种实施方式的电子设备1000。图10显示的电子设备1000仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。如图10所示,vr设备1000以通用电子设备的形式表现。vr设备1000的组件可以包括但不限于:上述至少一个处理器1001、上述至少一个计算机存储介质1002、连接不同系统组件(包括计算机存储介质1002和处理器1001)的总线1003。总线1003表示几类总线结构中的一种或多种,包括计算机存储介质总线或者计算机存储介质控制器、外围总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。计算机存储介质1002可以包括易失性计算机存储介质形式的可读介质,例如随机存取计算机存储介质(ram)1021和/或高速缓存存储介质1022,还可以进一步包括只读计算机存储介质(rom)1023。计算机存储介质1002还可以包括具有一组(至少一个)程序模块1024的程序/实用工具1025,这样的程序模块1024包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。电子设备1000也可以与一个或多个外部设备1004(例如键盘、指向设备等)通信,还可与一个或者多个使得用户能与电子设备1000交互的设备通信,和/或与使得该电子设备1000能与一个或多个其它电子设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口1005进行。并且,vr设备1000还可以通过网络适配器1006与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器1006通过总线1003与用于电子设备1000的其它模块通信。应当理解,尽管图中未示出,可以结合电子设备1000使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。在一些可能的实施方式中,本发明提供的一种移动设备端的人脸模型的重建方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在计算机设备上运行时,程序代码用于使计算机设备执行本说明书上述描述的根据本发明各种示例性实施方式的移动设备端的人脸模型的重建方法中的步骤。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。


    背景技术:

    1、随着″元宇宙″概念的火热,数字人的重建受到了极大的关注。而三维人脸模型的重建作为数字人重建的核心,更加成为学术界和工业界的研究热点。当前实现高精度三维人脸模型重建的方案主要包括:基于参数化的三维人脸模型重建、基于深度学习的三维人脸模型重建以及基于mvs(multi-view stereo,多视点立体视觉)算法的人脸三维重建。其中,mvs算法进行三维人脸模型重建的精度最高,可较好的还原人脸的真实特征,广泛应用于数字人生产领域。

    2、现有技术中的人脸三维模型的重建算法大都是通过布设多台rgb相机(少则几十台,多则上百台)来对人脸同时拍摄。之所以这样做,是可以保证人物在拍摄的瞬间是保持不动的,可以保证三维人脸模型的重建精度。但这种方法要求同时布设多台相机。多相机的安装、部署、同步控制以及光源控制都比较复杂,并且成本高昂。该方式主要面向影视级人物制作。

    3、还有一种轻量级的mvs方法,仅使用一台移动设备,例如手机等。使用该手机围绕人脸拍摄多张图像,然后也使用mvs算法完成重建。这种方法成本低,操作简便。但是该方式如果是对三维人脸模型进行重建,则需要人物在拍摄过程中要保持静止不动,并且不能眨眼。一旦发生移动或者眨眼,会导致人脸三维模型的重建精度较低。


    技术实现思路

    1、本技术提供了一种移动设备端的人脸模型的重建方法及电子设备,用于提高人脸三维模型的重建精度。

    2、第一方面,本技术实施例提供一种移动设备端的人脸模型的重建方法,所述方法包括:

    3、对获取的用户的人脸视频中的各帧人脸图像进行人脸关键点检测,得到所述各帧人脸图像中的各人脸关键点的三维位置坐标,其中,所述各帧人脸图像为在移动设备的不同相机视角下拍摄的人脸图像;

    4、针对所述各帧人脸图像中的任意一帧第一目标人脸图像,基于所述第一目标人脸图像中指定人脸关键点的三维位置坐标,得到所述人脸图像中眼睛的状态,其中,所述眼睛的状态用于表示所述人脸图像中的眼睛是否在眨眼;以及,

    5、根据所述第一目标人脸图像中各人脸关键点的三维位置坐标以及所述第一目标人脸图像的前一帧第一目标人脸图像中各人脸关键点的三维位置坐标,得到所述第一目标人脸图像中人脸的移动角度;

    6、利用所述各帧第一目标人脸图像中眼睛的状态以及所述各帧第一目标人脸图像中人脸的移动角度对所述各帧第一目标人脸图像进行筛选,得到筛选后的各帧第一目标人脸图像;

    7、对所述筛选后的各帧第一目标人脸图像分别进行人脸分割,得到各帧第二目标人脸图像,其中,任意一帧第二目标人脸图像中包括人脸的前景图像;

    8、基于所述各帧第二目标人脸图像进行人脸模型的重建,得到重建后的三维人脸模型。

    9、本技术第二方面提供一种电子设备,包括处理器和存储器,所述处理器和所述存储器通过总线连接;

    10、所述存储器中存储有计算机程序,所述处理器被配置为基于所述计算机程序执行以下操作:

    11、对获取的用户的人脸视频中的各帧人脸图像进行人脸关键点检测,得到所述各帧人脸图像中的各人脸关键点的三维位置坐标,其中,所述各帧人脸图像为在移动设备的不同相机视角下拍摄的人脸图像;

    12、针对所述各帧人脸图像中的任意一帧第一目标人脸图像,基于所述第一目标人脸图像中指定人脸关键点的三维位置坐标,得到所述人脸图像中眼睛的状态,其中,所述眼睛的状态用于表示所述人脸图像中的眼睛是否在眨眼;以及,

    13、根据所述第一目标人脸图像中各人脸关键点的三维位置坐标以及所述第一目标人脸图像的前一帧第一目标人脸图像中各人脸关键点的三维位置坐标,得到所述第一目标人脸图像中人脸的移动角度;

    14、利用所述各帧第一目标人脸图像中眼睛的状态以及所述各帧第一目标人脸图像中人脸的移动角度对所述各帧第一目标人脸图像进行筛选,得到筛选后的各帧第一目标人脸图像;

    15、对所述筛选后的各帧第一目标人脸图像分别进行人脸分割,得到各帧第二目标人脸图像,其中,任意一帧第二目标人脸图像中包括人脸的前景图像;

    16、基于所述各帧第二目标人脸图像进行人脸模型的重建,得到重建后的三维人脸模型。

    17、根据本发明实施例提供的第三方面,提供一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序用于执行如第一方面所述的方法。

    18、本技术的上述实施例中通过对获取的用户的人脸视频中的各帧人脸图像进行人脸关键点检测,得到所述各帧人脸图像中的各人脸关键点的三维位置坐标,然后针对所述各帧人脸图像中的任意一帧第一目标人脸图像,基于所述第一目标人脸图像中指定人脸关键点的三维位置坐标,得到所述人脸图像中眼睛的状态以及根据所述第一目标人脸图像中各人脸关键点的三维位置坐标以及所述第一目标人脸图像的前一帧第一目标人脸图像中各人脸关键点的三维位置坐标,得到所述第一目标人脸图像中人脸的移动角度,然后基于各帧第一目标图像中的眼睛状态以及人脸的移动角度对各帧第一目标人脸图像进行筛选,然后基于筛选后的第一目标人脸图像来进行三维人脸模型的重建。由此,本技术实施例中可以识别出各帧第一目标人脸图像中的用户是否眨眼以及该用户是否晃动,并基于识别出的结果对各帧第一目标人脸图像进行过滤,提高了人脸三维模型重建的精度。


    技术特征:

    1.一种移动设备端的人脸模型的重建方法,其特征在于,所述方法包括:

    2.根据权利要求1所述的方法,其特征在于,所述眼睛的状态包括正常状态和眨眼状态;

    3.根据权利要求1所述的方法,其特征在于,所述指定人脸关键点包括第一人脸关键点和第二人脸关键点,且所述第一人脸关键点为语义信息是左上眼皮的人脸关键点或语义信息是左下眼皮的人脸关键点,所述第二人脸关键点为语义信息是右上眼皮的人脸关键点或语义信息是右下眼皮的人脸关键点,以及所述第一人脸关键点和所述第二人脸关键点的语义信息的左右方向相同;

    4.根据权利要求1所述的方法,其特征在于,所述根据所述第一目标人脸图像中各人脸关键点的三维位置坐标以及所述第一目标人脸图像的前一帧第一目标人脸图像中各人脸关键点的三维位置坐标,得到所述第一目标人脸图像中人脸的移动角度,包括:

    5.根据权利要求1所述的方法,其特征在于,所述基于所述各帧第二目标人脸图像进行人脸模型的重建,得到重建后的三维人脸模型,包括:

    6.根据权利要求5所述的方法,其特征在于,所述基于所述各帧第二目标人脸图像进行人脸模型的重建,得到重建后的三维人脸模型之后,所述方法还包括:

    7.根据权利要求6所述的方法,其特征在于,所述根据所述各帧第二目标人脸图像分别对应的图像深度图,对所述三维人脸模型的低纹理区域进行重建修复,得到目标三维人脸模型,包括:

    8.根据权利要求7所述的方法,其特征在于,所述根据所述第二目标人脸图像的图像深度图,确定所述第二目标人脸图像中没有进行人脸重建的第一目标像素点,包括:

    9.根据权利要求7所述的方法,其特征在于,所述利用所述第一目标像素点的第一距离向量以及所述第二目标像素点的第二距离向量,得到所述像素深度的置信度,包括:

    10.一种电子设备,其特征在于,包括处理器和存储器,所述处理器和所述存储器通过总线连接;


    技术总结
    本申请提供一种移动设备端的人脸模型的重建方法及电子设备,用于提高人脸三维模型的重建精度。包括:对各帧人脸图像进行人脸关键点检测,得到各帧人脸图像中的各人脸关键点的三维位置坐标;针对各帧人脸图像中的任一第一目标人脸图像,基于第一目标人脸图像中指定人脸关键点的三维位置坐标,得到人脸图像中眼睛的状态;根据第一目标人脸图像中各人脸关键点的三维位置坐标,得到人脸的移动角度;利用各帧第一目标人脸图像中的眼睛状态和人脸的移动角度对各帧第一目标人脸图像筛选,对筛选后的各帧第一目标人脸图像进行人脸分割,得到各帧第二目标人脸图像;基于各帧第二目标人脸图像进行人脸模型的重建,得到重建后的三维人脸模型。

    技术研发人员:陈春朋
    受保护的技术使用者:聚好看科技股份有限公司
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-32332.html

    最新回复(0)