半结构化数据和非结构化数据的数据库编辑的制作方法

    技术2025-10-08  7


    本公开涉及数据库操作,且尤其涉及编辑(redact)数据库数据内的敏感信息。


    背景技术:

    0、背景

    1、数据库被广泛用于计算应用中的数据存储和访问。数据库可以包括一个或更多个表,该表包括或引用可以使用查询来连接、读取、修改或删除的数据。数据库可以在一个或更多个表中存储小的或极大的数据集。该数据可以被组织中的各种用户访问,或者甚至可以(例如经由网站或应用程序接口(api))用于服务公共用户。

    2、个人身份信息(personally identifiable information,pii)包括允许直接或间接推断个人身份的任何信息,包括与该个人关联或可关联的任何信息。受保护的健康信息(phi)包括与个人的过去、现在或未来健康状况相关的个人身份信息。


    技术实现思路

    1、本公开包括但不限于以下条款。

    2、条款1.一种方法,包括:

    3、检查数据库的多列中的第一列,以识别在所述第一列的第一位置的第一类别的敏感数据和在所述第一列的第二位置的第二类别的敏感数据;

    4、接收针对所述第一列的脱敏策略(masking policy),所述脱敏策略标识敏感数据的所述第一类别;和

    5、响应于访问所述第一列的数据查询,由处理设备执行编辑操作,以编辑来自所述第一列的所述第一位置的所述第一类别的敏感数据,从而生成经编辑的数据以用于对所述数据查询的响应。

    6、条款2.根据条款1所述的方法,其中,与所述第一位置相关联的数据库数据包括多个分层子列,并且

    7、其中,所述方法还包括:

    8、生成将所述多个分层子列中的第一子列与敏感数据的所述第一类别相关联的路径映射。

    9、条款3.根据条款2所述的方法,其中,所述编辑操作是基于所述路径映射来编辑位于所述多个分层子列中的所述第一子列处的所述第一类别的敏感数据。

    10、条款4.根据条款1所述的方法,其中,检查所述数据库的所述多列中的所述第一列以识别在所述第一列的所述第一位置的所述第一类别的敏感数据和在所述第一列的所述第二位置的所述第二类别的敏感数据包括:识别指示所述第一类别的敏感数据在所述第一列内的所述第一位置的第一偏移和指示所述第二类别的敏感数据在所述第一列内的所述第二位置的第二偏移。

    11、条款5.根据条款4所述的方法,其中,所述编辑操作是编辑位于由所述第一偏移指示的所述第一位置处的所述第一类别的敏感数据。

    12、条款6.根据条款1所述的方法,其中,所述编辑操作是第一编辑操作,

    13、其中,所述第一位置和所述第二位置位于所述第一列的同一行内,

    14、其中,针对所述第一列的所述脱敏策略还标识敏感数据的所述第二类别,并且

    15、其中,所述方法还包括:

    16、响应于访问所述第一列的所述数据查询,由所述处理设备执行第二编辑操作,以编辑来自所述第一列的所述第二位置的所述第二类别的敏感数据,从而生成所述经编辑的数据以用于对所述数据查询的响应。

    17、条款7.根据条款6所述的方法,其中,所述第一编辑操作是对来自所述第一列的所述第一位置的所述第一类别的敏感数据的完全编辑,以及所述第二编辑操作是对来自所述第一列的所述第二位置的所述第二类别的敏感数据的部分编辑。

    18、条款8.根据条款1所述的方法,其中,所述第一位置和所述第二位置位于所述第一列的不同行内。

    19、条款9.一种系统,包括:

    20、存储器;以及

    21、处理设备,所述处理设备能够操作地耦合到所述存储器,所述处理设备用于:

    22、检查数据库的多列中的第一列,以识别在所述第一列的第一位置的第一类别的敏感数据和在所述第一列的第二位置的第二类别的敏感数据;

    23、接收针对所述第一列的脱敏策略,所述脱敏策略标识敏感数据的所述第一类别;和

    24、响应于访问所述第一列的数据查询,执行编辑操作以编辑来自所述第一列的所述第一位置的所述第一类别的敏感数据,从而生成经编辑的数据以用于对所述数据查询的响应。

    25、条款10.根据条款9所述的系统,其中,与所述第一位置相关联的数据库数据包括多个分层子列,并且

    26、其中,所述处理装置还:

    27、生成将所述多个分层子列中的第一子列与敏感数据的所述第一类别相关联的路径映射。

    28、条款11.根据条款10所述的系统,其中,所述编辑操作是基于所述路径映射来编辑位于所述多个分层子列中的所述第一子列处的所述第一类别的敏感数据。

    29、条款12.根据条款9所述的系统,其中,为了检查所述数据库的所述多列中的所述第一列以识别在所述第一列的所述第一位置的所述第一类别的敏感数据和在所述第一列的所述第二位置的所述第二类别的敏感数据,所述处理设备识别指示所述第一类别的敏感数据在所述第一列内的所述第一位置的第一偏移和指示所述第二类别的敏感数据在所述第一列内的所述第二位置的第二偏移。

    30、条款13.根据条款12所述的系统,其中,所述编辑操作是编辑位于由所述第一偏移指示的所述第一位置处的所述第一类别的敏感数据。

    31、条款14.根据条款9所述的系统,其中,所述编辑操作是第一编辑操作,

    32、其中,所述第一位置和所述第二位置位于所述第一列的同一行内,

    33、其中,针对所述第一列的所述脱敏策略还标识敏感数据的所述第二类别,并且

    34、其中,所述处理设备还:

    35、响应于访问所述第一列的所述数据查询,执行第二编辑操作以编辑来自所述第一列的所述第二位置的所述第二类别的敏感数据,从而生成所述经编辑的数据以用于对所述数据查询的响应。

    36、条款15.根据条款14所述的系统,其中,所述第一编辑操作是对来自所述第一列的所述第一位置的所述第一类别的敏感数据的完全编辑,以及所述第二编辑操作是对来自所述第一列的所述第二位置的所述第二类别的敏感数据的部分编辑。

    37、条款16.根据条款9所述的系统,其中,所述第一位置和所述第二位置位于所述第一列的不同行内。

    38、条款17.一种包括指令的非暂时性计算机可读存储介质,所述指令当由处理设备执行时使所述处理设备:

    39、检查数据库的多列中的第一列,以识别在所述第一列的第一位置的第一类别的敏感数据和在所述第一列的第二位置的第二类别的敏感数据;

    40、接收针对所述第一列的脱敏策略,所述脱敏策略标识敏感数据的所述第一类别;和

    41、响应于访问所述第一列的数据查询,由所述处理设备执行编辑操作以编辑来自所述第一列的所述第一位置的所述第一类别的敏感数据,从而生成经编辑的数据以用于对所述数据查询的响应。

    42、条款18.根据条款17所述的非暂时性计算机可读存储介质,其中,与所述第一位置相关联的数据库数据包括多个分层子列,并且

    43、其中,所述处理装置还:

    44、生成将所述多个分层子列中的第一子列与敏感数据的所述第一类别相关联的路径映射。

    45、条款19.根据条款18所述的非暂时性计算机可读存储介质,其中,所述编辑操作是基于所述路径映射来编辑位于所述多个分层子列中的所述第一子列处的所述第一类别的敏感数据。

    46、条款20.根据条款17所述的非暂时性计算机可读存储介质,其中,为了检查所述数据库的所述多列中的所述第一列以识别在所述第一列的所述第一位置的所述第一类别的敏感数据和在所述第一列的所述第二位置的所述第二类别的敏感数据,所述处理设备识别指示所述第一类别的敏感数据在所述第一列内的所述第一位置的第一偏移和指示所述第二类别的敏感数据在所述第一列内的所述第二位置的第二偏移。

    47、条款21.根据条款20所述的非暂时性计算机可读存储介质,其中,所述编辑操作是编辑位于由所述第一偏移指示的所述第一位置处的所述第一类别的敏感数据。

    48、条款22.根据条款17所述的非暂时性计算机可读存储介质,其中,所述编辑操作是第一编辑操作,

    49、其中,所述第一位置和所述第二位置位于所述第一列的同一行内,

    50、其中,针对所述第一列的所述脱敏策略还标识敏感数据的所述第二类别,并且

    51、其中,所述处理设备还:

    52、响应于访问所述第一列的所述数据查询,执行第二编辑操作以编辑来自所述第一列的所述第二位置的所述第二类别的敏感数据,从而生成所述经编辑的数据以用于对所述数据查询的响应。

    53、条款23.根据条款22所述的非暂时性计算机可读存储介质,其中,所述第一编辑操作是对来自所述第一列的所述第一位置的所述第一类别的敏感数据的完全编辑,以及所述第二编辑操作是对来自所述第一列的所述第二位置的所述第二类别的敏感数据的部分编辑。

    54、条款24.根据条款17所述的非暂时性计算机可读存储介质,其中,所述第一位置和所述第二位置位于所述第一列的不同行内。


    技术特征:

    1.一种方法,包括:

    2.根据权利要求1所述的方法,其中,与所述第一位置相关联的数据库数据包括多个分层子列,并且其中,所述方法还包括:

    3.根据权利要求2所述的方法,其中,所述第一编辑操作是基于所述路径映射来编辑位于所述多个分层子列中的所述第一子列处的所述第一类别的敏感数据。

    4.根据权利要求1所述的方法,其中,检查所述数据库的所述多列中的所述第一列以识别在所述第一列的所述第一位置的所述第一类别的敏感数据和在所述第一列的所述第二位置的所述第二类别的敏感数据包括:识别指示所述第一类别的敏感数据在所述第一列内的所述第一位置的第一偏移和指示所述第二类别的敏感数据在所述第一列内的所述第二位置的第二偏移。

    5.根据权利要求4所述的方法,其中,所述第一编辑操作是编辑位于由所述第一偏移指示的所述第一位置处的所述第一类别的敏感数据。

    6.根据权利要求1所述的方法,其中,所述第一编辑操作是对来自所述第一列的所述第一位置的所述第一类别的敏感数据的完全编辑,以及所述第二编辑操作是对来自所述第一列的所述第二位置的所述第二类别的敏感数据的部分编辑。

    7.根据权利要求1所述的方法,其中,所述第一位置和所述第二位置位于所述第一列的不同行内。

    8.一种系统,包括:

    9.根据权利要求8所述的系统,其中,与所述第一位置相关联的数据库数据包括多个分层子列,并且其中,所述处理设备还:

    10.根据权利要求9所述的系统,其中,所述第一编辑操作是基于所述路径映射来编辑位于所述多个分层子列中的所述第一子列处的所述第一类别的敏感数据。

    11.根据权利要求8所述的系统,其中,为了检查所述数据库的所述多列中的所述第一列以识别在所述第一列的所述第一位置的所述第一类别的敏感数据和在所述第一列的所述第二位置的所述第二类别的敏感数据,所述处理设备识别指示所述第一类别的敏感数据在所述第一列内的所述第一位置的第一偏移和指示所述第二类别的敏感数据在所述第一列内的所述第二位置的第二偏移。

    12.根据权利要求11所述的系统,其中,所述第一编辑操作是编辑位于由所述第一偏移指示的所述第一位置处的所述第一类别的敏感数据。

    13.根据权利要求8所述的系统,其中,所述第一编辑操作是对来自所述第一列的所述第一位置的所述第一类别的敏感数据的完全编辑,以及所述第二编辑操作是对来自所述第一列的所述第二位置的所述第二类别的敏感数据的部分编辑。

    14.根据权利要求8所述的系统,其中,所述第一位置和所述第二位置位于所述第一列的不同行内。

    15.一种包括指令的非暂时性计算机可读存储介质,所述指令当由处理设备执行时使所述处理设备:

    16.根据权利要求15所述的非暂时性计算机可读存储介质,其中,与所述第一位置相关联的数据库数据包括多个分层子列,并且其中,所述处理设备还:

    17.根据权利要求16所述的非暂时性计算机可读存储介质,其中,所述第一编辑操作是基于所述路径映射来编辑位于所述多个分层子列中的所述第一子列处的所述第一类别的敏感数据。

    18.根据权利要求15所述的非暂时性计算机可读存储介质,其中,为了检查所述数据库的所述多列中的所述第一列以识别在所述第一列的所述第一位置的所述第一类别的敏感数据和在所述第一列的所述第二位置的所述第二类别的敏感数据,所述处理设备识别指示所述第一类别的敏感数据在所述第一列内的所述第一位置的第一偏移和指示所述第二类别的敏感数据在所述第一列内的所述第二位置的第二偏移。

    19.根据权利要求18所述的非暂时性计算机可读存储介质,其中,所述第一编辑操作是编辑位于由所述第一偏移指示的所述第一位置处的所述第一类别的敏感数据。

    20.根据权利要求15所述的非暂时性计算机可读存储介质,其中,所述第一编辑操作是对来自所述第一列的所述第一位置的所述第一类别的敏感数据的完全编辑,以及所述第二编辑操作是对来自所述第一列的所述第二位置的所述第二类别的敏感数据的部分编辑。

    21.根据权利要求15所述的非暂时性计算机可读存储介质,其中,所述第一位置和所述第二位置位于所述第一列的不同行内。


    技术总结
    本公开涉及但不限于半结构化数据和非结构化数据的数据库编辑。本公开的实施例描述了用于编辑数据库内的敏感数据的系统、方法和计算机程序产品。示例方法可以包括检查数据库的多列中的第一列以识别在第一列的第一位置的第一类别的敏感数据和在第一列的第二位置的第二类别的敏感数据,接收针对第一列的脱敏策略,该脱敏策略标识敏感数据的第一类别,以及响应于访问第一列的数据查询,执行编辑操作以编辑来自第一列的第一位置的第一类别的敏感数据,从而生成经编辑的数据以用于对数据查询的响应。

    技术研发人员:李一蒙,卡尔·耶茨·佩里,拉格文德兰·拉马克里希南,弗兰蒂泽克·罗利内克,章云樵
    受保护的技术使用者:雪花公司
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-35671.html

    最新回复(0)