一种面向多元时序重症监护数据分类的多尺度信息融合神经网络建模方法

    技术2025-05-14  16


    本发明涉及数据处理,属于人工智能(人工神经网络)模式数据拟合、识别和分类领域,具体涉及一种面向多元时序重症监护数据分类的多尺度信息融合神经网络建模方法。


    背景技术:

    1、重症监护病房(intensive care unit,icu)旨在为各种危重症患者提供全面且有针对性的监测、治疗和护理。通过持续检测和记录icu患者的生理状况,能够生成相应的多元时序重症监护数据。这些数据能够帮助医生更好地了解患者的病情发展状况,辅助其进行诊断和治疗决策。同时,利用这些数据开展icu患者病情严重程度评估和死亡风险预测等分类任务,可以帮助护理人员确定适当的护理水平,实现精准化护理,使病情较为危重的患者优先使用icu诊疗资源。此外,辅助护理人员早期判断哪些患者无法从icu的强化性治疗中受益,也是保障患者生命安全和改善临终护理的一种重要手段。基于人工智能方法的多元时序重症监护数据分析及分类能揭示数据中蕴含的潜在模式和变化趋势,为实现高效管理和优化决策提供支持,这对于制定长期医疗策略和政策,改善整体医疗质量和效率都具有重要意义。然而,多元时序重症监护数据不仅具有时序性,还具有数据规模大、特征维数高以及存在高度耦合的关联关系等特性。这些特性使得多元时序重症监护数据的分析和分类更加具有挑战性。为此,本发明提出一种融合多尺度信息的神经网络学习算法,旨在实现对多元时序重症监护数据的高精度分类建模。

    2、通过特征表示学习,可以将复杂、高维的多元时序重症监护数据转化为更简单、更易处理的表征数据。这一过程不仅有助于消除数据中冗余或噪声信息带来的负面影响,还能为分类模型提供更可靠的信息支持。目前,常用的多元时序数据特征表示学习方法包括计算统计特征、挑选标志性子序列、设计离散符号表示以及构建表征模型等,其中构建表征模型的方法不仅能够自主学习表示特征,还可以根据数据的性质和任务的需求灵活地调整特征提取的策略。因此,构建表征模型进行特征表示学习逐渐成为多元时序数据分析领域的关键技术之一。

    3、深度神经网络在执行分类任务时能取得出色的性能表现,但其复杂的网络结构和大量需要学习的参数导致模型的训练时间较长,还可能遇到局部最优和梯度消失等问题。相比之下,宽度学习系统(broad learning system,bls)没有复杂的网络结构,且不依赖反向传播算法进行参数学习,具备高效和灵活等优点。bls主要包含特征映射和增强映射两部分运算,其中特征映射操作将输入数据转换为更高层次的抽象表示,有助于模型更好地理解和处理数据,增强映射操作则是对映射特征进行补充学习,进一步增强模型对输入数据的表达能力和适应性。

    4、模型的性能与所用特征的质量密切相关,数据中一些关键特征能够为模型提供宝贵的信息,对于提升模型性能至关重要。同时,多元时序重症监护数据具有高度个性化的特点,每个患者的病情表现和治疗反应都存在显著差异,这种特性使得模型容易受到冗余或噪音信息的干扰,过度关注数据中的特定模式,从而限制其泛化性能。通过识别不同特征之间的重要性差异,可以指导模型更好地辨识和利用关键特征,进而提升模型的泛化能力。此外,对于多元时序重症监护数据而言,不同时间尺度下的数据也蕴含着不同的模式信息,较长时间尺度下的数据反映了患者的慢性疾病状态和健康状况变化趋势,而较短时间尺度下的数据往往反映了患者的急性病发作情况。因此,针对多元时序重症监护数据的分析和分类还需要充分挖掘不同时间尺度下的模式信息,从而进一步提高模型的鲁棒性和泛化性。

    5、基于上述分析可以发现,如何充分运用数据中的多模式特征信息和类别分布信息,挖掘具有类可分性和内在特异性的表示特征,并有效利用表征数据中的多层次和多尺度信息进行建模以提高分类性能,仍然是一个值得关注的问题。


    技术实现思路

    1、在icu这一关键的医疗场景中,患者的临床检测结果、生命体征信息和疾病诊断代码等数据被持续监测并记录,形成了海量的多元时序重症监护数据。本发明旨在提供一种面向多元时序重症监护数据分类的多尺度信息融合神经网络建模方法。应用融合多模式特征信息的表征模型提取原始多元时序重症监护数据的表征数据,制定基于相似性的尺度筛选原则,构建用于集成建模的多尺度表征数据集合。针对筛选得到的不同尺度数据,利用极限梯度提升决策树进行特征重要性识别。基于特征重要性识别结果,构建串联-并联相结合的分层宽度网络,充分挖掘和融合表征数据中不同层次的特征信息进行分类预测。最后,使用加权平均方法融合不同基模型的预测输出,得到最终的分类预测结果。这一方法在实现高精度建模的同时,能够确保模型具有一定的鲁棒性与泛化性,为icu患者的监护和治疗提供了更可靠的支持。

    2、本发明为实现上述目的所采用的技术方案为:

    3、一种面向多元时序重症监护数据分类的多尺度信息融合神经网络建模方法,包括以下步骤:

    4、s1、收集用于开展分类任务的多元时序重症监护数据及相应的标签数据,应用融合多模式特征信息的表征学习模型,提取具有区分性和代表性的多元时序表征数据;

    5、s2、采用不同长度的时间窗口对多元时序表征数据进行划分,得到不同尺度下的多元时序表征数据,并通过全局最大池化操作获取对应的实例级表征数据;

    6、s3、制定基于相似性的尺度筛选原则,确定用于集成建模的多尺度表征数据集合;

    7、s4、针对每一尺度数据,利用极限梯度提升决策树(extreme gradient boosting,xgboost)进行特征重要性识别,并根据识别结果对数据进行重排序;

    8、s5、对于每一重排序后的表征数据,建立融合多层次特征信息的分层宽度网络模型(hierarchical broad network,hb-net),实现对应尺度下的分类预测;

    9、s6、使用加权平均方法融合所有基模型的分类预测结果,得到最终的决策输出,进而实现多元时序重症监护数据的分析与分类。

    10、如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述s1具体包括:

    11、收集用于开展分类任务的多元时序重症监护数据及相应的标签数据。将由n个样本组成的多元时序数据集合表示为其中为第i个样本,t为时间序列长度,l为每个时间步的特征数量,i=1,2,…,n。表示时间步t的特征向量,xi,t,l表示第l个特征值,t=1,2,…,t,l=1,2,…,l。将标签数据集合表示为y={y1,y2,…,yi,…,yn},其中是与样本xi对应的标签数据,c为类别数量。

    12、应用由投影映射层、门控循环单元模块、残差扩张卷积模块和特征融合层组成的表征学习模型提取的表征数据。对于数据样本提取表征数据的过程如下:

    13、首先,在投影映射层,将每个时间步的特征向量映射至潜在向量

    14、

    15、其中,为权重参数,为偏置向量,d表示潜在向量的特征维数,φgelu(·)表示gelu激活函数,φtanh(·)表示双曲正切激活函数。将此层的输出数据表示为

    16、

    17、接着,将输入门控循环单元模块学习数据的时序依赖特征。门控循环单元模块由ng层门控循环单元和(ng-1)层随机丢弃层组成。在第一层门控循环单元中,第t个时刻的输出隐层状态由当前时刻的输入与上一时刻的隐层状态共同计算得到,其中为第一层输出隐层状态的特征维数,t=1,2,…,t。

    18、门控循环单元内部有重置门和更新门两个门控单元,这两个门控单元用于控制上一时刻的隐藏状态信息被保留的程度,其值由当前时刻输入和上一时刻隐藏状态共同计算得到,如式(4)和式(5)所示。

    19、

    20、其中,和是重置门的权重参数,是偏置,和是更新门的权重参数,是偏置,φsigmoid(·)表示sigmoid激活函数。

    21、通过当前时刻输入和经重置门过滤后的上一时刻隐藏状态共同计算得到当前时刻的候选隐藏状态

    22、

    23、其中,和是计算候选隐藏状态的权重参数,是偏置,⊙表示哈达玛乘积操作,即矩阵对应元素相乘。由式(7)可知,重置门的值越大,上一时刻隐藏状态被保留的信息就越多;反之,被保留的信息就越少。

    24、使用更新门对上一时刻隐藏状态和当前时刻候选隐藏状态进行组合运算,可以得到当前时刻的输出隐层状态

    25、

    26、其中fg(·)用以概括门控循环单元的内部运算过程。从式(8)可以看出,更新门的值越大,从上一时刻隐藏状态中流入的信息就越多。根据式(4)至式(8)逐时刻计算,可以得到第一层门控循环单元的输出

    27、接着,为了降低模型过拟合的风险,在随机丢弃层对应用丢弃操作得到

    28、

    29、其中为随机向量,向量内的元素以概率dr取值为0,以概率1-dr取值为(1/1-dr)。

    30、同理,第ng层门控循环单元第t个时刻的输出为其中为第ng层输出隐层状态的特征维数,为第(ng-1)层随机丢弃层第t个时刻的输出,为对应的随机向量,为第(ng-1)层门控循环单元第t个时刻的输出,1<ng≤ng。由此,可以得到门控循环单元模块的最终输出为第ng层输出隐层状态的特征维数。

    31、对于多元时序重症监护数据而言,时序依赖特征十分关键,但局部和全局特征的影响也不容忽视。因此,在模型中引入残差扩张卷积模块提取样本的局部和全局特征。残差扩张卷积模块由ns个残差扩张卷积块串联而成,第一个卷积块的输出可由下式计算得到:

    32、

    33、其中,为特征维数,fs(·)指示残差扩张卷积块的计算式,*d(1)表示扩张因子为d(1)的扩张卷积运算操作,和为一维扩张卷积运算的权重参数,表示每个卷积核的尺寸,fc(·)是确保维数匹配的投影函数:

    34、

    35、其中,*表示一维卷积运算操作,为对应的权重参数。

    36、第ns个卷积块的输入为上一个卷积块的输出其输出可表示为:

    37、

    38、其中,和为权重参数,为第ns个卷积块的特征维数,为第(ns-1)个卷积块的特征维数,为第ns个卷积块的扩张因子。根据式(12)逐层运算,得到残差扩张卷积模块的输出其中为第ns个卷积块的特征维数。

    39、在特征融合层,将残差扩张卷积模块的输出与门控循环单元模块的输出沿着特征维度进行拼接,得到最终输出的表征数据其中为特征维数。

    40、应用表征学习模型提取得到多元时序数据集合的表征数据集合其中为数据样本xi的表征数据,zi中第t个时刻的表征向量为

    41、如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述s2具体包括:

    42、针对s1提取得到的表征数据集合使用不同长度的时间窗口对其进行划分,以获取不同时间尺度下的表征数据集合。设定第一次划分的时间窗口起始时刻为1,终止时刻为t。随后,每次划分的时间窗口起始时刻向后推移长度δd。第nf次划分的时间窗口,其初始时刻为1+(nf-1)δd,终止时刻为t,数据的时间尺度为t-(nf-1)δd。直至初始时刻超过设定的阈值sd时,停止划分。通过这一步骤,得到由nf个不同尺度的表征数据组成的多尺度表征数据集合其中nf可由下式计算得到:

    43、

    44、其中为向下取整符号。

    45、遍历集合中的每个元素沿着时间维度对其执行全局最大池化操作,即保留时间窗口内特征的最大值作为该特征的输出值,得到由nf个不同尺度的实例级表征数据组成的集合其中

    46、如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述s3具体包括:

    47、针对s2划分得到的多尺度实例级表征数据集合制定基于相似度的筛选策略,确定用于集成建模的多尺度表征数据集合。考虑到全局尺度下的表征数据往往包含了最丰富的信息,将其作为筛选的基准数据,以确保被选择的尺度数据之间保持一定的相似性和差异性。在筛选过程中,使用余弦相似度作为相似性度量函数。与之间的相似度可由下式计算得到:

    48、

    49、其中,表示中第i个样本第m个特征的值,表示中第i个样本第m个特征的值。按照式(14),计算中每一个元素与之间的相似值,得到相似度向量

    50、定义用于集成建模的实例级表征数据集合将该集合中元素的个数表示为初始情况设定相似性阈值和差异性阈值分别为sc和sv,对于任意和q∈{2,...,nf},依次检查是否满足cq>sc且|cq-cp|>sv。若条件成立,则将加入反之,保持不变。

    51、如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述s4具体包括:

    52、针对集合中的每个尺度数据,使用xgboost模型对其进行特征重要性识别。对于尺度数据其中为第i个样本,i=1,2,…,n,其特征重要性识别的过程如下:

    53、若此时模型由e棵决策树组成,那么模型对于第i个样本的预测值可表示为:

    54、

    55、其中,为第e棵决策树的预测结果,为前e-1棵决策树预测结果的和,为第e棵决策树的预测结果。

    56、在构建第e棵决策树时,将目标函数定义为下式:

    57、

    58、其中,lxgb(·)为设定的损失函数,ω(fe)表示第e棵决策树的正则化项,可表示为:

    59、

    60、其中,ce为第e棵决策树上叶子节点的总数,wj表示第j个叶子节点对应的权重值,γb和λb为设定的惩罚权重参数。

    61、将式(16)中的损失函数项进行二阶泰勒展开,得到新的目标函数表达式:

    62、

    63、其中,为损失函数lxgb(·)在处的一阶导数值,为损失函数lxgb(·)在处的二阶导数值。

    64、在前一轮构建决策树时,已经计算得到故损失项是一个常数。在优化过程中,常数项与需要优化的参数无关,不会对优化过程产生影响,由此,将式(18)进一步简化为:

    65、

    66、在决策树模型中,样本的预测值是其所属叶子节点的权重值,即:

    67、

    68、其中,指示所属的叶子节点,为对应叶子节点的权重值。

    69、因此,将式(19)进一步表示为:

    70、

    71、其中,指示归属于第j个叶子节点的样本合集,ce为第e棵决策树上叶子节点的总数。都是可以计算得到的确定值。

    72、使用式(21)对wj求一阶导,并令其等于0,可以获得wj的最优解:

    73、

    74、将式(22)代入式(21),可以得到:

    75、

    76、式(23)描述的是第e棵决策树的结构对优化目标所能产生的最大贡献,也可视为该颗决策树的结构分数。在构建树的过程中,使用式(23)作为节点分裂的评估标准,以确定其对优化目标的贡献。通过计算特征作为分裂节点产生的平均节点增益,可以准确地评估该特征对于模型性能的影响。第m个特征的重要性vm可由下式计算得到:

    77、

    78、其中,m=1,…,m,(e,j)指示第e棵决策树的第j个非叶子节点,为第e棵决策树上第j个非叶子节点的划分特征,分别表示节点(e,j)左、右节点上所有样本一阶导数的和,分别表示节点(e,j)左、右节点上所有样本二阶导数的和,g(e,j),s(e,j)分别表示落在(e,j)节点上所有样本一阶导数的和以及二阶导数的和,为指示函数,若条件成立,则函数值为1;否则,函数值为0。

    79、应用式(24)逐一计算每个特征的重要性,可以得到对应的特征重要性向量由此便完成了特征重要性评估。按照特征重要性从大到小的顺序对表征数据进行重排序,将重排序后的数据表示为其中第i个样本为

    80、如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述s5具体包括:

    81、构建hb-net模型对每一重排序后的尺度数据进行分类预测。当输入数据为输出数据为时,hb-net模型的构建与参数学习过程如下:

    82、在构建nk层的hb-net模型时,首先将输入数据划分为如下nk个子集的集合:

    83、

    84、其中是输入数据的第nk个子集,dh=m/nk是每个子集包含的特征数量。

    85、模型中第一个子层的输入数据设置为在第一个子层中,首先对进行次特征映射操作,得到组映射特征每组特征包含个映射节点。该计算过程表示为:

    86、

    87、其中,φ(·)是非线性激活函数,和是随机生成且不再改变的权重参数和偏置。将组映射特征沿特征维度拼接,得到总的映射特征为特征维数。

    88、通过增强映射操作对特征f(1)进行次补充学习,得到组增强特征每组包含个增强节点。该计算过程如下:

    89、

    90、其中,ξ(·)是非线性激活函数,和是随机生成且不再改变的权重参数和偏置。将组增强特征沿特征维度拼接,得到总的增强特征为特征维数。

    91、将计算得到的映射特征f(1)与增强特征e(1)沿特征维度拼接,得到第一层的输出特征节点

    92、第nk个子层的输入数据由前面所有子层的输出特征节点与新的输入特征子集组成,1<nk≤nk。将它们沿特征维度拼接,得到当前子层的输入数据其中为特征维数。该子层的内部运算与第一个子层相同。首先进行特征映射操作,得到组映射特征每组含有个映射节点,表示为:

    93、

    94、其中,和是随机生成且不再改变的权重参数和偏置。拼接所有组映射特征,得到当前子层总的映射特征为特征维数。

    95、接着,进行次增强映射学习,计算式同式(27),得到组映射特征每组含有个映射节点。拼接所有增强特征,得到总的增强特征为特征维数。拼接与得到当前子层的输出特征节点

    96、按照上述算法逐层进行计算,得到最后一个子层的输出特征节点此时,模型的预测输出由下式计算得到:

    97、

    98、其中为输出权重矩阵。

    99、针对wm,使用带有l2正则化损失的目标函数对其进行优化求解,即:

    100、

    101、其中α为正则化系数。

    102、求解优化问题(30),得到wm的最优解为:

    103、

    104、其中i为单位矩阵。

    105、如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述s6具体包括:

    106、在s3筛选结束后,中共有nu个尺度的元素,将第nu个元素表示为依照s4构建xgboost模型对的特征重要性进行识别,并按照特征重要性进行重排序,得到重排序后的数据依照s5分别建立nu个对应的hb-net基模型,基模型的输入数据为输出数据为y。由此,可以得到对应的nu组预测结果,将第nu个基模型的预测输出表示为

    107、利用加权平均方法整合所有基模型的预测输出,得到最终预测结果

    108、

    109、其中为设定的第nu个基模型的权重参数,满足约束条件

    110、本发明的有益效果:本发明提出了一种面向多元时序重症监护数据分类的多尺度信息融合神经网络建模方法。考虑到icu患者的电子健康记录数据具有时序性、分布复杂、数据规模大以及特征维数高等特点,应用融合多模式特征信息的表征模型,能够挖掘样本的类可分性特征和内在特异性特征,全面刻画多元时序数据的特性,消除原始数据中冗余或噪声信息的干扰,为分类模型提供更高质量的信息支撑。针对提取的多元时序表征数据,本方法通过制定基于相似性的尺度筛选原则,自适应地选择不同时间尺度下的表征数据进行集成建模,能够充分考虑icu患者的短期病症表现和长期病情发展趋势。针对每一尺度数据,利用平均信息增益指标对特征重要程度进行量化识别,并按照降序的方法对特征进行重排序,从而划分得到层次结构的输入特征子集。在设计的分层宽度网络模型中,层级化的输入策略使得模型无需一次性处理高维数据特征。此外,每个子层的输入不仅包含新的输入特征子集,还包括之前所有子层的输出节点。每个子层内部包含特征映射和增强映射两部分运算。这些子层以串联的方式进行连接,并在最后一个子层上进行分类预测。这种融合串联和并联的网络结构设计,使模型能够整合不同层次与不同来源的特征,从而更好地适应复杂的数据关系。同时,通过整合多个基于不同尺度数据训练得到的基模型,充分利用它们之间的互补性和协同效应,进一步保证了模型进行分类的准确性和稳定性。所提方法为多元时序重症监护数据的分析及分类提供了一种新的可行方案,为智慧医疗的研究和实践提供了有益的参考和指导。


    技术特征:

    1.一种面向多元时序重症监护数据分类的多尺度信息融合神经网络建模方法,其特征在于,包括以下步骤:

    2.根据权利要求1所述的一种面向多元时序重症监护数据分类的多尺度信息融合神经网络建模方法,其特征在于,所述s1具体包括:

    3.根据权利要求1所述的一种面向多元时序重症监护数据分类的多尺度信息融合神经网络建模方法,其特征在于,所述s2具体包括:

    4.根据权利要求1所述的一种面向多元时序重症监护数据分类的多尺度信息融合神经网络建模方法,其特征在于,所述s3具体包括:

    5.根据权利要求1所述的一种面向多元时序重症监护数据分类的多尺度信息融合神经网络建模方法,其特征在于,所述s4具体包括:

    6.根据权利要求1所述的一种面向多元时序重症监护数据分类的多尺度信息融合神经网络建模方法,其特征在于,所述s5具体包括:

    7.根据权利要求1所述的一种面向多元时序重症监护数据分类的多尺度信息融合神经网络建模方法,其特征在于,所述s6具体包括:


    技术总结
    本发明提出了一种面向多元时序重症监护数据分类的多尺度信息融合神经网络建模方法,属于数据处理技术领域。具体为:收集多元时序重症监护数据及相应的标签数据,应用表征学习模型提取具有区分性和代表性的多元时序表征数据。采用不同长度的时间窗口划分表征数据,并通过全局最大池化操作获取对应的实例级表征数据。基于相似性的尺度筛选原则确定用于集成建模的多尺度表征数据集合。针对筛选结果,利用极限梯度提升决策树对特征重要性进行量化识别后进行重排序。将重排序数据划分为多个特征子集,建立分层宽度网络模型,实现对应尺度下的分类预测。使用加权平均方法融合所有基模型的分类预测结果,得到最终的决策输出。

    技术研发人员:汪德刚,唐佳妮,李捷
    受保护的技术使用者:大连理工大学
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-30602.html

    最新回复(0)