本发明属于睡眠检测和人工智能,具体涉及一种意识障碍患者睡眠自动分期的自监督对比学习方法。
背景技术:
1、深度学习获取表征的能力被研究者广泛认同,但是通过神经网络挖掘的睡眠表征往往缺乏泛化性,从而不适合后续的模型扩展和迁移学习应用。在睡眠psg记录中,存在由于被试在睡着后的体动造成噪声、磨牙导致的肌电伪迹,甚至心电伪迹,这些噪声在睡眠信号中属于高频成分,容易让模型关注到它并作为特征而学习,会严重影响模型性能。在不同睡眠时期,脑电信号和眼电信号都会存在某些特定的特征,例如在n2时期,eeg会出现k-complex waves,在n3时期,eeg会出现慢波,这两种特征波在其他波的比较之下属于低频波。在进行睡眠分期时,将注意力集中在这些特征波和丰富的背景波信息上至关重要。某些低频信息可能会跨信道平均化,这可能会制约特征提取器的特征描述能力。因此,有必要探索更有效的睡眠信号处理方法,以提高模型性能。
2、大量研究倾向于探索以单模态脑电图睡眠信号为中心的睡眠分期模型,以提高模型的性能,而往往忽视了不同模态对睡眠分期的贡献。这种做法阻碍了睡眠分期模型与需要大量数据的实际临床应用相结合。此外,处理多模态的方法也会影响分类性能。不同的睡眠阶段在区分睡眠阶段的方式上表现出相应的特征。例如,在n1阶段,特征包括低频混合脑电图和慢眼动眼电;在n3阶段,特征包括慢波脑电图和无眼动眼电;在rem阶段,特征包括低频混合脑电图和快速眼动眼电。现有模型通过直接拼接或元素融合来整合来自不同模态的互补信息,从而应对多模态挑战。随后,注意力机制被用于集中特定睡眠阶段的决策模式。然而,这些方法并没有同时考虑各种模式之间的异同,也没有充分探讨各种模式在特定睡眠阶段的共同作用。
3、此外,大多数基于深度学习的睡眠分期模型在很大程度上依赖于大量的训练数据和超参数调整来完成特征提取阶段,这给扩展模型和增强其泛化能力带来了挑战,在每天都有新数据产生的实际临床场景中,数据的质量并不像理想的实验数据那样,可能存在不可避免的噪声;因此,努力获取高质量的标记物是一项挑战,此外,在确定地面真实标签时,也存在分歧。最近,自监督对比学习作为一种旨在共享特定上下文的表征学习方法出现了。通过捕捉这种高度共享的特征,可以有效减少主体间差异的影响,此外,自监督学习可以利用未标记的数据集,大大降低标记成本,优化可用数据的利用率,并丰富数据集的多样性,这种方法有利于应对实际挑战;
4、目前,doc患者的睡眠结构研究越来越受到关注。尽管由于doc患者脑损伤严重,脑电图的振幅、波形、频率等特征都会发生变化,关于doc的睡眠特征的定义尚未达成共识,但是研究人员们基于aasm和r&k睡眠评分准则或对其进行调整以分析doc患者的睡眠模式,根据aasm标准检测睡眠纺锤体,在15名vs/uws患者中检测到14名有睡眠迹象。cologan etal.(cologan2013sleepa)用标准定义的纺锤波和慢波和调整后的纺锤波(频率范围6-9hz)和慢波(低振幅<79μv)对vs/uws和mcs患者睡眠进行评估,表明mcs患者比vs患者表现出更多的睡眠特征。giubilei等人(giubilei1995sleep)使用r&k指南评估了十名vs/uws患者的睡眠模式,其中九人有睡眠模式,只有一人没有类似的生理睡眠模式,而且是唯一在实验期间一直处于植物人状态的患者。nekrasova等人(nekrasova2020retrospective)使用自动分析软件检测doc患者睡眠记录中的特征性睡眠波(如纺锤波、慢波),并根据改编后的r&k标准对睡眠进行评估,结果表明仅有12.5%的患者(共40名患者)存在睡眠阶段的某些成分。然而,由于病理、采集设备和医院环境的不同,doc受试者的脑电图特征存在较大的个体差异,对其睡眠特征的人工分析尚需依据不同的标准,因此,如何调整自动化方法以用于不同doc患者的自动睡眠分期存在巨大挑战。
技术实现思路
1、本发明的目的在于提供一种意识障碍患者睡眠自动分期的自监督对比学习方法,通过提取广义睡眠特征的单模态对比学习结构、设计一种多模态一致性结构、预训练策略,并将深度学习方法用于doc患者的自动睡眠分期以解决上述背景技术中提出的问题。
2、为实现上述目的,本发明提供如下技术方案:一种意识障碍患者睡眠自动分期的自监督对比学习方法,具体包括如下步骤:
3、步骤一:数据准备,
4、s1、给定一个从psg记录中得到的预训练睡眠序列有n个无标记的睡眠片段样本,其中代表一个时间戳t为30s,采样率为f=100hz的睡眠样本,具有eeg和eog两个通道c;其中xpretrain为无标签睡眠序列;
5、s2、令每个睡眠样本同样有t时间跨度和f采样率以及c个通道,此外,还对应标签yi∈{0,1,2,3,4},每个标签与aasm手册定义的五个睡眠阶段w,n1,n2,n3和rem匹配;其中为xfinetune带标签的微调模型参数;
6、s3、使用抖动数据增强的方法(kiyasseh2021clocs,eldele2021timeseries),对原始的脑电和眼电数据进行抖动增强得到一个增强集每个xi可以代表输入的脑电样本和眼电眼样本通过上述方式,使用无标签睡眠序列xpretrain预训练模型f,以便后续使用带标签的xfinetune微调模型参数,实现自动睡眠分期,具体来说,模型f在xpretrain上进行预训练,得到f(-,θ),然后用已经标注的xfinetune优化模型的参数θ为微调后的参数φ,得到模型f(-,φ)。值得注意的是,模型f使用了两种不同对比学习借口任务以挖掘单模态表征和多模态一致性特征,作为支持睡眠数据集之间的知识转移机制;
7、步骤二:设置单模态特征提取器:为了可以分别获取eog和eeg的表征,方便后续对不同模态进行计算,设置一种双流单模态的特征提取器来捕捉不同信号的特征,如图1所示,具体来说,将原始脑电数据和眼电数据输入到两个独立的通道中,针对性地学习不同的信号表征,每个通道由两个部分组成:过滤器层,残差通道注意力层;
8、步骤三:设置多模态一致性特征提取器,根据aasm指南可知,同时记录的脑电和眼电是同一睡眠时期的不同特征表示,这两个信号之间的关系提供了一种不变性,无论睡眠模式如何改变,该不变性都有效,因此可以作为预训练的归纳偏差,为了学习不同模态的一致性特征,使在同一睡眠片段的eeg表征和eog表征在特征空间中的位置相近,以共同决策某一特定睡眠阶段,本发明提出了多模态一致性学习,同时为了确保多模态特征之间的距离是可以测量的,构造投影网络p(.)以分别将上述单模态对比学习输出的特征图映射到联合eeg-eog空间;具体来说,投影网络由两个全连接层组成,定义如下:
9、zi=p(ai)=fc2(relu(bn(fc1(ai))))
10、其中,bn函数代表批归一化操作,fci代表第i个全连接层,zi是输入样本ai经过投影器p后得到的嵌入;
11、步骤四:自监督学习:
12、a、单模态对比学习:用自监督对比学习预训练网络的单模态特征提取器,不需要带标签的数据,通过寻找一个合适的借口任务作为构造正负例的规则;目标是通过对比学习获取一定通用性的能够充分利用大量数据的编码器,得到效果良好的数据表示:
13、b、多模态一致性学习:经过基于单模态的对比学习后,每一个样本有4个特征输入到多模态一致性特征提取器m中,可以得到基于eeg特征生成的基于eog特征生成的同一睡眠片段的原始数据eeg与eog之间的距离,会比与增强数据的eog距离更近,同样地,对于原始数据eog,其与eeg之间的距离相比与增强数据eeg会更近,增强数据eeg和eog由于添加的是随机高斯噪声,他们之间的距离应该要大于源数据的距离。
14、优选的,在所述步骤二中,eeg和eog的处理方式相同,为了阅读性,如无特殊情况不使用上标eeg或者eog特指说明。
15、优选的,所述步骤二中的过滤层是指把输入信号历时转化为深度学习模型可用的特征向量格式(ledig2017photorealistic),并提取输入信号中的初级浅层特征:具体如下:
16、x1=filter(x)
17、其中filter函数表示一系列操作,包括一个卷积操作,然后对批量数据进行标准化,接着通过relu非线性单元激活层和最大池化层;x1代表经过过滤层后得到的浅层特征。
18、优选的,所述步骤二中,残差通道注意力层为结合卷积操作和通道注意力机制和残差连接,用于提取睡眠信号的深层次特征,如图1所示,随着网络加深,较浅层特征通过跳跃连接与较深层特征进行加法操作,实现数据跨层流动,减少信息的损失,提升网络的泛化能力,这对后续模型的迁移至关重要,具体来说,本发明使用连续的两个残差通道注意力模块来挖掘睡眠信号的特征,每个残差通道注意力模块由两个卷积层,一个通道注意力机制层,最后将输入的特征与输出特征进行相加,其定义为:
19、
20、其中,代表输入序列x1中的第i个样本,wk为卷积核的权重,k是卷积核的位置,b为偏置,f为卷积核的大小;rulu代表激活函数;和代表该模块中连续两个卷积的输出特征。
21、优选的,所述通道注意力机制层是为了学习特征每个通道的权重,用于可以自适应地有效捕捉不同通道对于特定睡眠时期的贡献;通过平均池化层将每个通道的特征取平均,如下定义:
22、
23、其中,w和h代表这特征图的高度和宽度,即其中c为特征的通道数;
24、接着,为了更有效捕捉通道之间的关系,同时保持全局信息对决策的影响,对经过全局平局池化层引入的全局信息进行降维和升维(hu2018squeezeandexcitation),最终获得通道的权重因子;定义如下所示:
25、
26、其中,c/r代表卷积核的数量,把通道c缩减为缩小比例为r的通道数,低维信号经过rulu激活后,通过通道放大层重新把信号通道以比例r增大;然后得到的就是获得的通道注意力权重因子,用来重新调整输入的
27、
28、通过通道注意力进行通道加权,对残差分量自适应重新缩放,最后与输入残差通道注意力模块的特征进行残差连接,保留原始的输入信息,提高网络泛化能力。
29、优选的,所述步骤四中,对于给定的输入的睡眠样本xi,包含脑电数据和眼电数据对样本进行数据增强,得到让模型暴露于复杂的睡眠数据中,以产生更鲁棒的基于单模态的嵌入;
30、多模态数据xi及其增强样本输入对比特征提取器u中,得到ai=u(xi),由于是由xi增强而来,是代表同一睡眠阶段的特征,把当作是正样本对,把(ai,aj)和当作是负样本对;采用了在对比学习中的归一化温度标度交叉熵损失(nt-xent)作为样本对距离d,计算定义如下:
31、
32、其中,sim表示余弦相似度函数,1j≠i∈{0,1}是一个指标函数,当j=i时为0,当j≠i时为1;t代表温度参数,用来调整正样本对和负样本对概率分布比例,用这个距离函数作为优化模型的损失函数,让正样本对更加接近,让负样本对更加远离,具体地,根据样本ai,把单模态的对比编码器的损失函数分别定义为来指导模型优化,敦促模型学习不受噪声增强干扰的eeg和eog特征。
33、优选的,在所述步骤四的b中,采用表示正样本对的距离,类似地,定义了负样本对距离参考三重损失的应用[hoffer2018deep],对于特征提取器m的损失函数定义为:
34、
35、其中δ是给定的一个常数用于保持负样本之间的距离[balntas2016learning];dpair代表负样本对的距离;lm在训练过程中推动模型更好地学习有意义的特征表示,让来自同一睡眠片段的脑电和眼电特征在联合空间中靠近,使来自不同睡眠片段的脑电和眼电相互远离,学习到不同被试睡眠数据中的共性特征。
36、优选的,所述步骤四中还包括
37、模型预训练的总体损失函数有三个项,如下定义:
38、
39、其中,λ是控制对比损失和一致性损失的相对重要的超参数,根据问题定义,模型f由神经网络模块ueeg,ueog,meeg和meog组成;模型经过预训练后,保存模型所有参数并表示为f(-,θ),当模型进行微调时,需要用带标签的数据样本,指导模型适应目标域的睡眠数据,在微调中,为了验证所提出方法在自动睡眠分期分类任务中的性能,添加一个下游分类任务模块c(-),包含一个lstm层和一个softmax分类器;增加交叉熵函数lce测量分类的损失;模型微调的总体损失函数如下定义:
40、
41、不冻结模型的任何层,让所有参数θ进行微调,得到微调的参数φ,模型f通过联合融合[fu2020jldcf]生成特征其中,⊙表示元素间的乘法,+表示元素间的加法;最后得到预测分类结果其中γ为下游分类任务模块的参数。
42、与现有技术相比,本发明的有益效果是:
43、1、本发明提出了一种用于提取广义睡眠特征的单模态对比学习结构,为了模拟临床实践中出现的随机高频成分噪声,本发明添加了随机高斯噪声作为增强数据,对比学习同时用于原始数据和增强数据,以增强由连续残差通道注意块组成的特征提取器的泛化和特征描述能力;
44、2、基于时间序列对比学习的启发,本发明设计了一种多模态一致性结构,以揭示特定睡眠阶段不同模态之间的异同,该结构包括两个线性层,将多模态特征映射到联合脑电图空间,确保多模态特征之间的距离可测量;
45、3、本发明设计了一种预训练策略,利用丰富的未标记睡眠数据,采用自监督对比学习方法对单模态特征提取器和多模态一致性结构进行预训,。随后,对模型进行微调,以适应不同数据集上的睡眠分期;
46、4、本发明收集并整理了自采doc患者的睡眠数据集,该种方式是首次将深度学习方法用于doc患者的自动睡眠分期,doc患者的自动睡眠分期只需要少量的标注数据,有助于doc患者的长期睡眠监测成为临床诊疗工具,帮助医生更及时、更有效地了解和分析患者的病情。
1.一种意识障碍患者睡眠自动分期的自监督对比学习方法,其特征在于:具体包括如下步骤:
2.根据权利要求1所述的一种意识障碍患者睡眠自动分期的自监督对比学习方法,其特征在于:在所述步骤二中,eeg和eog的处理方式相同。
3.根据权利要求1所述的一种意识障碍患者睡眠自动分期的自监督对比学习方法,其特征在于:所述步骤二中的过滤层是指把输入信号历时转化为深度学习模型可用的特征向量格式,并提取输入信号中的初级浅层特征:具体如下:
4.根据权利要求1所述的一种意识障碍患者睡眠自动分期的自监督对比学习方法,其特征在于:所述步骤二中,残差通道注意力层为结合卷积操作和通道注意力机制和残差连接,用于提取睡眠信号的深层次特征,随着网络加深,较浅层特征通过跳跃连接与较深层特征进行加法操作,实现数据跨层流动,减少信息的损失,提升网络的泛化能力,每个残差通道注意力模块由两个卷积层,一个通道注意力机制层,最后将输入的特征与输出特征进行相加,其定义为:
5.根据权利要求4所述的一种意识障碍患者睡眠自动分期的自监督对比学习方法,其特征在于:所述通道注意力机制层是为了学习特征每个通道的权重,用于可以自适应地有效捕捉不同通道对于特定睡眠时期的贡献;通过平均池化层将每个通道的特征取平均,如下定义:
6.根据权利要求1所述的一种意识障碍患者睡眠自动分期的自监督对比学习方法,其特征在于:所述步骤四中,对于给定的输入的睡眠样本xi,包含脑电数据和眼电数据对样本进行数据增强,得到让模型暴露于复杂的睡眠数据中;
7.根据权利要求1所述的一种意识障碍患者睡眠自动分期的自监督对比学习方法,其特征在于:在所述步骤四的b中,采用表示正样本对的距离,定义负样本对距离参考三重损失的应用,对于特征提取器m的损失函数定义为:
8.根据权利要求1所述的一种意识障碍患者睡眠自动分期的自监督对比学习方法,其特征在于:所述步骤四中还包括