基于光谱分析的癌因性疲乏补中益气药物检测方法

    技术2025-03-02  40


    本发明涉及基于光谱技术的材料分析与检测,具体涉及一种基于光谱分析的癌因性疲乏补中益气药物检测方法。


    背景技术:

    1、癌因性疲乏是指由于癌症及其治疗过程中的身体反应,导致患者出现的疲乏和虚弱状态,通过为患者服用补中益气药物,可以有效缓解患者的癌因性疲乏症状。为了确保药物的安全性和有效性,通常需要对药物进行质量检测,以确定药物的成分是否符合规定。

    2、相关技术中,可以通过利用adaboost(adaptive boosting)集成分类器算法以及光谱分析对药物进行质量检测,即通过利用光谱分析来构建药物的数据样本集,并利用该数据样本集对adaboost集成分类器算法中的弱分类器进行迭代训练可以得到多个弱分类器,再根据每个弱分类器对应的权重对这些弱分类器进行集成合并,则可以获得一个针对药物检测的强分类器。考虑到在对多个弱分类器进行集成合并得到强分类器的过程中,若迭代过程生成的弱分类器数量过多,在集成合并的过程中容易导致过拟合风险、增加强分类器的复杂度以及出现噪声的情况,影响模型的泛化能力,最终影响药物的检测准确性。


    技术实现思路

    1、本发明的目的在于提供一种基于光谱分析的癌因性疲乏补中益气药物检测方法,用于解决现有药物检测的准确性较低的问题。

    2、为解决上述技术问题,本发明提供了一种基于光谱分析的癌因性疲乏补中益气药物检测方法,包括以下步骤:

    3、获取药物的数据样本集,所述数据样本集中的每个数据样本为一个特征向量,每个数据样本对应一个分类类别;

    4、根据任意两个弱分类器对于所述数据样本集的分类差异,以及所述数据样本集中数据样本的数据特征,确定任意两个弱分类器之间的相似程度;

    5、根据所述相似程度,对所有所述弱分类器进行分类,得到各个聚类簇,对每个弱分类器对其所在所述聚类簇中弱分类器的代表情况进行分析,确定每个弱分类器对于相似分类器的代表程度;

    6、根据每个弱分类器对于相似分类器的代表程度、每个弱分类器对于所述数据样本集的分类情况,以及每个弱分类器在训练过程中的特征,确定每个弱分类器的分类能力;

    7、根据所述分类能力,对所有所述弱分类器进行筛选,利用筛选出的各个弱分类器集成得到强分类器,并利用所述强分类器进行药物检测。

    8、进一步的,确定任意两个弱分类器之间的相似程度,包括:

    9、在所述数据样本集中进行随机抽样本,获取各个随机抽样样本集;

    10、根据任意两个弱分类器在训练过程中对于每个所述随机抽样样本集中同一数据样本的权重差异,确定任意两个弱分类器对于每个所述随机抽样样本集的特征关注相似度;

    11、根据任意两个弱分类器对每个所述随机抽样样本集中数据样本的分类结果差异,确定任意两个弱分类器对于每个所述随机抽样样本集的分类差异样本数量;

    12、根据每个所述随机抽样样本集中任意两个数据样本之间的相关情况,确定每个所述随机抽样样本集的样本关联指标;

    13、根据每个所述随机抽样样本集中数据样本的分类类别差异情况,确定每个所述随机抽样样本集的类别不平衡程度;

    14、根据任意两个弱分类器对于每个所述随机抽样样本集的特征关注相似度和分类差异样本数量,以及每个所述随机抽样样本集的样本关联指标和类别不平衡程度,确定任意两个弱分类器之间的相似程度。

    15、进一步的,确定任意两个弱分类器对于每个所述随机抽样样本集的特征关注相似度,包括:

    16、确定任意两个弱分类器在训练过程中对于每个所述随机抽样样本集中同一数据样本的权重的差值绝对值,将对应所述随机抽样样本集的所述权重的差值绝对值的负相关映射结果的累加值,确定为任意两个弱分类器对于每个所述随机抽样样本集的特征关注相似度。

    17、进一步的,确定每个所述随机抽样样本集的样本关联指标,包括:

    18、确定每个所述随机抽样样本集中任意两个数据样本之间的相似指标值,并将所述随机抽样样本集对应的所有相似指标值的均值,确定为每个所述随机抽样样本集的样本关联指标。

    19、进一步的,确定每个所述随机抽样样本集的类别不平衡程度,包括:

    20、所述分类类别为符合含量要求或不符合含量要求;

    21、根据每个所述随机抽样样本集中分类类别为符合含量要求的数据样本的数量,与分类类别为不符合含量要求的数据样本的数量之间的差异情况,确定每个所述随机抽样样本集的类别不平衡程度。

    22、进一步的,确定每个弱分类器对于相似分类器的代表程度,包括:

    23、确定每个弱分类器与其所在所述聚类簇中其他各个弱分类器之间的相似程度的均值和方差,得到每个弱分类器对应的相似程度均值和相似程度方差;

    24、确定每个弱分类器所在所述聚类簇中所有弱分类器对应的相似程度均值中的最小值,得到每个弱分类器对应的最小相似程度均值;

    25、根据每个弱分类器对应的相似程度方差,以及每个弱分类器对应的相似程度均值和最小相似程度均值之间的差异大小,确定每个弱分类器对于相似分类器的代表程度。

    26、进一步的,确定每个弱分类器的分类能力,对应的计算公式为:

    27、

    28、其中,za表示弱分类器a的分类能力;λa表示弱分类器a在训练过程中的权重;da表示弱分类器a对于相似分类器的代表程度;ta表示弱分类器a在训练过程中的消耗时间;ne_a表示在数据样本集中被弱分类器a分类错误的样本数量;n表示数据样本集的样本总数;norm表示归一化函数;exp表示以自然常数e为底数的指数函数。

    29、进一步的,对所有所述弱分类器进行筛选,包括:

    30、将每个弱分类器的分类能力与分类能力阈值进行比较,将弱分类器的分类能力大于分类能力阈值的所有弱分类器作为筛选出的各个弱分类器。

    31、进一步的,利用筛选出的各个弱分类器集成得到强分类器,包括:

    32、根据筛选出的各个弱分类器的分类能力为筛选出的各个弱分类器设置权重,弱分类器的分类能力越大,则对应的权重越大;

    33、根据筛选出的各个弱分类器及其权重,集成得到强分类器。

    34、进一步的,利用所述强分类器进行药物检测,包括:

    35、获取待检测药物对应的特征向量,将该特征向量输入到该强分类器,由该强分类器得到该待检测药物的不同成分含量的分类类别。

    36、本发明具有如下有益效果:为了避免弱分类器集成强分类器的泛化能力差,从而导致药物的检测准确性较低,需要对弱分类器进行筛选。在筛选过程中,分析已知的弱分类器对药物成分分类的相似程度,并结合数据样本集中数据样本的本身数据特征,对不同弱分类器之间的相似程度进行量化,进而通过分析每个弱分类器对其相似弱分类器的代表情况,得到每个弱分类器对于相似分类器的代表程度。如果存在弱分类器的分类效果近似的情况,则通过筛选出其中具有代表性的弱分类器进行最终强分类器的合并,可以有效降低强分类器的复杂度并减少过拟合的风险,从而提高强分类器的泛化能力。结合弱分类器对于相似分类器的代表程度,并根据每个弱分类器对于所述数据样本集的分类情况,以及每个弱分类器在训练过程中的特征,对每个弱分类器对药物成分含量的特征识别情况进行分析,确定每个弱分类器对药物成分含量分类能力的强弱,从而最终筛选出分类能力较强的各个弱分类器以集成强分类器,并利用强分类器进行药物检测。本发明通过对具有代表性且特征识别能力较强,即对药物成分含量分类能力较强的弱分类器进行筛选,在保证分类识别精度的基础上,可以有效避免弱分类器集成强分类器时的过拟合现象和复杂性,有效提高了强分类器的泛化能力,从而保证了药物检测的准确性。


    技术特征:

    1.一种基于光谱分析的癌因性疲乏补中益气药物检测方法,其特征在于,包括以下步骤:

    2.根据权利要求1所述的一种基于光谱分析的癌因性疲乏补中益气药物检测方法,其特征在于,确定任意两个弱分类器之间的相似程度,包括:

    3.根据权利要求2所述的一种基于光谱分析的癌因性疲乏补中益气药物检测方法,其特征在于,确定任意两个弱分类器对于每个所述随机抽样样本集的特征关注相似度,包括:

    4.根据权利要求2所述的一种基于光谱分析的癌因性疲乏补中益气药物检测方法,其特征在于,确定每个所述随机抽样样本集的样本关联指标,包括:

    5.根据权利要求2所述的一种基于光谱分析的癌因性疲乏补中益气药物检测方法,其特征在于,确定每个所述随机抽样样本集的类别不平衡程度,包括:

    6.根据权利要求1所述的一种基于光谱分析的癌因性疲乏补中益气药物检测方法,其特征在于,确定每个弱分类器对于相似分类器的代表程度,包括:

    7.根据权利要求1所述的一种基于光谱分析的癌因性疲乏补中益气药物检测方法,其特征在于,确定每个弱分类器的分类能力,对应的计算公式为:

    8.根据权利要求1所述的一种基于光谱分析的癌因性疲乏补中益气药物检测方法,其特征在于,对所有所述弱分类器进行筛选,包括:

    9.根据权利要求1所述的一种基于光谱分析的癌因性疲乏补中益气药物检测方法,其特征在于,利用筛选出的各个弱分类器集成得到强分类器,包括:

    10.根据权利要求1所述的一种基于光谱分析的癌因性疲乏补中益气药物检测方法,其特征在于,利用所述强分类器进行药物检测,包括:


    技术总结
    本发明涉及基于光谱技术的材料分析与检测技术领域,具体涉及基于光谱分析的癌因性疲乏补中益气药物检测方法,该方法通过获取药物的数据样本集,根据任意两个弱分类器对于数据样本集的分类差异以及数据样本集中数据样本的数据特征,确定任意两个弱分类器的相似程度,进而确定每个弱分类器对于相似分类器的代表程度;根据每个弱分类器对于相似分类器的代表程度和对于数据样本集的分类情况,以及每个弱分类器在训练过程中的特征,确定每个弱分类器的分类能力,进而对弱分类器进行筛选,利用筛选出的各个弱分类器集成得到强分类器,并进行药物检测。本发明通过筛选分类能力更强的弱分类器集成得到强分类器,有效提高了药物检测准确性。

    技术研发人员:梅莎莎,宋恩峰,王朝军,杨静一,关庆亚,陈逸飞
    受保护的技术使用者:武汉大学人民医院(湖北省人民医院)
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-27118.html

    最新回复(0)