基于大数据的多媒体音响智能化声音控制方法与流程

    技术2024-12-22  61


    本发明涉及智能控制领域,尤其涉及基于大数据的多媒体音响智能化声音控制方法。


    背景技术:

    1、随着科技的不断发展,多媒体音响已成为人们生活中不可或缺的一部分,并且随着语音采集识别技术的发展,利用远程语音控制音响的技术也逐渐衍生。

    2、经检索,中国专利公开号为cn103546841a的专利,公开了一种基于wifi实现对数字音响音量控制的方法及系统,包括:基于客户端接收用户调节数字音响音量的请求;将所述用户调节数字音响音量的请求基于wifi发送给数字音响系统;数字音响系统响应所述用户调节数字音响音量的请求,并基于wifi向客户端发送音量调节界面;用户基于客户端调节数字音响的音量参数,并通过wifi向数字音响系统发送调节的音量参数;数字音响系统根据调节的音量参数实现数字音响系统中的音量调节。

    3、上述专利存在以下不足:由于声音在传播时会存在音幅损耗,这就使得音量大小存在损耗,其无法基于使用者的距离对损耗进行补偿,从而远程语音控制精度较低。

    4、为此,本发明提出基于大数据的多媒体音响智能化声音控制方法。


    技术实现思路

    1、本发明的目的是为了解决现有技术中存在的缺点,而提出的基于大数据的多媒体音响智能化声音控制方法。

    2、为了实现上述目的,本发明采用了如下技术方案:

    3、基于大数据的多媒体音响智能化声音控制方法,该多媒体音响具备横向发声角度和纵向发声角度调节功能,其智能化声音控制方法包括以下步骤:

    4、s1:通过声音采集传感器阵列采集使用者的语音;

    5、s2:利用传感器阵列采集语音的相位差,计算使用者相对于音响的方位,并根据方位确定使用者相对于音响的直线距离;

    6、s3:根据使用者的方位调节多媒体音响的发声角度,使其朝向使用者;

    7、s4:对采集到的使用者的语音进行处理,分析使用者对于声音音量大小的控制需求a;

    8、s5:根据音量大小需求a、声音在空气中的传播损耗模型以及使用者相对于音响的直线距离来调整音响的音量大小,使得声音传播至使用者处时,音量大小为控制需求a。

    9、优选地:所述s2步骤中,确定方位的方法包括以下步骤:

    10、s21a:至少设置3*3传感器阵列,传感器阵列相邻传感器的距离为δl,且在传感器阵列中,任选三个横向排列的传感器以及三个纵向排列的传感器;

    11、s22a:建立空间坐标系,并根据音响以及传感器阵列的位置,确定三个横向排列的传感器坐标分别为:,三个纵向排列的传感器坐标分别为:,并将说话者坐标信息预设为;

    12、s23a:分别计算说话者坐标与传感器的距离;

    13、s24a:对于三个横向排布的传感器进行排列组合,得到三种组合、、,其采集到的声音相位差、、分别为对于三个横向排布的传感器进行排列组合,得到三种组合、、,其采集到的声音相位差分别为、、;

    14、s25a:分别计算每一种组合中,坐标距离差和相位差的实际距离差,并将其做等式建立函数关系,,其中c为声音在空气中传播的速度;得到六个函数关系,然后最函数关系求解,得到x、y、z值,确定说话者坐标。

    15、优选地:所述s2步骤中,确定直线距离的方法包括以下步骤:

    16、s21b:根据音响结构确定音响的发声单元所在坐标;

    17、s22b:结合说话者坐标,按照公式计算直线距离,其中x、y、z为说话者的坐标。

    18、优选地:所述s4步骤中,语音处理包括预处理、特征提取和语音识别。

    19、优选地:所述预处理包括以下步骤:

    20、s41a:将每个传感器采集到的声音信号进行对比;

    21、s42a:对声音信号进行滤波处理;

    22、s43a:遍历每一个传感器的声音信号,当有缺失时,检测其余传感器位于缺失位置的声音信号,根据该声音信号对缺失进行填充。

    23、优选地:所述s4步骤中,特征提取包括以下步骤:

    24、s41b:分帧:机器人麦克风采集语音参数,对语音流进行分帧处理,帧长为512个采样点,帧移128个采样点;

    25、s42b:预加重,以抵消口腔对高频部分声音的压制作用,对于每一帧,做如下处理:,,其中,表示一帧中第n+1个采样点;

    26、s43b:加窗:使用汉明窗,减弱分帧引起的信号在分界上的不连续性:,其中,n=0,1,……,t-1,t=512;

    27、s44b:快速傅里叶变换:使用基2的离散傅里叶变换将时域能量转换为频域能量:,其中,k=0,1,……,n-1,n=512,对其进行平放操作得到实数域的能量:;

    28、s45b:mel能量:通过40个mel滤波器组,得40维的melmel频子带能量;

    29、s46b:mel对数能量:对每个mel频子带能量去对视:;

    30、s47b:离散余弦变换:。

    31、优选地:所述s5步骤中,音量大小控制方法包括以下步骤:

    32、s51:确定声音传播时,音量大小损耗与距离的损失函数,其中为音量损耗大小,为传播距离;

    33、s52:根据说话者距离l,结合损失函数确定音量损耗值d,;

    34、s53:将音响音量调整至a+d即可,其中a为音量大小的控制需求。

    35、优选地:所述s51步骤中,当音响处于空旷环境时,损失函数为。

    36、优选地:所述s51步骤中,当音响处于室内环境时,损失函数为。

    37、本发明的有益效果为:

    38、本发明通过利用传感器阵列采集声音,一方面多个传感器可相互补偿空缺值,从而保证声音数据的完整性,另外多个传感器还可确定使用者的方位,从而使得音响发生方向能契合于使用者的方位,增加使用效果,同时,基于方位还可确定直线距离,再结合声音传播的损失函数,能对音量损耗值进行补偿,增加了音量控制的精准度。



    技术特征:

    1.基于大数据的多媒体音响智能化声音控制方法,其特征在于,该多媒体音响具备横向发声角度和纵向发声角度调节功能,其智能化声音控制方法包括以下步骤:

    2.根据权利要求1所述的基于大数据的多媒体音响智能化声音控制方法,其特征在于,所述s2步骤中,确定方位的方法包括以下步骤:

    3.根据权利要求1所述的基于大数据的多媒体音响智能化声音控制方法,其特征在于,所述s2步骤中,确定直线距离的方法包括以下步骤:

    4.根据权利要求1所述的基于大数据的多媒体音响智能化声音控制方法,其特征在于,所述s4步骤中,语音处理包括预处理、特征提取和语音识别。

    5.根据权利要求4所述的基于大数据的多媒体音响智能化声音控制方法,其特征在于,所述预处理包括以下步骤:

    6.根据权利要求4所述的基于大数据的多媒体音响智能化声音控制方法,其特征在于,所述s4步骤中,特征提取包括以下步骤:

    7.根据权利要求1所述的基于大数据的多媒体音响智能化声音控制方法,其特征在于,所述s5步骤中,音量大小控制方法包括以下步骤:

    8.根据权利要求7所述的基于大数据的多媒体音响智能化声音控制方法,其特征在于,所述s51步骤中,当音响处于空旷环境时,损失函数为。

    9.根据权利要求7所述的基于大数据的多媒体音响智能化声音控制方法,其特征在于,所述s51步骤中,当音响处于室内环境时,损失函数为。


    技术总结
    本发明公开了基于大数据的多媒体音响智能化声音控制方法,涉及智能控制领域;包括该多媒体音响具备横向发声角度和纵向发声角度调节功能,其智能化声音控制方法包括以下步骤:通过声音采集传感器阵列采集使用者的语音;利用传感器阵列采集语音的相位差,计算使用者相对于音响的方位,并根据方位确定使用者相对于音响的直线距离。本发明通过利用传感器阵列采集声音,一方面多个传感器可相互补偿空缺值,从而保证声音数据的完整性,另外多个传感器还可确定使用者的方位,从而使得音响发生方向能契合于使用者的方位,增加使用效果,同时,基于方位还可确定直线距离,再结合声音传播的损失函数,能对音量损耗值进行补偿,增加了音量控制的精准度。

    技术研发人员:马尔杰,马文镇,孟强
    受保护的技术使用者:深圳市皇马电器有限公司
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-24041.html

    最新回复(0)