一种音频设备的音量调节方法、装置、设备及存储介质与流程

技术2025-04-16 54

本申请涉及音量调节，具体涉及一种音频设备的音量调节方法、装置、设备及存储介质。

背景技术：

1、随着科技的快速发展，人们对音频播放设备的需求日益增加。特别是在环境噪音多变的情况下，确保音频播放的清晰度和舒适度成为了亟待解决的问题。传统的音量调节方法往往无法准确适应环境音的变化，导致用户体验不佳。近年来，人工智能技术的迅速发展为大模型分析环境音内容提供了可能性。大模型具有强大的数据处理和学习能力，可以深入分析环境音，并自动调节音频播放设备的音量。这种技术的引入为音频播放设备提供了更智能、更精确的音量调节方案。

2、相关技术是将环境噪音作为大模型来获取音频设备的自动调节音量，但此方式存在一些局限性。现有的自动调节音量的方法通常只考虑环境噪声的整体音量大小，而忽略了噪声的具体内容，比如人声或交通噪声。这意味着当环境中存在大量嘈杂的人声或交通噪声时，设备可能会错误地将音量调得很高，以应对整体的环境噪声水平。这种方法的局限性在于，用户可能会因为设备误判环境而无法有效地聆听人声或其他重要的声音内容。例如在人声嘈杂的环境中，人们通常更希望能够清晰地辨别并听到他人说话的内容。然而，如果只根据整体环境噪音的音量调节音频设备，可能会使得人声淹没在环境噪声中，从而影响用户对重要信息的感知。

3、因此，如何有效地对音频设备进行音量调节，是本领域技术人员急需解决的技术问题。

技术实现思路

1、基于上述问题，本申请提供了一种音频设备的音量调节方法、装置、设备及存储介质，可以提高音频设备的音量调节的时效。

2、本申请实施例公开了如下技术方案：

3、一种音频设备的音量调节方法，所述方法包括：

4、采集目标环境下的混合音频；

5、基于设备音频对所述混合音频进行过滤，得到环境音频；所述设备音频由所述目标环境下的音频设备发出；

6、对所述环境音频进行特征提取，得到音频特征；

7、对所述音频特征进行语义信息提取，基于提取到的语义信息确定所述环境音频的音频类别和音频属性；

8、基于所述音频类别和所述音频属性对所述音频设备进行音量调节。

9、在一种可能的实现方式中，所述基于所述音频类别和所述音频属性对所述音频设备进行音量调节，包括：

10、当所述音频类别为噪音类别时，获取所述环境音频的音频音量和音频频率；

11、若所述音频音量超过第一音量阈值和/或所述音频频率超过第一频率阈值，则生成第一音量增强信号；

12、将所述第一音量增强信号发送给所述音频设备，以使所述音频设备基于所述音量增强信号进行音量调节。

13、在一种可能的实现方式中，所述基于所述音频类别和所述音频属性对所述音频设备进行音量调节，包括：

14、当所述音频类别为非噪音类别时，确定所述音频属性对应的第二音量阈值和第二频率阈值，并获取所述环境音频的音频音量和音频频率；

15、若所述音频音量超过第二音量阈值和/或所述音频频率超过第二频率阈值，则生成第二音量增强信号，否则生成音量减弱信号；

16、将所述第二音量增强信号或所述音量减弱信号发送给所述音频设备，以使所述音频设备基于所述音量增强信号进行音量调节。

17、在一种可能的实现方式中，所述基于设备音频对所述混合音频进行过滤，得到环境音频，包括：

18、使用时频分析工具将所述混合音频转换到频域和时域，得到所述混合音频的时频域信息；

19、基于所述设备音频的音频特征识别所述混合音频中属于设备音频的部分，得到所述设备音频；

20、从混合音频中分离出所述设备音频，得到所述环境音频。

21、在一种可能的实现方式中，所述音频特征包括：频谱内容、时间变化、能量分布、持续性、信噪比以及频谱形状。

22、一种音频设备的音量调节装置，所述装置包括：

23、混合音频单元，用于采集目标环境下的混合音频；

24、音频过滤单元，用于基于设备音频对所述混合音频进行过滤，得到环境音频；所述设备音频由所述目标环境下的音频设备发出；

25、特征提取单元，用于对所述环境音频进行特征提取，得到音频特征；

26、语义信息提取单元，用于对所述音频特征进行语义信息提取；

27、确定单元，用于基于提取到的语义信息确定所述环境音频的音频类别和音频属性；

28、音量调节单元，用于基于所述音频类别和所述音频属性对所述音频设备进行音量调节。

29、在一种可能的实现方式中，所述音量调节单元具体包括：

30、第一获取单元，当所述音频类别为噪音类别时，用于获取所述环境音频的音频音量和音频频率；

31、第一生成单元，若所述音频音量超过第一音量阈值和/或所述音频频率超过第一频率阈值，则用于生成第一音量增强信号；

32、第一发送单元，用于将所述第一音量增强信号发送给所述音频设备，以使所述音频设备基于所述音量增强信号进行音量调节。

33、在一种可能的实现方式中，所述音量调节单元还包括：

34、第一确定单元，当所述音频类别为非噪音类别时，用于确定所述音频属性对应的第二音量阈值和第二频率阈值；

35、第二获取单元，用于获取所述环境音频的音频音量和音频频率；

36、第二生成单元，若所述音频音量超过第二音量阈值和/或所述音频频率超过第二频率阈值，则用于生成第二音量增强信号，否则生成音量减弱信号；

37、第二发送单元，用于将所述第二音量增强信号或所述音量减弱信号发送给所述音频设备，以使所述音频设备基于所述音量增强信号进行音量调节。

38、一种音频设备的音量调节设备，包括：存储器，处理器，及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时，实现如上所述的音频设备的音量调节方法。

39、一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行如上所述的音频设备的音量调节方法。

40、相较于现有技术，本申请具有以下有益效果：

41、本申请提供了一种音频设备的音量调节方法、装置、设备及存储介质。具体地，在执行本申请实施例提供的音频设备的音量调节方法时，首先可以采集目标环境下的混合音频。接着，基于由目标环境下的音频设备发出的设备音频对混合音频进行过滤得到环境音频，并将对环境音频进行特征提取得到音频特征。然后对音频特征进行语义信息提取，基于提取到的语义信息确定所述环境音频的音频类别和音频属性。再基于音频类别和音频属性对音频设备进行音量调节。本申请通过对环境音频进行特征提取和语义信息提取，以根据具体环境和声音特征为用户提供更加个性化的音频体验。根据分析出的音频类别和属性，音量可被调整以最大限度地保障用户能够清晰、舒适地听到他们感兴趣的声音内容。

技术特征：

1.一种音频设备的音量调节方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述音频类别和所述音频属性对所述音频设备进行音量调节，包括：

3.根据权利要求1所述的方法，其特征在于，所述基于所述音频类别和所述音频属性对所述音频设备进行音量调节，包括：

4.根据权利要求1所述的方法，其特征在于，所述基于设备音频对所述混合音频进行过滤，得到环境音频，包括：

5.根据权利要求1所述的方法，其特征在于，所述音频特征包括：频谱内容、时间变化、能量分布、持续性、信噪比以及频谱形状。

6.一种音频设备的音量调节装置，其特征在于，所述装置包括：

7.根据权利要求6所述的装置，其特征在于，所述音量调节单元具体包括：

8.根据权利要求6所述的装置，其特征在于，所述音量调节单元还包括：

9.一种音频设备的音量调节设备，其特征在于，包括：存储器，处理器，及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时，实现如权利要求1-5任一项所述的音频设备的音量调节方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行如权利要求1-5任一项所述的音频设备的音量调节方法。

技术总结
本申请公开了一种音频设备的音量调节方法、装置、设备及存储介质。在执行本申请实施例提供的方法时，首先可以采集目标环境下的混合音频，并基于由目标环境下的音频设备发出的设备音频对混合音频进行过滤得到环境音频。对环境音频进行特征提取得到音频特征，并对音频特征进行语义信息提取，基于提取到的语义信息确定环境音频的音频类别和音频属性。再基于音频类别和音频属性对音频设备进行音量调节。本申请利用提取到的语义信息可以智能地确定如何调节音频设备的音量，以最优化用户的听觉体验。与传统的音量控制方法相比，这种基于语义信息的调节策略更为智能和自适应，能够在各种环境条件下提供高质量的音频体验。

技术研发人员：段梦瑶
受保护的技术使用者：北京搜狐互联网信息服务有限公司
技术研发日：
技术公布日：2024/10/24

转载请注明原文地址:https://symbian.8miu.com/read-29400.html

专利

最新回复(0)