一种终端设备及语音播报的音量调节方法与流程

技术2025-08-07 26

本技术涉及语音交互，尤其涉及一种终端设备及语音播报的音量调节方法。

背景技术：

1、终端设备是指具有声音采集功能的电子设备，可以是智能电视、手机、智能音箱、电脑、机器人等电子设备。以智能电视为例，智能电视是基于internet应用技术，具备开放式操作系统与芯片，拥有语音识别功能模块，可实现双向人机交互功能的电视产品，用于满足用户多样化和个性化需求。

2、终端设备具有音频播放功能，可对不同信号源提供的媒资进行播放，如终端设备可以通过扬声器等音频输出装置播放本地存储媒资的音频数据，也可以通过音频输出装置播放外接设备所提供媒资的音频数据。部分终端设备还可以支持语音播报功能，如唤醒及误唤醒应答、tts（text to speech，从文本至语音）播报等，以通过语音播报的声音辅助用户与终端设备进行语音交互。

3、然而，上述媒资和语音播报功能对应的音频数据，音量均为用户手动设置的。当外接设备设置的音量较小或媒资片源对应的音量较小时，终端设备设置的系统声音可能会偏大；当外接设备设置的音量较大或媒资片源对应的音量较大时，终端设备设置的系统声音则可能会偏小。此时，如果用户使用终端设备的语音播报功能，语音播报的声音也可能会偏大或偏小，影响用户的听觉体验。

技术实现思路

1、本技术提供一种终端设备及语音播报的音量调节方法，以解决语音播报声音偏大或偏小的问题。

2、第一方面，本技术一些实施例提供一种终端设备，包括音频输出装置、检测器和控制器。其中，所述音频输出装置被配置为播放内部音频数据的输出声音，所述内部音频数据包括媒资音频数据和播报音频数据；所述检测器被配置为采集混合音频数据，所述混合音频数据包括通过采集所述输出声音生成的音频数据和通过采集外部环境声音生成的音频数据；所述控制器被配置为执行以下程序步骤：

3、获取所述媒资音频数据设置的基础音量；

4、计算所述基础音量和参考音量的第一差异值，所述参考音量为所述混合音频数据在目标时间段的平均音量；

5、根据所述内部音频数据和所述混合音频数据检测环境噪声音量；

6、按照所述第一差异值和所述环境噪声音量获取调节系数；

7、通过所述调节系数、所述参考音量和所述基础音量计算目标音量；

8、将所述播报音频数据的音量设置为所述目标音量，以使所述音频输出装置按照所述目标音量播放所述播报音频数据的声音。

9、本技术一些实施例中，所述控制器执行获取所述媒资音频数据设置的基础音量，被配置为：获取第一预设时间段的所述媒资音频数据，以生成第一音帧；提取所述第一音帧的第一信号值；根据所述第一信号值计算所述基础音量，所述基础音量基于所述第一信号值的绝对值总和计算得出，或基于所述第一信号值的平方值的总和取对数计算得出。

10、本技术一些实施例中，所述控制器还被配置为：获取第二预设时间段的所述混合音频数据，以生成第二音帧；提取所述第二音帧的第二信号值；根据所述第二信号值计算采样音量，所述采样音量基于所述第二信号值的绝对值总和计算得出，或基于所述第二信号值的平方值的总和取对数计算得出；基于所述采样音量计算所述参考音量。

11、本技术一些实施例中，所述控制器执行基于所述采样音量计算所述参考音量，还被配置为：计算第三预设时间段所述采样音量的第一平均值，所述第三预设时间段大于所述第二预设时间段；在所述目标时间段对所述第一平均值执行加权平均，以生成第二平均值，所述目标时间段大于所述第三预设时间段；将所述第二平均值与所述第三预设时间段关联，以生成所述参考音量。

12、本技术一些实施例中，所述控制器执行根据所述内部音频数据和所述混合音频数据检测环境噪声音量，被配置为：获取所述混合音频数据的混合音频音量；计算所述基础音量和所述混合音频音量的第二差异值；如果所述第二差异值小于噪声阈值，标记所述环境噪声音量为第一噪声状态；如果所述第二差异值大于或等于所述噪声阈值，标记所述环境噪声音量为第二噪声状态，所述第二噪声状态的环境噪声音量高于所述第一噪声状态的环境噪声音量。

13、本技术一些实施例中，如果所述第一差异值大于0，所述控制器执行按照所述第一差异值和所述环境噪声音量获取调节系数，被配置为：获取第一差异阈值，所述第一差异阈值大于0；如果所述第一差异值大于或等于所述第一差异阈值，且所述环境噪声音量为所述第一噪声状态，则获取第一调节系数；如果所述第一差异值大于或等于所述第一差异阈值，且所述环境噪声音量为所述第二噪声状态，则获取第二调节系数；所述第一调节系数和所述第二调节系数小于1，所述第一调节系数小于所述第二调节系数。

14、本技术一些实施例中，如果所述第一差异值小于0，所述控制器执行按照所述第一差异值和所述环境噪声音量获取调节系数，被配置为：获取第二差异阈值，所述第二差异阈值小于0，所述第二差异阈值和所述第一差异阈值的绝对值相等；如果所述第一差异值小于或等于所述第二差异阈值，且所述环境噪声音量为所述第一噪声状态，则获取第三调节系数；如果所述第一差异值小于或等于所述第二差异阈值，且所述环境噪声音量为所述第二噪声状态，则获取第四调节系数，所述第三调节系数和所述第四调节系数大于1，所述第三调节系数小于所述第四调节系数。

15、本技术一些实施例中，所述控制器执行通过所述调节系数、所述参考音量和所述基础音量计算目标音量，被配置为：计算所述参考音量和所述基础音量的第三平均值；根据所述第三平均值和所述调节系数生成所述目标音量，所述目标音量为所述第三平均值和所述目标调节系数的乘积。

16、本技术一些实施例中，所述控制器还被配置为：检测所述播报音频数据的播放状态；如果所述播放状态为第一播放状态，执行获取所述媒资音频数据设置的基础音量的步骤，所述第一播放状态用于表征当前未播放所述播报音频数据；如果所述播放状态为第二播放状态，在所述播报音频数据的播放状态变更为所述第一播放状态时，执行获取所述媒资音频数据设置的基础音量的步骤，所述第二播放状态用于表征正在播放所述播报音频数据。

17、第二方面，本技术一些实施例还提供一种语音播报的音量调节方法，可应用于第一方面提供的终端设备，所述方法包括以下步骤：

18、获取媒资音频数据设置的基础音量；

19、计算所述基础音量和参考音量的第一差异值，所述参考音量为混合音频数据在预设时间段的平均音量；

20、根据内部音频数据和所述混合音频数据检测环境噪声音量；

21、按照所述第一差异值和所述环境噪声音量获取调节系数；

22、通过所述调节系数、所述参考音量和所述基础音量计算目标音量；

23、将播报音频数据的音量设置为所述目标音量，以使音频输出装置按照所述目标音量播放所述播报音频数据的声音。

24、由以上技术方案可知，本技术一些实施例提供的终端设备及语音播报的音量调节方法，所述方法可以获取媒资音频数据设置的基础音量，并计算基础音量和参考音量的第一差异值。其中，参考音量为混合音频数据在预设时间段的平均音量。再根据内部音频数据和混合音频数据检测环境噪声音量，并按照第一差异值和环境噪声音量获取调节系数。通过调节系数、参考音量和基础音量计算目标音量，并将播报音频数据的音量设置为目标音量，以使音频输出装置按照目标音量播放播报音频数据的声音。所述方法可以结合终端设备的多个参考维度，自动调节终端设备中语音播报的音量，使语音播报的音量更贴合用户需求，进而改善用户的听觉体验。

技术特征：

1.一种终端设备，其特征在于，包括：

2.根据权利要求1所述的终端设备，其特征在于，所述控制器执行获取所述媒资音频数据设置的基础音量，被配置为：

3.根据权利要求1所述的终端设备，其特征在于，所述控制器还被配置为：

4.根据权利要求3所述的终端设备，其特征在于，所述控制器执行基于所述采样音量计算所述参考音量，还被配置为：

5.根据权利要求1所述的终端设备，其特征在于，所述控制器执行根据所述内部音频数据和所述混合音频数据检测环境噪声音量，被配置为：

6.根据权利要求5所述的终端设备，其特征在于，如果所述第一差异值大于0，所述控制器执行按照所述第一差异值和所述环境噪声音量获取调节系数，被配置为：

7.根据权利要求6所述的终端设备，其特征在于，如果所述第一差异值小于0，所述控制器执行按照所述第一差异值和所述环境噪声音量获取调节系数，被配置为：

8.根据权利要求1所述的终端设备，其特征在于，所述控制器执行通过所述调节系数、所述参考音量和所述基础音量计算目标音量，被配置为：

9.根据权利要求1所述的终端设备，其特征在于，所述控制器还被配置为：

10.一种语音播报的音量调节方法，其特征在于，应用于权利要求1-9任一项所述的终端设备，所述方法包括：

技术总结
本申请一些实施例提供一种终端设备及语音播报的音量调节方法，所述方法可以获取媒资音频数据设置的基础音量，并计算基础音量和参考音量的第一差异值。其中，参考音量为混合音频数据在预设时间段的平均音量。再根据内部音频数据和混合音频数据检测环境噪声音量，并按照第一差异值和环境噪声音量获取调节系数。通过调节系数、参考音量和基础音量计算目标音量，并将播报音频数据的音量设置为目标音量，以使音频输出装置按照目标音量播放播报音频数据的声音。所述方法可以结合终端设备的多个参考维度，自动调节终端设备中语音播报的音量，使语音播报的音量更贴合用户需求，进而改善用户的听觉体验。

技术研发人员：李含珍,张大钊,崔保磊,隋淑娟
受保护的技术使用者：海信视像科技股份有限公司
技术研发日：
技术公布日：2024/10/24

转载请注明原文地址:https://symbian.8miu.com/read-35186.html

专利

最新回复(0)