声音的比对处理方法和音频处理设备与流程

技术2026-02-07 1

本申请涉及声纹识别，特别是涉及声音的比对处理方法和音频处理设备。

背景技术：

1、随着科技的进步与发展，声纹识别技术目前已广泛应用于证券交易、银行交易、声纹锁、交通执法等领域。在应用声纹识别技术进行身份确认时，通常会采用声音的比对处理方法对待测音频和样本音频进行处理，从而确认二者是否为同一声源对象发出的声音。

2、然而，目前的声音的比对处理方法进行声音比对的精确性并不高。

技术实现思路

1、本申请的实施例提供声音的比对处理方法和音频处理设备，能够提高声音比对的精确性。

2、第一方面，本申请实施例提供一种声音的比对处理方法，该方法包括：对待测音频和样本音频进行预设音频处理，以对应获得待测特征声音片段和样本特征声音片段；对待测特征声音片段和样本特征声音片段进行预设幅值谱序列处理，以对应得到待测对数幅值谱和样本对数幅值谱；将待测对数幅值谱和样本对数幅值谱分别划分为第一数量的待测子带和样本子带，并计算出用于表征第一数量的待测子带和样本子带之间差异的多个子带幅值特征参数；利用多个子带幅值特征参数确定待测音频和样本音频是否来源于同一声源对象。

3、第二方面，本申请实施例提供一种音频处理设备，该音频处理设备包括存储器和处理器。其中，存储器耦接处理器，存储器存储有计算机程序，处理器用于执行计算机程序以实现如上述第一方面所述的方法。

4、本申请的有益效果是：区别于现有技术的情况，通过对待测音频和样本音频进行处理对应获得了待测特征声音片段和样本特征声音片段，并进一步对待测特征声音片段和样本特征声音片段进行处理以对应获得待测对数幅值谱和样本对数幅值谱。将待测对数幅值谱和样本对数幅值谱分别划分为第一数量的待测子带和样本子带，计算出用于表征第一数量的待测子带和样本子带之间差异的多个子带幅值特征参数，利用多个子带幅值特征参数确定待测音频和样本音频是否来源于同一声源对象。通过划分待测子带和样本子带，以待测子带和样本子带为基本单位进行计算，以获得多个子带幅值特征参数并进行比较，更加细化地比对待测音频和样本音频，从而能够更精确地进行对比，提高声音对比的精确性。

技术特征：

1.一种声音的比对处理方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，

3.根据权利要求2所述的方法，其特征在于，

4.根据权利要求3所述的方法，其特征在于，

5.根据权利要求3所述的方法，其特征在于：

6.根据权利要求5所述的方法，其特征在于：

7.根据权利要求3所述的方法，其特征在于，

8.根据权利要求2所述的方法，其特征在于：

9.根据权利要求1所述的方法，其特征在于：

10.一种音频处理设备，其特征在于，包括存储器和处理器；所述存储器耦接所述处理器，所述存储器存储有计算机程序，所述处理器用于执行所述计算机程序以实现如权利要求1-9任一项所述的方法。

技术总结
本申请公开了声音的比对处理方法和音频处理设备。该方法包括：对待测音频和样本音频进行预设音频处理，以对应获得待测特征声音片段和样本特征声音片段；对待测特征声音片段和样本特征声音片段进行预设幅值谱序列处理，以对应得到待测对数幅值谱和样本对数幅值谱；将待测对数幅值谱和样本对数幅值谱分别划分为第一数量的待测子带和样本子带，并计算出用于表征第一数量的待测子带和样本子带之间差异的多个子带幅值特征参数；利用多个子带幅值特征参数确定待测音频和样本音频是否来源于同一声源对象。通过上述方式，本申请能够提高声音比对的精确性。

技术研发人员：何志连
受保护的技术使用者：深圳海翼智新科技有限公司
技术研发日：
技术公布日：2024/10/24

转载请注明原文地址:https://symbian.8miu.com/read-40128.html

专利

最新回复(0)