人机互动语音合成系统及命令自定义方法与流程

    技术2024-12-18  50


    本发明涉及人机互动,尤其涉及一种人机互动语音合成系统及命令自定义方法。


    背景技术:

    1、语音是人们信息获取和沟通最便捷、最有效的手段,人机语音交互是指人与设备之间通过自然语音进行信息传递的过程。人机语音交互技术中,用户发出的语音首先被语音识别技术转换为文本,而设备最终生成的信息需要通过语音合成并进行语音播报,从而传递给用户。

    2、目前,授权公告号为cn116110370a的专利文件公开了一种基于人机语音交互的语音合成系统、终端及计算机可读存储介质,为了解决传统技术中基于人机语音交互的语音合成效果较差的问题,通过语音合成系统包含的语音识别模块来获取第一用户输入的语音,并对语音进行语音识别,得到识别文本及相对应的发音序列,并通过发音提取模块在识别文本包含预设类型目标文本的情况下,根据发音序列,获取预设类型目标文本所对应的发音,通过文本生成模块来获取第二用户所对应的目标识别文本,并根据目标识别文本,生成相对应的响应文本,再基于语音合成模块在响应文本包含预设类型目标文本的情况下,采用发音合成响应文本所对应的响应语音,能够提高人机语音交互的效果。

    3、在实际使用中发明采发音合成响应文本所对应的响应语音,能够提高人机语音交互的效果,但是当语音输入命令时,而互动机体不便于对命令进行识别、分析并执行,因此我们提出了人机互动语音合成系统及命令自定义方法用于解决上述问题。


    技术实现思路

    1、本发明的目的是为了解决现有技术中存在的缺点,而提出的人机互动语音合成系统及命令自定义方法。

    2、为了实现上述目的,本发明采用了如下技术方案:

    3、人机互动语音合成系统,包括中央处理器模块、存储库模块、监控模块和供电模块,所述存储库模块与中央处理器模块相连接,所述监控模块与中央处理器模块相连接,所述供电模块与中央处理器模块相连接;

    4、还包括语音互动模块、命令建立模块、执行模块和错误分析模块,所述语音互动模块与中央处理器模块相连接,所述命令建立模块与中央处理器模块相连接,所述执行模块与与中央处理器模块相连接相连接;

    5、所述语音互动模块与错误分析模块相连接,所述命令建立模块与错误分析模块相连接,所述执行模块与错误分析模块相连接。

    6、优选的,所述语音互动模块还与执行模块相连接,所述命令建立模块还与执行模块相连接。

    7、优选的,所述语音互动模块包括语音识别模块、预处理模块、发音库模块、语音提取模块、文本生成模块和语音合成模块,所述预处理模块与语音识别模块相连接,所述发音库模块与预处理模块相连接,所述语音提取模块与发音库模块相连接,所述文本生成模块与语音提取模块相连接,所述语音合成模块与文本生成模块相连接。

    8、优选的,所述命令建立模块包括命令输入模块、命令筛分模块、命令分类模块、命令整合模块、命令库模块,所述命令筛分模块与命令输入模块相连接,所述命令分类模块与命令筛分模块相连接,命令整合模块与命令分类模块相连接,所述命令库模块与命令整合模块相连接。

    9、优选的,所述执行模块包括接收模块、命令提取模块、命令对比模块和命令判断模块,所述命令提取模块与接收模块相连接,所述命令对比模块与命令提取模块相连接,所述命令判断模块与命令对比模块相连接。

    10、优选的,所述命令判断模块包括错误警示模块和执行命令模块,所述错误警示模块与命令判断模块相连接,执行命令模块与命令判断模块相连接。

    11、优选的,所述错误分析模块包括语音分析模块、文本分析模块、命令分析模块、执行分析模块和错误输出模块,所述文本分析模块与语音分析模块相连接,所述命令分析模块与文本分析模块相连接,所述执行分析模块与命令分析模块相连接,所述错误输出模块与执行分析模块相连接。

    12、优选的,所述预处理模块能够能够对语音中的杂音进行去除。

    13、优选的,所述发音库包括语音输入,输入后的语音能够对发音记录,并对发音记录进行存储。

    14、人机互动语音合成系统的命令自定义方法,包括以下步骤:

    15、s1:通过中央处理器模块中的命令建立模块对命令进行建立,通过命令输入模块能够对命令进行输入初步生成,通过命令筛分模块能够对输入的命令进行筛分,把错误的、不合理的、不能实现的筛选出来,通过命令分类模块能够对合格的命令进行分类,通过命令整合模块能够对分类的模块进行整合,通过命令库模块能够把整合的模块进行储存;

    16、s2:通过语音识别模块能够接人们输入的语音,通过预处理模块能够对语音中的杂音进行去除,对不清晰的语音进行修正,通过发音库模块与输入的语音进行识别,通过语音提取模块能够对存储的语音进行提取,通过文本生成模块能够把语音生成文本,通过语音合成模块能够对输入的语音进行合成;

    17、s3:通过执行模块中的接收模块接收到合成后的语音,通过命令提取模块能够识别和提取合成后的语音中的命令信息,通过命令对比模块能够对,命令信息与命令库模块中的命令进行对比,通过命令判断模块对命令是否正确进行判断,当命令正确时通过执行命令模块进行执行命令,当命令错误时通过错误警示模块进行错误提醒;

    18、s4:当命令识别错误时,通过语音分析模块对输入的语音进行分析,从而判断输入的发音、语音是否存在错误,通过文本分析模块能够对语音识别的文本是否存在错误,通过命令分析模块能够分析是否具有命令,通过执行模块能够分析判断命令信息是否完成,最后通过错误输出模块能够对错误信息进行输出,便于人们进行调整。

    19、本发明的有益效果:

    20、(1)、通过中央处理器模块中的命令建立模块对命令进行建立,通过命令输入模块能够对命令进行输入初步生成,通过命令筛分模块能够对输入的命令进行筛分,把错误的、不合理的、不能实现的筛选出来,通过命令分类模块能够对合格的命令进行分类,通过命令整合模块能够对分类的模块进行整合,通过命令库模块能够把整合的模块进行储存;

    21、(2)、通过语音识别模块能够接人们输入的语音,通过预处理模块能够对语音中的杂音进行去除,对不清晰的语音进行修正,通过发音库模块与输入的语音进行识别,通过语音提取模块能够对存储的语音进行提取,通过文本生成模块能够把语音生成文本,通过语音合成模块能够对输入的语音进行合成;

    22、(3)、通过执行模块中的接收模块接收到合成后的语音,通过命令提取模块能够识别和提取合成后的语音中的命令信息,通过命令对比模块能够对,命令信息与命令库模块中的命令进行对比,通过命令判断模块对命令是否正确进行判断,当命令正确时通过执行命令模块进行执行命令,当命令错误时通过错误警示模块进行错误提醒;

    23、(4)、当命令识别错误时,通过语音分析模块对输入的语音进行分析,从而判断输入的发音、语音是否存在错误,通过文本分析模块能够对语音识别的文本是否存在错误,通过命令分析模块能够分析是否具有命令,通过执行模块能够分析判断命令信息是否完成,最后通过错误输出模块能够对错误信息进行输出,便于人们进行调整。


    技术特征:

    1.人机互动语音合成系统,其特征在于,包括中央处理器模块、存储库模块、监控模块和供电模块,所述存储库模块与中央处理器模块相连接,所述监控模块与中央处理器模块相连接,所述供电模块与中央处理器模块相连接;

    2.根据权利要求1所述的人机互动语音合成系统,其特征在于,所述语音互动模块还与执行模块相连接,所述命令建立模块还与执行模块相连接。

    3.根据权利要求1所述的人机互动语音合成系统,其特征在于,所述语音互动模块包括语音识别模块、预处理模块、发音库模块、语音提取模块、文本生成模块和语音合成模块;

    4.根据权利要求1所述的人机互动语音合成系统,其特征在于,所述命令建立模块包括命令输入模块、命令筛分模块、命令分类模块、命令整合模块、命令库模块;

    5.根据权利要求1所述的人机互动语音合成系统,其特征在于,所述执行模块包括接收模块、命令提取模块、命令对比模块和命令判断模块;

    6.根据权利要求5所述的人机互动语音合成系统,其特征在于,所述命令判断模块包括错误警示模块和执行命令模块,所述错误警示模块与命令判断模块相连接,执行命令模块与命令判断模块相连接。

    7.根据权利要求1所述的人机互动语音合成系统,其特征在于,所述错误分析模块包括语音分析模块、文本分析模块、命令分析模块、执行分析模块和错误输出模块;

    8.根据权利要求2所述的人机互动语音合成系统,其特征在于,所述预处理模块能够能够对语音中的杂音进行去除。

    9.根据权利要求3所述的人机互动语音合成系统,其特征在于,所述发音库包括语音输入,输入后的语音能够对发音记录,并对发音记录进行存储。

    10.人机互动语音合成系统的命令自定义方法,其特征在于,包括以下步骤:


    技术总结
    本发明属于人机互动领域,尤其是一种人机互动语音合成系统及命令自定义方法,其中的人机互动语音合成系统包括中央处理器模块、存储库模块、监控模块和供电模块,所述存储库模块与中央处理器模块相连接,所述监控模块与中央处理器模块相连接,所述供电模块与中央处理器模块相连接,还包括语音互动模块、命令建立模块、执行模块和错误分析模块,所述语音互动模块与中央处理器模块相连接,所述命令建立模块与中央处理器模块相连接,所述执行模块与与中央处理器模块相连接相连接。本发明设计合理,通过设置有命令建立模块能够对命令进行自主建立,通过语音互动模块和执行模块能够对命令进行输入、识别和执行。

    技术研发人员:任指钢,完少波
    受保护的技术使用者:云伴数字科技(安徽)有限公司
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-23832.html

    最新回复(0)