本技术属于语音处理,尤其涉及一种语义仲裁方法、装置、设备及存储介质。
背景技术:
1、目前,很多语音客户端具备可见即可说功能,利用可见即可说功能,用户可以通过语音交互执行语音客户端界面对应控件的指令。
2、相关技术中,语音客户端的语义仲裁策略是可见即可说语义的优先级要高于其它语义,但这样的设计常不能满足项目的实际需求。例如,在音乐播放界面,应用上传了可见即可说热词:播放七里香,当用户语音包括“播放”、“七里香”或“播放七里香”时,nlu(natural language understanding,自然语言理解)模块输出的都是可见即可说语义,系统会执行音乐播放界面中播放七里香对应的控件。而当用户语音包括“播放”时,在产品设计上通常期望输出的是其它语义、执行其它播放动作。可见,目前的语义仲裁策略会因为输出可见即可说语义,误触发相关指令,进而给用户带来不好的体验。
技术实现思路
1、本技术的实施例提供了一种语义仲裁方法、装置、设备及存储介质,进而至少在一定程度上解决了目前的语义仲裁策略会因为输出可见即可说语义,误触发相关指令,进而给用户带来不好的体验的问题。
2、本技术的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本技术的实践而习得。
3、根据本技术实施例的第一方面,提供了一种语义仲裁方法,包括:
4、从离线识别引擎获取用户语音对应的可见即可说语义;
5、从在线识别引擎获取所述用户语音对应的在线普通语义;
6、在所述可见即可说语义与可见即可说热词精确匹配的情况下,输出所述可见即可说语义;
7、在所述可见即可说语义与所述可见即可说热词模糊匹配的情况下,根据预设优先级输出所述在线普通语义或所述可见即可说语义。
8、在本技术的一些实施例中,基于前述方案,所述离线识别引擎包括离线语音识别模块和离线自然语言理解模块,所述在线识别引擎包括在线语音识别模块和在线自然语言理解模块,所述方法还包括:
9、分别向所述离线语音识别模块、所述离线自然语言理解模块和所述在线语音识别模块发送所述可见即可说热词,以使所述离线语音识别模块根据所述用户语音和所述可见即可说热词输出离线语音识别结果、所述离线自然语言理解模块根据所述用户语音和所述可见即可说热词输出所述可见即可说语义或离线普通语义、所述在线语音识别模块根据所述用户语音和所述可见即可说热词输出在线语音识别结果、所述在线自然语言理解模块根据所述用户语音输出所述在线普通语义。
10、在本技术的一些实施例中,基于前述方案,语义仲裁方法还包括:
11、在未获取到所述可见即可说语义的情况下,从所述离线自然语言理解模块获取所述用户语音对应的离线普通语义;
12、在所述离线普通语义是无效语义的情况下,将所述在线语音识别结果输入至所述离线自然语言理解模块,以使所述离线自然语言理解模块根据所述在线语音识别结果生成可见即可说语义或新的离线普通语义。
13、在本技术的一些实施例中,基于前述方案,语义仲裁方法还包括:
14、在所述在线普通语义是有效语义的情况下,输出所述在线普通语义;
15、在所述在线普通语义不是有效语义且所述离线普通语义是有效语义的情况下,输出所述离线普通语义。
16、在本技术的一些实施例中,基于前述方案,语义仲裁方法还包括:
17、根据所述用户语音确定所述离线普通语义的得分;
18、在所述离线普通语义的得分小于预设分值的情况下,确定所述离线普通语义是无效语义。
19、在本技术的一些实施例中,基于前述方案,语义仲裁方法还包括:
20、在所述可见即可说语义对应的词槽与所述可见即可说热词对应的词槽完全相同的情况下,确定所述可见即可说语义与所述可见即可说热词精确匹配;
21、在所述可见即可说语义对应的词槽与所述可见即可说热词对应的词槽不完全相同的情况下,确定所述可见即可说语义与所述可见即可说热词模糊匹配。
22、在本技术的一些实施例中,基于前述方案,所述根据预设优先级输出所述在线普通语义或所述可见即可说语义,包括:
23、在所述预设优先级为普通语义的优先级高于模糊匹配的可见即可说语义的情况下,输出所述在线普通语义;
24、在所述预设优先级为普通语义的优先级低于模糊匹配的可见即可说语义的情况下,输出所述可见即可说语义。
25、根据本技术实施例的第二方面,提供了一种语义仲裁装置,包括:第一语义获取模块,用于从离线识别引擎获取用户语音对应的可见即可说语义;第二语义获取模块,用于从在线识别引擎获取所述用户语音对应的在线普通语义;语义仲裁模块,用于在所述可见即可说语义与可见即可说热词精确匹配的情况下,输出所述可见即可说语义;语义仲裁模块,还用于在所述可见即可说语义与所述可见即可说热词模糊匹配的情况下,根据预设优先级输出所述在线普通语义或所述可见即可说语义。
26、在本技术的一些实施例中,基于前述方案,第一语义获取模块,还用于在未获取到所述可见即可说语义的情况下,从所述离线自然语言理解模块获取所述用户语音对应的离线普通语义;在所述离线普通语义是无效语义的情况下,将所述在线语音识别结果输入至所述离线自然语言理解模块,以使所述离线自然语言理解模块根据所述在线语音识别结果生成可见即可说语义或新的离线普通语义。
27、在本技术的一些实施例中,基于前述方案,语义仲裁模块,还用于在所述在线普通语义是有效语义的情况下,输出所述在线普通语义;在所述在线普通语义不是有效语义且所述离线普通语义是有效语义的情况下,输出所述离线普通语义。
28、在本技术的一些实施例中,基于前述方案,语义仲裁模块,还用于根据所述用户语音确定所述离线普通语义的得分;在所述离线普通语义的得分小于预设分值的情况下,确定所述离线普通语义是无效语义。
29、在本技术的一些实施例中,基于前述方案,语义仲裁模块,还用于在所述可见即可说语义对应的词槽与所述可见即可说热词对应的词槽完全相同的情况下,确定所述可见即可说语义与所述可见即可说热词精确匹配;在所述可见即可说语义对应的词槽与所述可见即可说热词对应的词槽不完全相同的情况下,确定所述可见即可说语义与所述可见即可说热词模糊匹配。
30、在本技术的一些实施例中,基于前述方案,语义仲裁模块,还用于在所述预设优先级为普通语义的优先级高于模糊匹配的可见即可说语义的情况下,输出所述在线普通语义;在所述预设优先级为普通语义的优先级低于模糊匹配的可见即可说语义的情况下,输出所述可见即可说语义。
31、根据本技术实施例的第三方面,提供了一种语义仲裁设备,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机程序指令,所述处理器执行所述计算机程序指令时,实现如上述第一方面任一项所述的方法的步骤。
32、根据本技术实施例的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序指令,所述计算机程序指令被处理器执行时,促使所述处理器实现如上述第一方面任一项所述的方法的步骤。
33、在本技术中,通过从离线识别引擎获取用户语音对应的可见即可说语义;从在线识别引擎获取所述用户语音对应的在线普通语义;在所述可见即可说语义与可见即可说热词精确匹配的情况下,输出所述可见即可说语义;在所述可见即可说语义与所述可见即可说热词模糊匹配的情况下,根据预设优先级输出所述在线普通语义或所述可见即可说语义。通过本技术提供的技术方案能够在可见即可说语义与可见即可说热词模糊匹配时,按照预设优先级选择性地输出在线普通语义或可见即可说语义,避免了可见即可说语义误触发相关指令给用户带来的不好体验。
34、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本技术。
1.一种语义仲裁方法,其特征在于,包括:
2.根据权利要求1所述的语义仲裁方法,其特征在于,所述离线识别引擎包括离线语音识别模块和离线自然语言理解模块,所述在线识别引擎包括在线语音识别模块和在线自然语言理解模块,所述方法还包括:
3.根据权利要求2所述的语义仲裁方法,其特征在于,所述方法还包括:
4.根据权利要求3所述的语义仲裁方法,其特征在于,还包括:
5.根据权利要求3所述的语义仲裁方法,其特征在于,还包括:
6.根据权利要求1至5中任一项所述的语义仲裁方法,其特征在于,还包括:
7.根据权利要求1至5中任一项所述的语义仲裁方法,其特征在于,所述根据预设优先级输出所述在线普通语义或所述可见即可说语义,包括:
8.一种语义仲裁装置,其特征在于,包括:
9.一种语义仲裁设备,包括处理器和存储器,其特征在于,所述存储器存储有能够被所述处理器执行的计算机程序指令,所述处理器执行所述计算机程序指令时,实现如权利要求1至7中任一所述的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序指令,所述计算机程序指令被处理器执行时,促使所述处理器实现如权利要求1至7任一项所述的方法的步骤。