本发明涉及通信,尤其涉及一种诈骗信息识别方法、装置、电子设备及存储介质。
背景技术:
1、诈骗信息是指包含有虚假宣传、带有欺骗性质的信息,有效地识别出诈骗信息是避免用户遭受诈骗、防止财产损失的前提。
2、现有的识别诈骗信息的方式主要有三种:(1)用户接收到信息且受到财产损失后,主动报警才会得知诈骗行为,从而认识到自己接收到的信息是诈骗信息;(2)用户接收到信息之后,分析信息本身是否包含预设的诈骗类信息,从而识别诈骗信息;(3)用户接收到信息之后,对用户设备的行为进行监测,监测用户是否存在疑似受诈行为,例如监测用户访问信息中网址是否达到特定频次、用户是否进行了向其他设备共享屏幕或投屏的操作、用户设备是否被其他设备远程控制等等,从而识别诈骗信息。
3、然而,仅仅分析接收到的信息本身是否包含预设的诈骗类信息来识别诈骗信息,也即识别结果极大依赖于文本分析模型的可靠性,导致识别结果可靠性低。而根据用户接收到信息后是否有财产损失或疑似受诈行为来识别诈骗信息,则不能在用户被骗之前及时识别出诈骗信息,无法防止财产损失。
技术实现思路
1、本发明提供一种诈骗信息识别方法、装置、电子设备及存储介质,用以解决现有技术中诈骗信息识别时存在的诸多缺陷,实现在用户接收到目标短信时,及时识别出诈骗信息,使用户能够得知自己接收到诈骗信息,防止财产损失。
2、第一方面,本发明提供一种诈骗信息识别方法,包括:
3、获取用户终端接收到的目标信息的关键词;
4、利用所述用户终端在数据分析时间长度内的短信数据和网络访问数据,结合所述目标信息的关键词,以确定信息属性值和行为属性值;
5、根据所述信息属性值和行为属性值,获取所述用户处理所述目标信息的风险值,以确定所述目标信息的类别;
6、所述数据分析时间长度是根据所述用户终端的历史使用数据确定的,所述信息属性值用于表征用户对所述目标信息的内容感兴趣程度,所述行为属性值用于表征所述用户终端的历史使用行为与所述目标信息的内容之间的相似程度。
7、根据本发明提供的一种诈骗信息识别方法,所述利用所述用户终端在所述数据分析时间长度内的短信数据和网络访问数据,结合所述目标信息的关键词,以确定信息属性值和行为属性值,包括:
8、根据所述短信数据中每条历史短信与所述目标信息之间的相似度,确定所述信息属性值;
9、根据所述网络访问数据中的各访问网址的访问信息,确定所述行为属性值。
10、根据本发明提供的一种诈骗信息识别方法,所述根据所述短信数据中每条历史短信与所述目标信息之间的相似度,确定所述信息属性值,包括:
11、分别获取每条所述历史短信的历史关键词构建一历史关键词向量,并根据所述目标信息的关键词构建关键词向量;
12、计算每个所述历史关键词向量与所述目标信息的关键词向量之间的相似度;
13、确定所述相似度大于第一预设阈值的部分历史短信的短信数量;
14、获取所有所述部分历史短信从接收到被打开之间的总时长;
15、根据所述短信数量、所述总时长,以及所述短信数据中所述历史短信的总数量,确定所述信息属性值。
16、根据本发明提供的一种诈骗信息识别方法,若确定所述网络访问数据中存在至少一个目标网址,则所述根据所述网络访问数据中的各访问网址的访问信息,确定所述行为属性值,包括:
17、获取每个所述目标网址的访问信息,所述访问信息包括访问次数、相邻两次访问时间差和单次访问时长;所述目标网址是记载在所述目标信息的所述关键词中;
18、从所述访问信息中筛选出访问次数的最大值、单次访问时长的最大值和相邻两次访问的时间差的最小值,以计算所述行为属性值;
19、所述目标网址为所述目标信息的所述关键词中记载的访问网址。
20、根据本发明提供的一种诈骗信息识别方法,若确定所述网络访问数据中不存在所述目标网址,则所述根据所述网络访问数据中的各访问网址的访问信息,确定所述行为属性值,包括:
21、根据所述网络访问数据中每个所述访问网址的网址内容,生成一网址向量;
22、获取每个所述网址向量与所述目标信息的关键词向量之间的相似度,以筛选出所述相似度大于第二预设阈值的至少一个相似网址;
23、获取每个所述相似网址的访问信息,所述访问信息包括访问次数、相邻两次访问时间差和单次访问时长;
24、从所述访问信息中筛选出访问次数的最大值、单次访问时长的最大值和相邻两次访问的时间差的最小值,以计算所述行为属性值。
25、根据本发明提供的一种诈骗信息识别方法,所述数据分析时间长度是采用以下步骤确定的:
26、根据所述用户终端的所述历史使用数据,确定所述用户的最长行为周期、最短行为周期和平均行为周期;
27、基于所述最长行为周期、所述最短行为周期和所述平均行为周期,确定所述用户的参考行为周期;
28、若所述参考行为周期大于行为标准时长,则将所述参考行为周期设置为所述数据分析时间长度;
29、若所述参考行为周期不大于行为标准时长,则将所述行为标准时长设置为所述数据分析时间长度。
30、根据本发明提供的一种诈骗信息识别方法,所述根据所述用户终端的所述历史使用数据,确定所述用户的最长行为周期、最短行为周期和平均行为周期,包括:
31、从所述历史使用数据中,获取所述用户在每天执行特定行为的执行时长;
32、计算所述用户执行所述特定行为的总执行时长和总天数的比值,确定所述用户执行所述特定行为的平均执行时长;
33、获取所述历史使用数据中记载的每个连续执行所述特定行为的时长不低于所述平均执行时长的天数;
34、将所述天数中的最大值设置为所述最长行为周期、最小值设置为所述最短行为周期,并将所有天数的平均值设置为所述平均行为周期。
35、根据本发明提供的一种诈骗信息识别方法,所述特定行为包括所述用户的搜索行为,和/或所述用户的app使用行为。
36、根据本发明提供的一种诈骗信息识别方法,所述根据所述信息属性值和行为属性值,获取所述用户处理所述目标信息的风险值,以确定所述目标信息的类别,包括:
37、根据所述信息属性值和所述行为属性值的乘积,确定所述风险值;
38、在所述风险值大于风险值阈值的情况下,确定所述目标信息的类别为诈骗信息;
39、所述风险值阈值是基于所述目标信息的诈骗种类确定的,所述诈骗种类是基于所述目标信息的所述关键词确定的。
40、第二方面,本发明还提供一种诈骗信息识别装置,包括:
41、信息采集单元,用于获取用户终端接收到的目标信息的关键词;
42、信息处理单元,用于利用所述用户终端在数据分析时间长度内的短信数据和网络访问数据,结合所述目标信息的关键词,以确定信息属性值和行为属性值;
43、信息分类单元,用于根据所述信息属性值和行为属性值,获取所述用户处理所述目标信息的风险值,以确定所述目标信息的类别;
44、其中,所述数据分析时间长度是根据所述用户终端的历史使用数据确定的,所述信息属性值用于表征用户对所述目标信息的内容感兴趣程度,所述行为属性值用于表征所述用户终端的历史使用行为与所述目标信息的内容之间的相似程度。
45、第三方面,本发明提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述诈骗信息识别方法的步骤。
46、第四方面,本发明提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述诈骗信息识别方法的步骤。
47、第五方面,本发明还提供一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上述任一种所述诈骗信息识别方法的步骤。
48、本发明提供的诈骗信息识别方法、装置、电子设备及存储介质,通过数据分析时间长度内的短信数据和网络访问数据,分析出用户对目标信息的内容感兴趣程度以及用户的历史使用行为与目标信息之间的相似程度,进而确定目标信息的风险值,能够在用户接收到目标信息时,就及时分辨出诈骗信息,使用户能够得知自己接收到诈骗信息,防止财产损失。
1.一种诈骗信息识别方法,其特征在于,包括:
2.根据权利要求1所述的诈骗信息识别方法,其特征在于,所述利用所述用户终端在所述数据分析时间长度内的短信数据和网络访问数据,结合所述目标信息的关键词,以确定信息属性值和行为属性值,包括:
3.根据权利要求2所述的诈骗信息识别方法,其特征在于,所述根据所述短信数据中每条历史短信与所述目标信息之间的相似度,确定所述信息属性值,包括:
4.根据权利要求2所述的诈骗信息识别方法,其特征在于,若确定所述网络访问数据中存在至少一个目标网址,则所述根据所述网络访问数据中的各访问网址的访问信息,确定所述行为属性值,包括:
5.根据权利要求4所述的诈骗信息识别方法,其特征在于,若确定所述网络访问数据中不存在所述目标网址,则所述根据所述网络访问数据中的各访问网址的访问信息,确定所述行为属性值,包括:
6.根据权利要求1-5任一项所述的诈骗信息识别方法,其特征在于,所述数据分析时间长度是采用以下步骤确定的:
7.根据权利要求6所述的诈骗信息识别方法,其特征在于,所述根据所述用户终端的所述历史使用数据,确定所述用户的最长行为周期、最短行为周期和平均行为周期,包括:
8.根据权利要求7所述的诈骗信息识别方法,其特征在于,所述特定行为包括所述用户的搜索行为,和/或所述用户的app使用行为。
9.根据权利要求1所述的诈骗信息识别方法,其特征在于,所述根据所述信息属性值和行为属性值,获取所述用户处理所述目标信息的风险值,以确定所述目标信息的类别,包括:
10.一种诈骗信息识别装置,其特征在于,包括:
11.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至9任一项所述诈骗信息识别方法。
12.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至9任一项所述诈骗信息识别方法。
13.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至9任一项所述诈骗信息识别方法。