以图片为主的欺诈网页的识别方法、系统、装置和介质

基本信息

申请号 CN202011244992.4 申请日 -
公开(公告)号 CN112214737A 公开(公告)日 2021-01-12
申请公布号 CN112214737A 申请公布日 2021-01-12
分类号 G06F21/12(2013.01)I 分类 计算;推算;计数;
发明人 刘广卫;梁彦博;王兆丽;曹佃国;乔志刚;张笃强;张安波 申请(专利权)人 山东比特智能科技股份有限公司
代理机构 济南信达专利事务所有限公司 代理人 山东比特智能科技股份有限公司
地址 276800山东省日照市东港区日照北路1号
法律状态 -

摘要

摘要 本发明公开了以图片为主的欺诈网页的识别方法、系统、装置和介质,属于诈骗网页识别技术领域,要解决的技术问题为如何克服欺诈网页检测在图片为主的网页上的不足,以快速有效的识别欺诈网页。方法,包括如下步骤:基于上述每个欺诈标签树序列以及每个欺诈标签树序列对应的更新时间及恶意值构建特征库;将待测标签树序列与特征库中欺诈标签树序列进行相似度计算,对于相似度高于阈值的待测标签树序列,认定对应的待测网页为可疑欺诈网页;对于可疑欺诈网页,如果所述恶意关键词的恶意度满足预设值,认定为欺诈网页;更新上述新的欺诈标签树序列对应的恶意值,并将所述新的欺诈标签序列以及新的欺诈标签树序列对应的更新时间和恶意值加入特征库。