一种WEB应用系统敏感文字的检测方法及系统
基本信息
申请号 | CN201310124839.1 | 申请日 | - |
公开(公告)号 | CN103279476B | 公开(公告)日 | 2016-12-28 |
申请公布号 | CN103279476B | 申请公布日 | 2016-12-28 |
分类号 | G06F17/30(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 陈剑锋;杨永滨 | 申请(专利权)人 | 深圳市易聆科信息技术股份有限公司 |
代理机构 | 深圳市君胜知识产权代理事务所(普通合伙) | 代理人 | 深圳市易聆科信息技术股份有限公司 |
地址 | 518057 广东省深圳市南山区科技园中区高新中一道软件大厦9楼910-912室 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种WEB应用系统敏感文字的检测方法及系统,该方法及系统对需要检测的网站内容进行抓取和使用预设的敏感文字库对网站内容进行敏感文字模糊检测;通过敏感文字语意分析对检测出的敏感文字进行分析,并将其进行自动分词,生成敏感文字分词列表;将该列表中的敏感文字分词与敏感文字库中的敏感文字进行比对并再次进行敏感文字模糊检测,形成最终敏感词文字分词列表,得出检测结果。本发明提供的方法和系统可以自动提取网页内容,并运用敏感文字语意分析和模糊检测等技术,从而可以更好的进行敏感文字的检测及其信息的提取,为网站安全信息的维护提供方便。 |
