一种去除邮件干扰信息的方法以及垃圾邮件判定方法
基本信息
申请号 | CN201610584290.8 | 申请日 | - |
公开(公告)号 | CN106227808B | 公开(公告)日 | 2019-04-05 |
申请公布号 | CN106227808B | 申请公布日 | 2019-04-05 |
分类号 | G06F16/84(2019.01)I; G06F17/27(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 徐慧灵; 纪春来 | 申请(专利权)人 | 厦门容能科技有限公司 |
代理机构 | 苏州友佳知识产权代理事务所(普通合伙) | 代理人 | 厦门容能科技有限公司;华云数据(厦门)网络有限公司;安徽爱办公信息技术有限公司 |
地址 | 中国(福建)自由贸易试验区厦门片区(保税区)象屿路97号厦门国际航运中心D栋8层05单元X | ||
法律状态 | - |
摘要
摘要 | 本发明揭示了一种去除邮件干扰信息的方法以及垃圾邮件判定方法,该去除邮件干扰信息的方法包括:获取邮件中包含的html内容;对html内容执行构建文档对向模型,并对文档对向模型执行以下至少一种或者多种干扰识别处理后将html内容转换为文本信息,所述干扰识别处理包括:颜色块干扰识别处理、字体大小干扰识别处理、表格干扰识别处理;将处理后的文本信息进行内容重组。通过本发明,能够实现对垃圾邮件中所包含的干扰信息与文本信息有效分离,能够精确的识别垃圾邮件中人为封装的各种干扰信息,为后续对邮件判定是否为垃圾邮件提供了准确依据,并能有效的提高对垃圾邮件的拦截及过滤效果。 |
