一种去除邮件干扰信息的方法以及垃圾邮件判定方法

基本信息

申请号 CN201610584290.8 申请日 -
公开(公告)号 CN106227808B 公开(公告)日 2019-04-05
申请公布号 CN106227808B 申请公布日 2019-04-05
分类号 G06F16/84(2019.01)I; G06F17/27(2006.01)I 分类 计算;推算;计数;
发明人 徐慧灵; 纪春来 申请(专利权)人 厦门容能科技有限公司
代理机构 苏州友佳知识产权代理事务所(普通合伙) 代理人 厦门容能科技有限公司;华云数据(厦门)网络有限公司;安徽爱办公信息技术有限公司
地址 中国(福建)自由贸易试验区厦门片区(保税区)象屿路97号厦门国际航运中心D栋8层05单元X
法律状态 -

摘要

摘要 本发明揭示了一种去除邮件干扰信息的方法以及垃圾邮件判定方法,该去除邮件干扰信息的方法包括:获取邮件中包含的html内容;对html内容执行构建文档对向模型,并对文档对向模型执行以下至少一种或者多种干扰识别处理后将html内容转换为文本信息,所述干扰识别处理包括:颜色块干扰识别处理、字体大小干扰识别处理、表格干扰识别处理;将处理后的文本信息进行内容重组。通过本发明,能够实现对垃圾邮件中所包含的干扰信息与文本信息有效分离,能够精确的识别垃圾邮件中人为封装的各种干扰信息,为后续对邮件判定是否为垃圾邮件提供了准确依据,并能有效的提高对垃圾邮件的拦截及过滤效果。