基于邮件指纹对相同邮件进行判定的方法
基本信息
申请号 | CN201610684970.7 | 申请日 | - |
公开(公告)号 | CN106330670A | 公开(公告)日 | 2017-01-11 |
申请公布号 | CN106330670A | 申请公布日 | 2017-01-11 |
分类号 | H04L12/58(2006.01)I;G06F17/27(2006.01)I;G06F17/22(2006.01)I | 分类 | 电通信技术; |
发明人 | 徐慧灵;纪春来 | 申请(专利权)人 | 厦门容能科技有限公司 |
代理机构 | 北京商专永信知识产权代理事务所(普通合伙) | 代理人 | 无锡云商通科技有限公司;华云数据(厦门)网络有限公司 |
地址 | 214000 江苏省无锡市惠山经济开发区智慧路5号北-705室(开发区) | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种基于邮件指纹对相同邮件进行判定的方法,通过对垃圾邮件样本及待判定邮件的邮件指纹构造出基础指纹分词及变形指纹分词,将垃圾邮件样本集合X与待判定邮件样本集合Y中出现的相同元素进行匹配并计数,以得到重复度C;计算集合X与集合Y中所具有的相同元素的相似比例V,若相似比例V大于或者等于阈值K,则判定为相同邮件;若相似比例V小于设置阈值,则表示不同邮件;其中,相似比例V的计算公式为:V=2*C/(N+M)*100%。在本发明中,实现了对待判定邮件的批量化对比处理,实现了对相同邮件实现高效判断,对为后期对接收的新邮件是否判定为垃圾邮件提供了科学参考,提高了对同一模板发送的垃圾邮件的识别效率。 |
