一种语义关联词判断垃圾邮件的方法

基本信息

申请号 CN201910312461.5 申请日 -
公开(公告)号 CN110048936A 公开(公告)日 2019-07-23
申请公布号 CN110048936A 申请公布日 2019-07-23
分类号 H04L12/58;H04L29/06;G06K9/62 分类 电通信技术;
发明人 汪齐顺 申请(专利权)人 合肥天毅网络传媒有限公司
代理机构 上海精晟知识产权代理有限公司 代理人 冯子玲
地址 315100 浙江省宁波市鄞州区潘火街道诚信路959号
法律状态 -

摘要

摘要 本发明公开了一种语义关联词判断垃圾邮件的方法,涉及网络安全领域。本发明包括:获取大量正常邮件和垃圾邮件进行自动语义关联词标注;将大量标注完成的邮件存储至邮件本体库;使用SVM算法对所有标注样本进行分类,并生成垃圾邮件的强分类器;当系统监测到邮箱内出现未读邮件时,启动垃圾邮件检索服务;服务获取未读邮件内容,对邮件中的图像进行基元提取、邮件中的文本进行语义关联词提取并导入垃圾邮件强分类器进行判断。本发明通过系统实时监测用户邮箱中未读邮件,利用正负样本图片对未读邮件中的图片进行判断,再利用语义关联词生成的垃圾邮件强分类器进行判断,避免了垃圾邮件泛滥,提高了用户的网络体验。