一种广告识别方法及计算机可读存储介质
基本信息
申请号 | CN201710980185.0 | 申请日 | - |
公开(公告)号 | CN107657286B | 公开(公告)日 | 2020-05-05 |
申请公布号 | CN107657286B | 申请公布日 | 2020-05-05 |
分类号 | G06K9/62;G06F40/211;G06F16/36;G06Q30/02 | 分类 | 计算;推算;计数; |
发明人 | 郭祥昊 | 申请(专利权)人 | 北京深极智能科技有限公司 |
代理机构 | 泰和泰律师事务所 | 代理人 | 祝海燕 |
地址 | 100041 北京市石景山区实兴大街30号院3号楼2层B-0035房间 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种广告识别方法及计算机可读存储介质,该方法包括以下步骤:广告识别步骤以及广告库更新步骤,广告识别步骤包括:读取非系统消息语料,以至少读取用户ID和语料内容;将读取的语料和广告库中的语料进行相似度匹配,基于相似度匹配结果确定所述语料是否为广告;广告库更新步骤包括:将被确定为非广告的非系统消息语料加入到在线语料库;获取在线语料库中存储的多条语料的句子主干;基于获取的句子主干出现的频次以及用户ID确定是否将句子主干放入广告库中,从而在确定放入广告库中的情况下更新广告库。本发明无需人工识别判断谁是广告用户,便能够自动识别广告从而能够加以过滤,节省人力成本,提高广告过滤的效率。 |
