一种广告识别方法及计算机可读存储介质

基本信息

申请号 CN201710980185.0 申请日 -
公开(公告)号 CN107657286A 公开(公告)日 2018-02-02
申请公布号 CN107657286A 申请公布日 2018-02-02
分类号 G06K9/62;G06F17/27;G06F17/30;G06Q30/02 分类 计算;推算;计数;
发明人 郭祥昊 申请(专利权)人 北京深极智能科技有限公司
代理机构 北京金咨知识产权代理有限公司 代理人 宋教花
地址 100041 北京市石景山区实兴大街30号院3号楼2层B-0035房间
法律状态 -

摘要

摘要 本发明提供了一种广告识别方法及计算机可读存储介质,该方法包括以下步骤:广告识别步骤以及广告库更新步骤,广告识别步骤包括:读取非系统消息语料,以至少读取用户ID和语料内容;将读取的语料和广告库中的语料进行相似度匹配,基于相似度匹配结果确定所述语料是否为广告;广告库更新步骤包括:将被确定为非广告的非系统消息语料加入到在线语料库;获取在线语料库中存储的多条语料的句子主干;基于获取的句子主干出现的频次以及用户ID确定是否将句子主干放入广告库中,从而在确定放入广告库中的情况下更新广告库。本发明无需人工识别判断谁是广告用户,便能够自动识别广告从而能够加以过滤,节省人力成本,提高广告过滤的效率。