广告库建立方法、广告数据识别方法及存储介质

基本信息

申请号 CN201810031871.8 申请日 -
公开(公告)号 CN108230037A 公开(公告)日 2018-06-29
申请公布号 CN108230037A 申请公布日 2018-06-29
分类号 G06Q30/02;G06F17/30 分类 计算;推算;计数;
发明人 马恒 申请(专利权)人 北京深极智能科技有限公司
代理机构 北京金咨知识产权代理有限公司 代理人 宋教花
地址 100083 北京市海淀区学清路甲18号西小楼一层
法律状态 -

摘要

摘要 本发明提供了一种广告库建立方法、广告数据识别方法及存储介质,广告库建立方法包括以下步骤:接收语料,按照用户粒度存储第一数量的语料;计算存储的第一数量的语料的信息熵;以及在计算的信息熵的数值低于预定阈值时,将所述语料或所述语料的主干放入广告库中。本发明提供的方法采用熵模型对语料进行分类,能够从每个用户所发消息中抓取广告消息,不用人工对数据标记、筛选便可快速准确的对大量数据进行挖掘,筛选出需要的数据加入广告库。