一种卷积神经网络的新闻用户兴趣挖掘方法

基本信息

申请号 CN201910435240.7 申请日 -
公开(公告)号 CN110209815A 公开(公告)日 2019-09-06
申请公布号 CN110209815A 申请公布日 2019-09-06
分类号 G06F16/35(2019.01)I; G06F17/27(2006.01)I; G06N3/04(2006.01)I 分类 计算;推算;计数;
发明人 刘春阳; 王鹏; 张旭; 张翔宇; 陈志鹏; 李磊; 王利军 申请(专利权)人 北京天润基业科技发展股份有限公司
代理机构 北京慧泉知识产权代理有限公司 代理人 国家计算机网络与信息安全管理中心; 北京天润基业科技发展股份有限公司
地址 100029 北京市朝阳区裕民路甲3号
法律状态 -

摘要

摘要 本发明公开一种卷积神经网络的新闻用户兴趣挖掘方法:步骤一:定义兴趣标签;步骤二:训练数据构造;步骤三、词向量的语料收集与词向量训练;步骤四、构造word到token和token到word的映射,得到映射表;步骤五、在映射表基础上,对原始文本进行转换;步骤六:加载预训练好的词向量文件,构造一个词典词汇数量vocab_size*词向量维度embedding_size大小的矩阵;步骤七:将带有兴趣标签的微博文本数据接入到分类模型训练。本发明实现了一种自动构造新闻用户兴趣标签的方法,通过构建一个结合连续的语义特征CNN卷积神经网络作为兴趣文本分类器,对用户的新闻评论进行兴趣分类,得到用户的兴趣。