一种基于循环聚焦机制进行文档主题建模的方法

基本信息

申请号 CN201611194573.8 申请日 -
公开(公告)号 CN106815211B 公开(公告)日 2020-08-07
申请公布号 CN106815211B 申请公布日 2020-08-07
分类号 G06F40/211;G06F40/216;G06F40/30 分类 -
发明人 李双印;潘嵘;杨洋 申请(专利权)人 深圳爱拼信息科技有限公司
代理机构 广州越华专利代理事务所(普通合伙) 代理人 深圳爱拼信息科技有限公司
地址 518057 广东省深圳市南山区南山街道科技园中区科苑路15号科兴科学园B栋3单元1801号单元
法律状态 -

摘要

摘要 本发明提供一种基于循环聚焦机制进行文档主题建模的方法,通过提供一种能够同时利用文档中单词信息,以及句子之间的序列信息,对文档进行有效建模;并利用聚焦机制对句子语义连贯性进行权重学习,可充分利用句子间主题的加权依赖性,从而学习到更加有效的文本向量。