基于胶囊网络融合模型的新闻文本分类方法、系统及介质

基本信息

申请号 CN202110266706.2 申请日 -
公开(公告)号 CN113128557A 公开(公告)日 2021-07-16
申请公布号 CN113128557A 申请公布日 2021-07-16
分类号 G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06F40/211(2020.01)I;G06F40/284(2020.01)I 分类 计算;推算;计数;
发明人 李校林;王薇;杨劲 申请(专利权)人 重庆信科设计有限公司
代理机构 重庆市恒信知识产权代理有限公司 代理人 陈栋梁
地址 400065重庆市南岸区南山街道崇文路2号
法律状态 -

摘要

摘要 本发明请求保护一种基于胶囊网络融合模型的新闻文本分类方法、系统及介质,属于深度学习领域,该方法包括:文本预处理与词向量生成;选择BiLSTM模型对新闻文本进行特征表示;考虑新闻文本标题与正文的重要程度,引入注意力机制,实现新闻词向量加权;通过BiLSTM获得新闻文本的向量表示之后,再通过CNN获得句子的局部表示,弥补BiLSTM的缺点;结合BiLSTM模型对文本长序列表示和CNN模型提取局部特征的优势,并利用胶囊网络对获得的信息进行聚合,完成文本分类。