基于胶囊网络融合模型的新闻文本分类方法、系统及介质
基本信息
申请号 | CN202110266706.2 | 申请日 | - |
公开(公告)号 | CN113128557A | 公开(公告)日 | 2021-07-16 |
申请公布号 | CN113128557A | 申请公布日 | 2021-07-16 |
分类号 | G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06F40/211(2020.01)I;G06F40/284(2020.01)I | 分类 | 计算;推算;计数; |
发明人 | 李校林;王薇;杨劲 | 申请(专利权)人 | 重庆信科设计有限公司 |
代理机构 | 重庆市恒信知识产权代理有限公司 | 代理人 | 陈栋梁 |
地址 | 400065重庆市南岸区南山街道崇文路2号 | ||
法律状态 | - |
摘要
摘要 | 本发明请求保护一种基于胶囊网络融合模型的新闻文本分类方法、系统及介质,属于深度学习领域,该方法包括:文本预处理与词向量生成;选择BiLSTM模型对新闻文本进行特征表示;考虑新闻文本标题与正文的重要程度,引入注意力机制,实现新闻词向量加权;通过BiLSTM获得新闻文本的向量表示之后,再通过CNN获得句子的局部表示,弥补BiLSTM的缺点;结合BiLSTM模型对文本长序列表示和CNN模型提取局部特征的优势,并利用胶囊网络对获得的信息进行聚合,完成文本分类。 |
