一种文本分类方法及装置
基本信息
申请号 | CN202011400717.7 | 申请日 | - |
公开(公告)号 | CN112528020A | 公开(公告)日 | 2021-03-19 |
申请公布号 | CN112528020A | 申请公布日 | 2021-03-19 |
分类号 | G06F40/284(2020.01)I;G06N3/08(2006.01)I;G06F16/35(2019.01)I;G06K9/62(2006.01)I;G06F40/289(2020.01)I;G06F40/30(2020.01)I;G06N3/04(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 汪自立;张招亮;马万里;唐文杰 | 申请(专利权)人 | 中国电子进出口有限公司 |
代理机构 | 北京君尚知识产权代理有限公司 | 代理人 | 邱晓锋 |
地址 | 100036北京市海淀区复兴路17号A座6-23层 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种文本分类方法及装置。该方法有以下步骤:首先利用标注文本特征训练神经网络模型;再获取待分类文本的文本特征;最后将待分类文本的文本特征输入预先训练的神经网络模型,得到各类别的概率,并输出推荐的分类类别。其中,神经网络模型包含嵌入网络、编码网络及解码网络,将文本特征输入嵌入网络得到文本的字词语义特征;再将文本的字词语义特征输入编码网络得到将文本的上下文特征;最后将文本的上下文特征输入解码网络得到各类别的概率分布。采用本方法能够提高文本分类性能及提升模型训练效率。 |
