文本分类方法及终端设备
基本信息
申请号 | CN201610639588.4 | 申请日 | - |
公开(公告)号 | CN106326346A | 公开(公告)日 | 2017-01-11 |
申请公布号 | CN106326346A | 申请公布日 | 2017-01-11 |
分类号 | G06F17/30(2006.01)I;G06N3/08(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 周诚;赵世亭 | 申请(专利权)人 | 上海高欣计算机系统有限公司 |
代理机构 | 上海晨皓知识产权代理事务所(普通合伙) | 代理人 | 成丽杰 |
地址 | 201203 上海市浦东新区自由贸易试验区芳春路400号1幢301-103室 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及信息处理领域,公开了一种文本分类方法及终端设备。本发明实施方式中,计算N种文本类型的训练样本分词后包含各个词向量的词向量矩阵,再基于该词向量矩阵计算出每种文本类型的训练样本的特征向量,并根据计算出的训练样本的特征向量计算后向传播神经网络的输入量,再根据该后向传播神经网络确定出文本分类器,最后根据待测试文本的特征向量和文本分类器,确定待测试文本的类型。CBOW对词向量化时,会考虑当前词的前面几个词和后面几个词的联系,再结合经典的后向传播神经网络,可使整个网络训练也具有语义特性,可进一步让整个网络认知、理解文本内容,具有更好的训练效果。 |
