一种基于CNN与GRU及KNN融合的政务文本数据分类方法
基本信息
申请号 | CN202110742255.5 | 申请日 | - |
公开(公告)号 | CN113590818A | 公开(公告)日 | 2021-11-02 |
申请公布号 | CN113590818A | 申请公布日 | 2021-11-02 |
分类号 | G06F16/35(2019.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 王运兵;姬少培;杨辉;颜亮;刘栋;谢建武;陈兵;董贵山 | 申请(专利权)人 | 中电科大数据研究院有限公司 |
代理机构 | 成都九鼎天元知识产权代理有限公司 | 代理人 | 罗强 |
地址 | 610000四川省成都市高新区创业路6号 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种基于CNN与GRU及KNN融合的政务文本数据分类方法,包括:将政务文本数据划分为原始训练样本与待测样本;从原始训练样本中提取标题信息,构建标题信息训练样本;提取训练样本的特征,分别得到各自的特征向量,输入至CNN进行处理得到CNN特征向量以及输入至GRU得到各自的GRU特征向量;将CNN特征向量与GRU特征向量融合,分别得到原始训练样本的融合特征向量与标题信息训练样本的融合特征向量;分别对融合特征向量进行降维,并将降维后的融合特征向量加权合并得到最终的训练样本特征向量;对待测样本进行类似处理得到待测样本特征向量;采用KNN方法完成待测样本分类。本发明提出的方法能够提取出更多有效的特征信息,有效的提高了文本分类的准确率。 |
