一种文本分类方法、装置、电子设备及存储介质
基本信息
申请号 | CN201910593186.9 | 申请日 | - |
公开(公告)号 | CN110399487B | 公开(公告)日 | 2021-09-28 |
申请公布号 | CN110399487B | 申请公布日 | 2021-09-28 |
分类号 | G06F16/35(2019.01)I;G06F16/33(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 徐波 | 申请(专利权)人 | 广东利为网络科技有限公司 |
代理机构 | 广州三环专利商标代理有限公司 | 代理人 | 麦小婵;郝传鑫 |
地址 | 510000广东省广州市黄埔区伴河路90号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种文本分类方法、装置、电子设备及存储介质,其中方法包括:获取待分类文本中的结构化数据和非结构化数据;对于非结构化数据,根据LSTM神经网络模型,计算获得非结构化数据的非结构化特征向量;对于结构化数据,读取结构化数据中所有的属性值,并根据属性表,确定每一属性值对应的属性标识;对于结构化数据中的每一个属性值,根据属性向量矩阵,查找获得与属性标识对应的属性向量;并,根据每一属性向量获得结构化特征向量;根据非结构化特征向量和结构化特征向量,生成待分类特征向量;将所述待分类特征向量输入预先建立的逻辑回归分类器,计算获得所述待分类文本的分类结果。本发明能够对文本进行分类,提高编码效率,且节省内存。 |
