一种文本分类方法、装置、设备及存储介质

基本信息

申请号 CN202111396144.X 申请日 -
公开(公告)号 CN114091451A 公开(公告)日 2022-02-25
申请公布号 CN114091451A 申请公布日 2022-02-25
分类号 G06F40/289(2020.01)I;G06F40/30(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分类 计算;推算;计数;
发明人 王伟;黄勇其;于翠翠;张黔 申请(专利权)人 华润数字科技有限公司
代理机构 深圳市世联合知识产权代理有限公司 代理人 杨晖琼
地址 518000广东省深圳市福田区梅林街道梅都社区中康路136号深圳新一代产业园2栋801
法律状态 -

摘要

摘要 本发明实施例属于人工智能领域,尤其涉及一种文本分类方法、装置、设备及存储介质,所述方法包括:获取待分析文本,对文本进行分词形成分词集合,并根据主题模型获取文本的主题词形成主题词集合;获取主题词集合中每个词的词嵌入向量,将词嵌入向量降维映射到平面上,并根据平面上的映射点构造维诺图;计算非主题词与主题词之间的语义距离,将非主题词加入到维诺图中;识别维诺图中每个词的词节点类型,根据词节点类型通过对应的算法计算出词节点之间的语义距离;将词节点之间的语义距离输入预先构建的图卷积神经网络输出图隐含向量,根据图隐含向量进行文本分类。本发明提高了文本分类的准确性。