融合知识图谱的深度学习文本分类方法
基本信息

| 申请号 | CN202011097951.7 | 申请日 | - |
| 公开(公告)号 | CN112597298A | 公开(公告)日 | 2021-04-02 |
| 申请公布号 | CN112597298A | 申请公布日 | 2021-04-02 |
| 分类号 | G06F16/36(2019.01)I;G06F40/295(2020.01)I;G06N3/08(2006.01)I;G06F16/35(2019.01)I;G06N3/04(2006.01)I | 分类 | 计算;推算;计数; |
| 发明人 | 刘星辰;麻沁甜;陈晓峰 | 申请(专利权)人 | 上海勃池信息技术有限公司 |
| 代理机构 | 上海骁象知识产权代理有限公司 | 代理人 | 赵俊寅 |
| 地址 | 201815上海市嘉定区汇源路55号8幢5层517室 | ||
| 法律状态 | - | ||
摘要

| 摘要 | 融合知识图谱的深度学习文本分类方法,包括以下步骤:提取待分类文本中的实体;利用已构建的知识图谱,获取实体相关隐含信息;将实体名称和隐含信息转换为格式化的文本,添加到原始文本的尾部,形成补充后的文本;对补充后的文本进行分词处理,并预处理得到文本的分词序列;查询预设或随机初始化的词嵌入模型获取分词序列的词嵌入矩阵,矩阵的每一行为各分词的嵌入向量;将分词序列的词嵌入矩阵输入深度学习文本分类算法,进行训练或者预测。本发明克服现有技术的不足,将知识图谱引入到深度学习的文本分类中,通过从知识图谱中查询隐含信息并转换为格式化文本,对原始文本进行信息补充,从而提升深度学习文本分类的准确性。 |





