融合知识图谱的深度学习文本分类方法

基本信息

申请号 CN202011097951.7 申请日 -
公开(公告)号 CN112597298A 公开(公告)日 2021-04-02
申请公布号 CN112597298A 申请公布日 2021-04-02
分类号 G06F16/36(2019.01)I;G06F40/295(2020.01)I;G06N3/08(2006.01)I;G06F16/35(2019.01)I;G06N3/04(2006.01)I 分类 计算;推算;计数;
发明人 刘星辰;麻沁甜;陈晓峰 申请(专利权)人 上海勃池信息技术有限公司
代理机构 上海骁象知识产权代理有限公司 代理人 赵俊寅
地址 201815上海市嘉定区汇源路55号8幢5层517室
法律状态 -

摘要

摘要 融合知识图谱的深度学习文本分类方法,包括以下步骤:提取待分类文本中的实体;利用已构建的知识图谱,获取实体相关隐含信息;将实体名称和隐含信息转换为格式化的文本,添加到原始文本的尾部,形成补充后的文本;对补充后的文本进行分词处理,并预处理得到文本的分词序列;查询预设或随机初始化的词嵌入模型获取分词序列的词嵌入矩阵,矩阵的每一行为各分词的嵌入向量;将分词序列的词嵌入矩阵输入深度学习文本分类算法,进行训练或者预测。本发明克服现有技术的不足,将知识图谱引入到深度学习的文本分类中,通过从知识图谱中查询隐含信息并转换为格式化文本,对原始文本进行信息补充,从而提升深度学习文本分类的准确性。