一种基于图神经网络的化工制备领域长文本分类方法
基本信息
申请号 | CN202111567698.1 | 申请日 | - |
公开(公告)号 | CN114218389A | 公开(公告)日 | 2022-03-22 |
申请公布号 | CN114218389A | 申请公布日 | 2022-03-22 |
分类号 | G06F16/35(2019.01)I;G06F16/36(2019.01)I;G06F40/216(2020.01)I;G06F40/242(2020.01)I;G06F40/253(2020.01)I;G06F40/289(2020.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 周焕来;张博阳;陈璐;唐小龙;高源;孙靖哲;贾海涛;王俊 | 申请(专利权)人 | 一拓通信集团股份有限公司 |
代理机构 | - | 代理人 | - |
地址 | 210000江苏省南京市江苏省自贸区南京片区浦滨路320号科创一号大厦B座701室 | ||
法律状态 | - |
摘要
摘要 | 本发明提出了一种基于图神经网络的化工制备领域长文本分类方法,该方法包括:首先,融合词语统计特征和词向量特征,将多维特征作为RNN+CRF模型输入,提取化工制备领域文本新词,构建分词词典;然后,将全部文档、分词(包括训练数据、预测数据)作为节点初始化,构建全局语法、顺序张量图;下来,通过图消息传递机制,进行图上(节点、边、全局信息)、图间信息迭代,更新特征表示;接着,将语法、顺序张量图降维融合得到全局语义图;最后,将全局语义图作为输入,通过图卷积网络训练获取信息表征,接入softmax层分类,输出待预测文档节点的类别信息,得到最终预测结果。 |
