基于图神经网络的文档处理方法、装置和存储介质

基本信息

申请号 CN202010916293.3 申请日 -
公开(公告)号 CN112214993A 公开(公告)日 2021-01-12
申请公布号 CN112214993A 申请公布日 2021-01-12
分类号 G06F40/242;G06F40/30;G06N3/04;G06N3/08 分类 计算;推算;计数;
发明人 王洪俊;肖诗斌;施水才 申请(专利权)人 拓尔思信息技术股份有限公司
代理机构 北京康达联禾知识产权代理事务所(普通合伙) 代理人 拓尔思信息技术股份有限公司
地址 100088 北京市海淀区知春路6号(锦秋国际大厦)14层14B04
法律状态 -

摘要

摘要 本发明属于文档处理和检索技术领域,为了解决现有基于传统的关键词检索技术,无法挖掘词语、句子、文档之间的语义关系,检索效果差的技术问题;本发明一种基于图神经网络的文档处理方法、装置、电子装置和非易失性计算机存储介质,所述方法采用基于有监督学习的图神经网络技术将语义词图生成深度语义向量,应用二值化编码器技术,将语义向量转化为二进制编码形式,进而生成字符特征向量,并构建倒排索引;使得处理后的文档,在检索过程中,能够基于字符特征索引和检索技术进行高性能检索与语义匹配,有效地提升语义检索结果相关性。