一种用于知识图谱语义搜索的文本理解的方法

基本信息

申请号 CN202110870572.5 申请日 -
公开(公告)号 CN113688233A 公开(公告)日 2021-11-23
申请公布号 CN113688233A 申请公布日 2021-11-23
分类号 G06F16/35;G06F16/36;G06F16/33;G06K9/62;G06N3/04 分类 计算;推算;计数;
发明人 陈运文;王文广;贺梦洁;纪达麒;桂洪冠;金克;冯佳妮;纪传俊 申请(专利权)人 达观数据(苏州)有限公司
代理机构 上海智力专利商标事务所(普通合伙) 代理人 张文玄;周涛
地址 215133 江苏省苏州市相城区相城大道1168号品上商业中心5幢908室
法律状态 -

摘要

摘要 本发明公开了一种用于知识图谱语义搜索的文本理解的方法,针对输入的待理解的文本,所述方法包括如下步骤:通过大规模预训练模型获得文本中每个词元的语义信息,生成语义向量;基于所述语义向量,通过卷积神经网络、实体分类用的第一softmax分类器和关系分类用的第二softmax分类器,识别出实体类型和关系类型;基于所述语义向量,通过CRF进行序列标注,抽取出实体;基于所述语义向量,通过Bi‑LSTM模型和问句分类用的第三softmax分类器,将文本进行分类;基于识别出的实体类型和关系类型、抽取出的实体、文本的分类结果,检索知识图谱获取信息作为反馈。本发明使用统一的方法同时完成了四种任务,使得系统更加简洁。