一种基于图谱的搜索分析方法及系统

基本信息

申请号 CN202110553773.2 申请日 -
公开(公告)号 CN113220975A 公开(公告)日 2021-08-06
申请公布号 CN113220975A 申请公布日 2021-08-06
分类号 G06F16/9532(2019.01)I;G06F40/58(2020.01)I;G06F40/295(2020.01)I 分类 计算;推算;计数;
发明人 王绪刚;李珏;李新贵 申请(专利权)人 北京欧拉认知智能科技有限公司
代理机构 北京汇信合知识产权代理有限公司 代理人 林聪源
地址 100086北京市海淀区中关村南大街6号9层913
法律状态 -

摘要

摘要 本发明提供一种基于图谱的搜索分析方法及系统,涉及计算机技术领域,包括搜集数据集,获取到中英对齐的中英双语句子;构建Transformer翻译模型,将获取到的中英双语句子输入Transformer翻译模型进行训练,得到训练好的中英翻译模型;基于中英翻译模型进行实体抽取、翻译,得到对齐的中英双语实体;根据中英双语实体构建关联关系,经映射获得底层关系图谱;根据用户输入的搜索语句进行实体抽取、翻译,并与底层关系图谱进行匹配,得到搜索结果。本发明通过构建中英翻译模型,提供一个供应用层调用的底层关系图谱,在用户输入搜索语句后,基于底层关系图谱实现对搜索语句的双语言精准搜索,有效解决跨语言搜索的问题,提高了翻译搜索结果的准确率。