一种基于知识库应用的语义搜索方法

基本信息

申请号 CN202210207064.3 申请日 -
公开(公告)号 CN114547253A 公开(公告)日 2022-05-27
申请公布号 CN114547253A 申请公布日 2022-05-27
分类号 G06F16/33(2019.01)I;G06F16/332(2019.01)I;G06F16/36(2019.01)I;G06F16/31(2019.01)I 分类 计算;推算;计数;
发明人 姜晓丹;张晶;王双;张成凯;傅天隆;吕子祺;韩兴源 申请(专利权)人 北京伽睿智能科技集团有限公司
代理机构 北京知呱呱知识产权代理有限公司 代理人 -
地址 100192北京市海淀区西小口路66号中关村东升科技园北领地C-1楼1层106(东升地区)
法律状态 -

摘要

摘要 本发明公开了一种基于知识库应用的语义搜索方法,所述方法为:S1、录入文档,通过分词器将文档拆分为词语,统计词语出现的次数,记录词语和文档映射关系,将所有词语和映射关系放入内存当做索引;S2、将索引分成多个分片,并对每个分片进行备份,每个分片和备份分布在多台服务器上,以分布式的方式提供查询服务;S3、输入关键词进行智能搜索,基于关键词进行索引匹配和语义相似性扩展搜索,基于关键词图谱的语义扩展搜索具体实现逻辑;S4、根据确定的基于用户行为的语义相似度及语义扩展结果,预测用户对知识库资源的评分,将评分高资源信息作为推荐列表返回给用户。本发明解决了现有资源搜索速度慢、准确率低的问题。