搜索方法、装置、设备及存储介质
基本信息
申请号 | CN202110956827.X | 申请日 | - |
公开(公告)号 | CN113626713A | 公开(公告)日 | 2021-11-09 |
申请公布号 | CN113626713A | 申请公布日 | 2021-11-09 |
分类号 | G06F16/9535(2019.01)I;G06F16/31(2019.01)I;G06F16/35(2019.01)I;G06F40/216(2020.01)I;G06F40/289(2020.01)I;G06F40/30(2020.01)I;G06K9/62(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 王朋恺;李辉;陈永生;杨林凤 | 申请(专利权)人 | 北京齐尔布莱特科技有限公司 |
代理机构 | 北京思睿峰知识产权代理有限公司 | 代理人 | 高攀;赵爱军 |
地址 | 100080北京市海淀区丹棱街3号B座10层1010室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种搜索方法、装置、计算设备及存储介质,该方法包括步骤:获取用户搜索日志列表,和第一正样本数据集和第一负样本数据集;将搜索内容子项和文档标题子项进行分词处理,将第一正样本数据集和第一负样本数据集加入用户特征,获取搜索点击率预估模型;获取用户搜索日志列表的第二正样本数据集,计算Jaccard相似度参数和Cosine相似度参数,获取用户搜索日志列表的第三正样本数据集及第二负样本数据集;加载Google通用语料,获取BERT语义相似度模型;使用Faiss框架构建向量索引库,获取召回的搜索结果。本发明能够更好表示语义的深度模型,通过调优语义相似度模型,大幅提高了召回效果,构建契合的语义向量召回服务,满足搜索的效果和性能要求。 |
