数据检索方法、装置以及计算机可读存储介质

基本信息

申请号 CN202011302942.7 申请日 -
公开(公告)号 CN112418298A 公开(公告)日 2021-12-03
申请公布号 CN112418298A 申请公布日 2021-12-03
分类号 G06K9/62;G06F16/903 分类 计算;推算;计数;
发明人 程子翰;田国栋 申请(专利权)人 北京云从科技有限公司
代理机构 北京瀚仁知识产权代理事务所(普通合伙) 代理人 屠晓旭;宋宝库
地址 102300 北京市门头沟区石龙经济开发区永安路20号3号楼一层102室
法律状态 -

摘要

摘要 本发明涉及数据检索技术领域,具体提供了一种数据检索方法、装置以及计算机可读存储介质,旨在解决快速且准确地对大批量数据进行数据检索的技术问题。为此目的,根据本发明实施例的方法,利用PQ算法对向量样本进行相似数据检索,相较于暴力搜索的方法,能够显著提高数据的检索效率。同时,在获取到利用PQ算法生成的向量距离查询表之后,可以将向量距离查询表中的浮点型向量距离转换为整型向量距离,以降低向量距离查询表的数据大小,满足处理器的一级缓存的缓存存储要求,使得处理器只需在一级缓存中加载一次向量距离查询表,就可以完成对一个向量样本的相似性检索,克服了现有技术中由于反复加载向量距离查询表导致的检索效率下降的缺陷。